数据挖掘中如何比较两组高维数据之间的相似度两组数据,分别都有十几个属性;两个数据组有属性重叠,如何用数据挖掘方法计算两组数据的相似度

来源:学生作业帮助网 编辑:作业帮 时间:2024/11/20 04:39:37
数据挖掘中如何比较两组高维数据之间的相似度两组数据,分别都有十几个属性;两个数据组有属性重叠,如何用数据挖掘方法计算两组数据的相似度
xݓn@_*/@auYR-j^Ϥ`lU`;`(`i1]ҹ3WOT9YuSugΜs/RvThˤm+pإ~'~`diNȾX;֫~@BWhĭ:4IHPG$XfH9?AMz#ITfy{ޘyVT!}oH=^rB s=L-VI,/l6`AY"Fmy2h]p6o+= >9LϾHMy>0ٜ~+ |$lC}V&v(;pUYGypn^^. NTNhT:REOރ\L;P!Q\93ϒaߣp;9zsY]XGlCxej=VyO oU@^HMUIú1K}OPJ;0KZ&.} \*O<1ڴv4B?h>a>D)~.b&R-98KQD@X"PpҫoXq

数据挖掘中如何比较两组高维数据之间的相似度两组数据,分别都有十几个属性;两个数据组有属性重叠,如何用数据挖掘方法计算两组数据的相似度
数据挖掘中如何比较两组高维数据之间的相似度
两组数据,分别都有十几个属性;两个数据组有属性重叠,如何用数据挖掘方法计算两组数据的相似度

数据挖掘中如何比较两组高维数据之间的相似度两组数据,分别都有十几个属性;两个数据组有属性重叠,如何用数据挖掘方法计算两组数据的相似度
看起来这个问题比较复杂,不是简单地分类、聚类就可以求解.
这个问题是否可以理解为比较两组数据的相似度?主要是比较对于决策变量D(“心脏病”)=Y/N的相似度?就是说两组不同的指标分别对于D的差异?
如果你能在两组数据中分别包含D(“心脏病”)的取值Yes、No,直接比较对于Yes的准确率,不就是两组数据的相似度了吗?
如果你是要做论文,可以将问题搞得复杂些,使其更加学术化;如果只是实际应用,不可以过分拘泥于漂亮的数学模型和复杂的求解过程,只要能够解决实际问题就可以了,对吧?