什么是高维数据?

来源:学生作业帮助网 编辑:作业帮 时间:2024/07/12 20:25:43
什么是高维数据?
x}UYrFJ.RR3;oJ\A}edDQHŞ| yÁ 8fz^wyx|B6oO-Ղ;eOD'{󜸳5ks;9_b wySq#7~"ꭜNTDk<3}4TJmn_ь67̂JidcPːWg;K_m^"UsMfݕV#oWt]*;YT^ij -GܵUn)|GX ղwd ѻ E8Tf!z&B999U?QoD]@YXd^=T/ +S}7Wmvm&/[Z 'r}֥AHZIZ .gyBcO9MQApE|@9+,՟ +a@k((4Bʹ߼ME}G9/]z7t5ء&'JeVH)i9@OQ96;p* {E{˼3r7D#{]\e$] B*n|l^EUބWLq ƌ۔t/fW,10$:LWSXoA݅oQ[iYЅ߹{2ϹQqQz6fpR;RYg+/0`F"9dyv eMU~ywFvkR)ց|I6?TcQx[5ZpR30F|JȎV&|~;lWFkN0M`j˼[|mdUQomgnj}3ݔf>Y XJC%srJ*b _Td]4}c"E2D,Ls_Kfš.+: Y1OQ^͢.QtqӍoZJwyRZ**gTkokL5>P.T2+ո/ rxcAnG Q>#c/;

什么是高维数据?
什么是高维数据?

什么是高维数据?
高维数据的概念其实不难,简单的说就是多维数据的意思.平时我们经常接触的是一维数据或者可以写成表形式的二维数据,高维数据也可以类推,不过维数较高的时候,直观表示很难.
目前高维数据挖掘是研究重点,这是它的特点:
高维数据挖掘是基于高维度的一种数据挖掘,它和传统的数据挖掘最主要的区别在于它的高维度.目前高维数据挖掘已成为数据挖掘的重点和难点.随着技术的进步使得数据收集变得越来越容易,导致数据库规模越来越大、复杂性越来越高,如各种类型的贸易交易数据、Web 文档、基因表达数据、文档词频数据、用户评分数据、WEB使用数据及多媒体数据等,它们的维度(属性)通常可以达到成百上千维,甚至更高.
由于高维数据存在的普遍性,使得对高维数据挖掘的研究有着非常重要的意义.但由于“维灾”的影响,也使得高维数据挖掘变得异常地困难,必须采用一些特殊的手段进行处理.随着数据维数的升高,高维索引结构的性能迅速下降,在低维空间中,我们经常采用欧式距离作为数据之间的相似性度量,但在高维空间中很多情况下这种相似性的概念不复存在,这就给高维数据挖掘带来了很严峻的考验,一方面引起基于索引结构的数据挖掘算法的性能下降,另一方面很多基于全空间距离函数的挖掘方法也会失效.解决的方法可以有以下几种:可以通过降维将数据从高维降到低维,然后用低维数据的处理办法进行处理;对算法效率下降问题可以通过设计更为有效的索引结构、采用增量算法及并行算法等来提高算法的性能;对失效的问题通过重新定义使其获得新生.