公共管理论文:数据挖掘技术及其在互联网领域的应用[1]
来源:学生作业帮助网 编辑:作业帮 时间:2024/11/27 07:08:59 公共管理论文
公共管理论文:数据挖掘技术及其在互联网领域的应用[1]公共管理论文
【大学生毕业论文网 - 公共管理论文】
1.引言
随着internet的迅速发展和普及,电子商务的发展越来越多地引起研究者们的关注,期待能够在这种新型的商务模式下,充分利用它的优点,获得更多的经济效益。web已经成为企业开展电子商务的基础。将数据挖掘的思想和方法应用到电子商务中,帮助电子商务的经营者从海量的信息中得到真正有价值的知识,以指导他们的决策。web数据挖掘就是在这样的背景下与电子商务结合在一起的。
2.web数据挖掘
2.1web数据挖掘的概念
web数据挖掘是从数据挖掘的基础上发展起来的,数据挖掘的对象不仅是数据库,还可以是任何组织在一起的数据集合,如www信息资源。web数据挖掘是数据挖掘技术的一个重要应用,是在大量训练样本的基础上,从网络资源中进行有目的信息提取。
2.2web数据挖掘在电子商务中的应用
2.2.1电子商务中web数据挖掘的数据源
在web上可以用来作为数据挖掘分析的数据量比较大,而且类型众多,总结起来有以下几种类型的数据可用于web数据挖掘技术产生各种知识模式。
2.2.1.1服务器数据
客户访问站点时会在web服务器上留下相应的日志数据,这些日志数据通常以文本文件的形式存储在服务器上。一般包括severlogs,errorlogs,cookielogs等,这些日志文件一般都有通用的格式,以W3C的格式最为流行。
2.2.1.2查询数据
它是电子商务站点在服务器上产生的一种典型数据。例如,对于在线客户也许会搜索一些产品或某些产品信息,这些查询信息就通过cookie或是登记信息连接到服务器的访问日志上。目前还没有一个标准的查询数据格式。
2.2.1.3在线市场数据
这类数据主要是传统关系数据库里存储的有关电子商务站点信息,用户购买信息,商品信息等数据。
2.2.1.4web页面
主要是指HTML和XML页面的内容,包括文本、图片、语音、图像等。
2.2.1.5web页面超级链接关系
主要是指页面之间存在的超级链接关系,这也是一种重要的资源。
2.2.1.6客户登记信息
客户登记信息是指客户通过web页输入的,要提交给服务器的相关用户信息,这些信息通常是关于用户的人口特征。在web的数据挖掘中,客户登记信息需要和访问日志集成,以提高数据挖掘的准确度,使之能更进一步的了解客户。
2.3web数据挖掘的类型
web信息的多样性决定了挖掘任务的多样性。按照web处理对象的不同,web数据挖掘可以分为以下三种类型:
2.3.1web内容挖掘
web内容挖掘即从网络的内容、数据、文挡中发现有用信息的过程,揭示众多信息之间的关系,挖掘出隐藏在网络数据或文挡中的知识内容。网络信息资源众多,从网络资源的形式来看,包括文本、图像、音频、视频等形式的数据,因此web内容挖掘可简单分为文本挖掘和多媒体挖掘。目前多媒体数据的挖掘研究还处于探索阶段,web文本挖掘已经有了比较实用的功能。
2.3.2web结构挖掘
整个web空间里,有用的知识不仅包含在web页面的内容之中,而且也包含在页面的结构之中。web结构挖掘就是挖掘web潜在的链接结构模式,是对web页面超链接关系、文档内部结构、文档url中的目录途径结构的挖掘,所以web结构挖掘可简单分为超链接挖掘、内部挖掘和url挖掘。
2.3.3web使用模式挖掘
web使用模式挖掘(又称日志挖掘),是对用户访问web服务器时留下的访问记录进行挖掘,从中得到用户的访问和访问兴趣的过程,主要用来了解用户的网络行为数据所具有的意义。
3.电子商务中的数据挖掘技术
在电子商务中目前主要使用以下几种数据挖掘技术:
3.1路径分析
路径分析被应用于判定在一个web站点中被最频繁访问的路径。利用这些被最频繁访问的路径就可以更精细地来改进站点的设计结构。
3.2关联规则挖掘技术
该技术主要用于从用户访问序列数据库的序列项中挖掘出相关的规则,在web数据挖掘中,关联规则挖掘就是要在挖掘出用户在一个访问期间从服务器上访问的的页面/文件之间的联系。
3.3序列模式挖掘技术
序列模式数据挖掘就是要挖掘出交易集之间的有时间序列的模式。经过数据净化和事件交易确认以后是一个间断的时间序列,这些序列所反映的用户行为有助于帮助商家印证其产品所处的生命周期阶段。另外挖掘出来的一些暂时性的序列模式,可以分析企业战略实施或网站/产品促销的效果。
3.4聚类分类技术
分类规则可以挖掘某些相同的特性。这个特性可以用来对新添到数据库里的数据项进行分类;聚类技术可以将具有相同特征的数据项聚成一类。
4.web数据挖掘在电子商务中的应用<公共管理论文
1.引言
随着internet的迅速发展和普及,电子商务的发展越来越多地引起研究者们的关注,期待能够在这种新型的商务模式下,充分利用它的优点,获得更多的经济效益。web已经成为企业开展电子商务的基础。将数据挖掘的思想和方法应用到电子商务中,帮助电子商务的经营者从海量的信息中得到真正有价值的知识,以指导他们的决策。web数据挖掘就是在这样的背景下与电子商务结合在一起的。
2.web数据挖掘
2.1web数据挖掘的概念
web数据挖掘是从数据挖掘的基础上发展起来的,数据挖掘的对象不仅是数据库,还可以是任何组织在一起的数据集合,如www信息资源。web数据挖掘是数据挖掘技术的一个重要应用,是在大量训练样本的基础上,从网络资源中进行有目的信息提取。
2.2web数据挖掘在电子商务中的应用
2.2.1电子商务中web数据挖掘的数据源
在web上可以用来作为数据挖掘分析的数据量比较大,而且类型众多,总结起来有以下几种类型的数据可用于web数据挖掘技术产生各种知识模式。
2.2.1.1服务器数据
客户访问站点时会在web服务器上留下相应的日志数据,这些日志数据通常以文本文件的形式存储在服务器上。一般包括severlogs,errorlogs,cookielogs等,这些日志文件一般都有通用的格式,以W3C的格式最为流行。
2.2.1.2查询数据
它是电子商务站点在服务器上产生的一种典型数据。例如,对于在线客户也许会搜索一些产品或某些产品信息,这些查询信息就通过cookie或是登记信息连接到服务器的访问日志上。目前还没有一个标准的查询数据格式。
2.2.1.3在线市场数据
这类数据主要是传统关系数据库里存储的有关电子商务站点信息,用户购买信息,商品信息等数据。
2.2.1.4web页面
主要是指HTML和XML页面的内容,包括文本、图片、语音、图像等。
2.2.1.5web页面超级链接关系
主要是指页面之间存在的超级链接关系,这也是一种重要的资源。
2.2.1.6客户登记信息
客户登记信息是指客户通过web页输入的,要提交给服务器的相关用户信息,这些信息通常是关于用户的人口特征。在web的数据挖掘中,客户登记信息需要和访问日志集成,以提高数据挖掘的准确度,使之能更进一步的了解客户。
2.3web数据挖掘的类型
web信息的多样性决定了挖掘任务的多样性。按照web处理对象的不同,web数据挖掘可以分为以下三种类型:
2.3.1web内容挖掘
web内容挖掘即从网络的内容、数据、文挡中发现有用信息的过程,揭示众多信息之间的关系,挖掘出隐藏在网络数据或文挡中的知识内容。网络信息资源众多,从网络资源的形式来看,包括文本、图像、音频、视频等形式的数据,因此web内容挖掘可简单分为文本挖掘和多媒体挖掘。目前多媒体数据的挖掘研究还处于探索阶段,web文本挖掘已经有了比较实用的功能。
2.3.2web结构挖掘
整个web空间里,有用的知识不仅包含在web页面的内容之中,而且也包含在页面的结构之中。web结构挖掘就是挖掘web潜在的链接结构模式,是对web页面超链接关系、文档内部结构、文档url中的目录途径结构的挖掘,所以web结构挖掘可简单分为超链接挖掘、内部挖掘和url挖掘。
2.3.3web使用模式挖掘
web使用模式挖掘(又称日志挖掘),是对用户访问web服务器时留下的访问记录进行挖掘,从中得到用户的访问和访问兴趣的过程,主要用来了解用户的网络行为数据所具有的意义。
3.电子商务中的数据挖掘技术
在电子商务中目前主要使用以下几种数据挖掘技术:
3.1路径分析
路径分析被应用于判定在一个web站点中被最频繁访问的路径。利用这些被最频繁访问的路径就可以更精细地来改进站点的设计结构。
3.2关联规则挖掘技术
该技术主要用于从用户访问序列数据库的序列项中挖掘出相关的规则,在web数据挖掘中,关联规则挖掘就是要在挖掘出用户在一个访问期间从服务器上访问的的页面/文件之间的联系。
3.3序列模式挖掘技术
序列模式数据挖掘就是要挖掘出交易集之间的有时间序列的模式。经过数据净化和事件交易确认以后是一个间断的时间序列,这些序列所反映的用户行为有助于帮助商家印证其产品所处的生命周期阶段。另外挖掘出来的一些暂时性的序列模式,可以分析企业战略实施或网站/产品促销的效果。
3.4聚类分类技术
分类规则可以挖掘某些相同的特性。这个特性可以用来对新添到数据库里的数据项进行分类;聚类技术可以将具有相同特征的数据项聚成一类。
4.web数据挖掘在电子商务中的应用<公共管理论文