数据挖掘在电子商务中的应用与实现.docx
《数据挖掘在电子商务中的应用与实现.docx》由会员分享,可在线阅读,更多相关《数据挖掘在电子商务中的应用与实现.docx(7页珍藏版)》请在课桌文档上搜索。
1、数据挖掘在电子商务中的应用与实现数据挖掘技术作为解决“数据爆炸”时代浮现的最有效手段之一,受到了企业界的极大关注。如何最大限度地利用企业各个部门多年来在数据库系统上积累下来的大量数据进行整合及二次开辟,本文针对数据库营销系统,研究了数据挖掘工具、统计分析工具和客户关系管理工具的协同运用,以及对数据挖掘所采用的技术框架、数据资源等进行了深入的分析。近十几年来,无数个数据库被用于商业管理、政府办公、科学研究和工程开辟等,这一势头仍将持续发展下去。于是,一个新的挑战被提了出来:在这被称之为信息爆炸的时代,如何才干不被信息的汪洋大海所淹没,从中及时发现实用的知识,提高信息的有效利用率呢要想使数据真正成
2、为一个公司的资源,惟独充分利用它为公司自身的业务决策和战略发展服务才行,否则大量的数据将可能成为包袱,甚至成为垃圾。因此,面对“人们被数据淹没,却饥饿于知识”的挑战,数据挖掘和知识发现(DMKD)技术应运而生,并得以蓬勃发展,越来越显示出其强大的生命力。同时在日常生活中我们时常会遇到这样的情况:超市的经营者希翼将时常被同时购买的商品放在一起,以增加销售;保险公司想知道购买保险的客户普通具有哪些特征;医学研究人员希翼从已有的成千上万份病历中找出患某种疾病的病人的共同特征,从而为治愈这种疾病提供一些匡助。对于以上问题,现有信息管理系统中的数据分析工具无法给出答案。因为无论是查询、统计还是报表,其处
3、理方式都是对指定的数据进行简单的数字处理,而不能对这些数据所包含的内在信息进行提取。随着信息管理系统的广泛应用和数据量激增,人们希翼能够提供更高层次的数据分析功能,从而更好地对决策或者科研工作提供支持。正是为了满足这种要求,从大量数据中提取出隐藏在其中的实用信息,将机器学习应用于大型数据库的数据挖掘(DataMirIing)技术得到了长足的发展。一、数据挖掘技术和电子商务的概念数据挖掘(DataMining)就是从大量的、不彻底的、有噪声的、含糊的、随机的原始数据中,提取隐含在其中的、人们事先不知道的、但又是潜在实用的信息和知识的过程。或者说是从数据库中发现实用的知识(KDD),并进行数据分析
4、、数据融合(DataFUiOrI)以及决策支持的过程。人们把数据看做是形成知识的源泉,数据挖掘就像从矿石中采矿、沙石中采金一样,从浩瀚的原始数据海洋中,淘出自己所需要的一点点信息。同时原始数据可以是结构化的,如关系型数据库中的数据;也可以是半结构化的,如文本、图形、图象数据;甚至是分布在网络上的异构型数据。发现知识的方法可以是数学的,也可以是非数学的;可以是演绎的,也可以是归纳的。发现了的知识可以被用于信息管理、查询优化、决策支持、过程控制等,还可以用于对数据自身的维护。因此,数据挖掘是一门广义的交叉学科,它汇聚了不同领域的研究者,特别是数据库、人工智能、数理统计、可视化、并行计算等方面的学者
5、和工程技术人员。电子商务是指以Internet网络为载体、利用数字化电子方式开展商务活动。随着网络技术和数据库技术的飞速发展,电子商务正显示越来越强大的生命力。电子商务的发展促使公司内部采集了大量的数据,并且迫切需要将这些数据转换成实用的信息和知识,为公司创造更多潜在的利润。利用数据挖掘技术可以有效地匡助企业分析从网上获取的大量数据,发现隐藏在其后的规律性,提取出有效信息,进而指导企业调整营销策略,为客户提供动态的、个性化的高效率服务。数据挖掘概念就是从这样的商业角度开辟出来的。数据挖掘涉及的学科领域和方法不少,其核心技术历经了数十年的发展,其中包括统计、近邻、聚类、决策树、神经网络和规则等方
6、法。今天,这些成熟的技术在电子商务中已进入了实用阶段,并取得了良好的效果。本文结合数据挖掘技术在电子商务中的应用,从挖掘任务和数据信息两个角度进行分析,指出各种数据挖掘技术合用的场合,以便开辟出切实可用的数据挖掘系统。二、数据库与数据挖掘技术的发展与研究数据库技术在经过了80年代的辉煌之后,已经在各行各业成为一种数据库文化或者时尚,数据库界目前除了关注分布式数据库、面向对象数据库、多媒体数据库、查询优化和并行计算等技术外,已经在开始反思。数据库实质的应用仅仅是查询吗理论根基最深的关系型数据库最本质的技术进步点,就是数据存放和数据使用之间的相互分离。查询是数据库的奴隶,发现才是数据库的主人。由于
7、数据库文化的迅速普及,用数据库作为知识源具有坚实的基础;另一方面,对于一个感兴趣的特定领域一一客观世界,先用数据库技术将其形式化并组织起来,就会大大提高知识获取起点,以后从中发掘或者发现的所有知识都是针对该数据库而言的。因此,在需求的驱动下,不少数据库学者转向对数据仓库和数据挖掘的研究,从对演绎数据库的研究转向对归纳数据库的研究。在研制一个专家系统时,知识工程师首先要从领域专家那里获取知识,这一过程实质上是归纳过程,是非常复杂的个人到个人之间的交互过程,有很强的个性和随机性。因此,知识获取成为专家系统研究中公认的瓶颈问题。其次,知识工程师在整理表达从领域专家那里获得的知识时,用if-then等
8、类的规则表达,约束性太大,用常规数理逻辑来表达社会现象和人的思维活动局限性太大,也太艰难,勉强抽象出来的规则有很强的工艺色采,差异性极大,知识表示又成为一大难题。此外,即使某个领域的知识通过一定手段获取并表达了,但这样做成的专家系统对常识和百科知识出奇地贫乏,而人类专家的知识是以拥有大量常识为基础的。人工智能学家Feigenbaum估计,普通人拥有的常识存入计算机大约有100万条事实和抽象经验法则,离开常识的专家系统有时会比傻子还傻。例如战场指挥员会根据“在某地发现一只刚死的波斯猫”的情报很快断定敌高级指挥所的位置,而再好的军事专家系统也难以顾全到如此的信息。以上这3大难题大大限制了专家系统的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 挖掘 电子商务 中的 应用 实现
![提示](https://www.desk33.com/images/bang_tan.gif)
链接地址:https://www.desk33.com/p-428045.html