📄 11.txt
字号:
发信人: yaomc (白头翁&山东大汉), 信区: DataMining
标 题: 数据挖掘--网站信息分析的好帮手。
发信站: 南京大学小百合站 (Thu Jan 24 10:54:59 2002), 站内信件
数据挖掘--网站信息分析的好帮手
人们在访问网站的同时,便提供了个人对网站内容的反馈信息:点击了哪一个
链接,在哪里浏览时间最多,用了哪个搜索项、总体浏览时间、个人姓名和住址等
。所有这些信息都被保存在一个数据库中。
从数据库保存的信息来看,网站拥有了大量的网站访问者及其访问内容的信息
,但拥有这些信息却不见得能够充分利用。借助数据仓库报告系统(一般称作在线
分析处理系统),只能报告可直接观察到的和简单相关的信息,不能告诉网站信息
模式及怎样对其进行处理,并且它很难深刻分析复杂信息,需要网站自已加工与处
理。
然而,厂商和商业分析员可以采用数据挖掘技术来解决上述问题。
认识访问者
为了让网站能够使用数据挖掘技术,厂商必须记录访问者特征及访问者所使用
的条款特征。
访问者特征包括人口统计特征、心理特征和技术特征。人口统计特征是一些可
变的属性,比如家庭地址、收入、购买力或所拥有的娱乐设备。心理特征包括通过
心理调查发现的个性类型。技术特征是指访问者的系统属性,比如所采用的操作系
统、浏览器、域名和调制解调器的速度等等。
条款特征包括网络内容信息(介质类型、内容分类和URL)和产品信息(产品编号
、产品目录、颜色、体积、价格、利润、数量和特价等级)等内容。
当访问者访问某网站时,有关访问者的数据便会被逐渐积累起来。访问者--条
款的交互信息主要包括购买历史、广告历史和优选信息,其中,购买历史是一个购
买产品和购买日期的目录;广告历史表明把哪一个条款展示给访问者;优选信息是
指访问者访问的优先等级;点击流信息是访问者点击的超级链接的历史信息;链接
机会是指提供给访问者的超级链接。访问者--网站统计信息是指每次会话的信息,
比如总的访问时间、所浏览的网页及每次会话的利润等。访问者--公司信息包括一
个访问者推荐客户的数量、每个月的访问次数及上一次的访问时间等,还包括商标
评价,即访问者对商标正面或负面的评价,此信息可以通过周期性的厂商调查来获
得。
列出目标
在网上进行交易的最大优点是厂商可以更加有效地估计出访问者的反应。当厂
商有明确的且可以量化的目标时,采用数据挖掘技术的效果最好。厂商可以考虑这
样一些目标:增加每次会话的平均浏览页数;增加每次结账的平均利润;减少退货
;增加顾客数量;提高商标知名度;提高回头率(比如在30天内重新回来的顾客的
数量);增加每次访问的结账次数。
解决问题
解决问题的第一步是清楚地描述问题。通常,网络厂商需要解决的问题是如何
寻找合适的广告人群、将网页个性化、把同时购买的货物放在同一个网页上、自动
地把商品分类,找出同一类访问者的特征、估计货物丢失的数据并预测未来行为。
所有这一切都涉及寻找并支持各种不同的隐含模式。
--
Welcome to http://datamining.bbs.lilybbs.net.
※ 来源:.南京大学小百合站 bbs.nju.edu.cn.[FROM: 202.204.36.15]
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -