⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 readme.txt

📁 是关于关联规则方面的东西,大家看看吧.应该有用.
💻 TXT
字号:
apache web服务器日志数据清洗及用户识别软件使用说明

1,数据文件必须和程序文件放在同一个目录.
2,首先载入数据.
3,数据清洗,将在同一目录下生成cleanresult.txt文件.即清洗后的结果.
4,排序,为了提供用户识别的算法效率,请在用户识别前进行排序.同时生成排序后的文件sortresult.txt文件
5,用户识别,根据排序后的数据,采用启发式算法,识别用户,生成用户列表文件users.txt和及用户访问列表文件useridentifyresult.txt
6,运行环境为windowsxp sp2


此程序已用专业网站大约900m的日志数据测试过,
现在还在测试中,还没有完善,会有很多bug,请大家多交流.
现在在做用户群体聚类的算法,做完会及时发布新版本的.


请大家多提意见,我的email是:
email: mwlwlm@163.com

⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -