📄 readme.txt
字号:
apache web服务器日志数据清洗及用户识别软件使用说明
1,数据文件必须和程序文件放在同一个目录.
2,首先载入数据.
3,数据清洗,将在同一目录下生成cleanresult.txt文件.即清洗后的结果.
4,排序,为了提供用户识别的算法效率,请在用户识别前进行排序.同时生成排序后的文件sortresult.txt文件
5,用户识别,根据排序后的数据,采用启发式算法,识别用户,生成用户列表文件users.txt和及用户访问列表文件useridentifyresult.txt
6,运行环境为windowsxp sp2
此程序已用专业网站大约900m的日志数据测试过,
现在还在测试中,还没有完善,会有很多bug,请大家多交流.
现在在做用户群体聚类的算法,做完会及时发布新版本的.
请大家多提意见,我的email是:
email: mwlwlm@163.com
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -