📄 881.txt
字号:
发信人: GzLi (笑梨), 信区: DataMining
标 题: [合集]请大家指教,多谢
发信站: 南京大学小百合站 (Wed Sep 11 12:43:06 2002), 站内信件
BraveBaby (勇敢宝贝) 于Thu Sep 5 10:38:53 2002提到:
我是管理方面的,做的论文是移动通信运营业中数据挖掘的应用。
我接触数据挖掘不久,只有二个月,但是论文要求10月份就做
出来了。现在我对数据挖掘还只是停留在很表面上的认识。不过,
这与我们的方向也有关,毕竟是管理方面的嘛(自我安慰)。
我现在论文做了一半了,到了算法与模型的阶段了。现在我有些不
懂与不明白的地方了,特意请教一下各位高人:
1.我对算法还是不太明白,大家在版面上讨论的一些算法方面的,我
都看不太懂。请问各位,象我这样的论文,算法与模型应该怎么做
啊?是自己结合行业特点设计与创造一个呢,还是那样算法是通用
的,只要用数据来训练一下,然后改进一下参数就可以,还是其他。
2.这些算法,你们所说的什么原码好象是有得下的吧,但是下来
以后,怎么用呢?要安装什么软件吗?
目前就想到这些了,请大家多多赐教吧。我现在为论文郁闷死了。
多谢了。bow.
GzLi (笑梨) 于Thu Sep 5 12:56:59 2002提到:
硕士是吗?
1)把数据整理好,
2)找个软件,不如sas,比如matlab,或其它你手头有,或你周围人熟悉的
3)处理一下,看看能否用管理学的内容解释一下。能解释通了,
4)ok
你毕业吧。
sinokdd (KDD in China) 于Fri Sep 6 08:25:46 2002)
提到:
1.算法是通用的,只要用数据来训练一下,然后改进一下参数就可以。
2. most source code systems are for linux, you can read
Readme file in the package. It will tell you how to make it.
I think the most difficult is how to identify the learning problem
in your case, that is, what kind of pattern you want to find.
And also
how to convert the original data to the training data, and how to
evaluate the result.
BraveBaby (勇敢宝贝) 于Fri Sep 6 12:58:28 2002提到:
多谢你的提示,能问一下,如果我有了数据后,
哪里能找到这些算法呢来训练从而改进参数呢?
我的设想数据集里至少要包含以下这些数据:
用户的基本情况数据,通话记录数据,交费记录数据。其他再根据
情况增减一些相关数据,如外部数据,投诉数据等等,大家认为
如何?
现在我一个很大的问题就是数据的收集,目前还没有任何数据。郁闷。
希望下次去哪个移动公司调研的时候,能发发善心给我提供相关的
数据。
各位大侠,你们认为多少数据量是必需与足够的呢?
1000个用户的半年的通话记录你们认为够了吗?
sinokdd (KDD in China) 于Fri Sep 6 14:07:55 2002)
提到:
www.kdnuggets.com
我认为你一开始至少应该有部分数据,并且假设你有了足够的数据,你究竟
想从中找出什么来呢?我觉得这是最主要的,否则你也不知道那个
算法合适,并且你也无从知道该搜集哪些数据。
enough
BraveBaby (勇敢宝贝) 于Sat Sep 7 00:19:32 2002提到:
多谢你的帮助。我现在就在想办法搞到数据。没有数据,真是
太郁闷了。
不好意思,没有经过你的允许,我就已经把大侠加为好友了。
以后,我可能还多多次向你请教,请多多指教啊。
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -