新闻正文
,
数据挖掘过程模型
虽然我们把各个步骤按顺序排列,但要注意数据挖掘过程并不是线性的—要取得
好的结果就要不断反复重复这些步骤。比如在“分析数据”时你可能觉得在“建
立数据挖掘数据库”时作的不够好,要往里面添加一些新的数据。
这些基本数据挖掘步骤包括:
1. 定义商业问题
2. 建立数据挖掘模型
3. 分析数据
4. 准备数据
5. 建立模型
6. 评价模型
7. 实施
1. 定义商业问题。在开始知识发现之前最先的同时也是最重要的要求就
是了解的你的数据和业务问题。如果事先没有这种了解,没有任何算法,不管他有
多么复杂玄妙,能够为你提供有价值的结果,即使有也难以使人信赖他。缺少了这
些背景知识,你就没办法明确定义要解决的问题,不能为挖掘准备数据,也很难正
确的解释得到的结果。要想充分发挥数据挖掘的价值,必须要对你的目标有一个清
晰明确的定义,即决定到底想干什么。比如你说你想提高直接邮件推销的用户回应
时,你想做的可能是“提高用户响应率”,也可能是“提高一次用户回应的价值”,
要解决这两个问题而建立的模型几乎是完全不同的,你必须做出决定。有效的问题
定义还应该包含一个对你的知识发现项目得到结果进行衡量的标准。当然还应该有
整个项目预算和理性的解释。
相比于我们要达到的目标,与我们同行的人更加重要。
.
※ 修改:·wizard 於 06月20日13:57:49 修改本文
※ 转载:· bbs.sjtu.edu.cn
收藏到ViVi 收藏此页到365Key
上一篇:
数据挖掘入门(九) 下一篇:
数据挖掘入门(十一)