• 010-82115891
  • bjhyw@263.net
  • 021-31200158
  • shkehu@263.net

保险专业英语翻译

数据挖掘文件资料翻译

 数据挖掘很重要的一个研究问题是分类问题,基于分类规则的挖掘方法有很多,其中决策树模型是数据挖掘中最常用的一种方法。决策树从一组无次序、无规则的事例中推理出决策树表示形式的分类规则。一般决策树分类方法采用自顶向下的递归方式,在决策树的内部结点进行属性值的比较并根据不同的属性值判断从该结点向下的分支,在决策树的根节点得到结论。决策树的生成算法通常采用两个步骤:决策树生成和剪枝。目前, 常见的决策树生成算法有基于信息论的ID3、C4.5算法以及基于最小GINI指标的CART、SLIQ、PUBLIC方法。而用决策树算法和遗传算法相结合的方法来进行分类规则的挖掘,也有不少研究成果。从构造机制的角度,有人提出中提出利用二元决策树实现模型选择,并采用遗传算法构造二元决策树并提出了遗传算法基于二元决策树的模型选择方法。也有人分别提出一种基于遗传算法的多重决策树组合分类方法,该组合分类方法比单个决策树具有更高的分类精度,并在保持分类结果良好可解释性的基础上优化了分类规则;其中阐述了一种基于决策树的改进的遗传算法的编码技术和相关遗传算子的操作,强调其方法在从海量数据库中全局优化搜索分类规则集有较好的优越性。研究显示没有哪一种算法在所有方面都胜过其它所有算法。本文基于前人研究的基础提出的算法,通过DNA编码经过遗传迭代操作得到优化的分类规则,再由分类规则来构建决策树。为了确保所有规则都包含在决策树中,引入广义决策树的概念,最后,给出了实例,验证了算法的有效性。