数据挖掘的主要任务

来源:东奥会计在线 责编:牛美琪 2024-06-19 10:09:39

精选回答

东奥美国注册管理会计师

2024-06-20 14:04:51

数据挖掘的主要任务

相关剖析

两个或两个以上变量的取值之间存在某种规律性,就称为相关。数据相关是数据库中存在的一类重要的、可被发现的常识。相关分为简略相关、时序相关和因果相关。相关剖析的目的是找出数据库中隐藏的相关网。

聚类剖析

聚类是把数据依照类似性归纳成若干类别,同一类中的数据互相类似,不同类中的数据相异。聚类剖析能够树立宏观的概念,发现数据的散布形式,以及可能的数据特点之间的相互联系。

分类

分类便是找出一个类别的概念描绘,它代表了这类数据的整体信息,即该类的内涵描绘,并用这种描绘来结构模型,一般用规矩或决策树形式表明。分类是使用训练数据集经过必定的算法而求得分类规矩。分类可被用于规矩描绘和猜测。

猜测

猜测是使用历史数据找出变化规律,树立模型,并由此模型对未来数据的种类及特征进行猜测。猜测关怀的是精度和不确定性,通常用猜测方差来衡量。

时序形式

时序形式是指经过时刻序列搜索出的重复发生概率较高的形式。与回归一样,它也是用己知的数据猜测未来的值,但这些数据的区别是变量所处时刻的不同。

误差剖析

在误差中包括很多有用的常识,数据库中的数据存在很多异常情况,发现数据库中数据存在的异常情况是非常重要的。误差查验的根本方法便是寻觅观察结果与参照之间的不同。

数据挖掘和数据分析的区别

数据分析更多采用统计学的知识,对源数据进行描述性和探索性分析,从结果中发现价值信息来评估和修正现状。数据挖掘不仅仅用到统计学的知识,还要用到机器学习的知识,这里会涉及到模型的概念。数据挖掘具有更深的层次,来发现未知的规律和价值。

更多相关知识请点击:

隐性成本和显性成本区别

隐性成本是机会成本吗

了解更多会计考试资讯,可以点击查看东奥cma频道。

免费试听 全部>>

  • CMA 现金管理

    2023《P2》基础班

    周默
    免费
    已有2711人学习
  • CMA 债券

    2023《P2》基础班

    周默
    免费
    已有2729人学习
  • CMA 责任中心

    2023《P1》基础班

    周默
    免费
    已有2581人学习