数据挖掘常用术语(转)
“算法”指的是用于实现某一数据挖掘技术-如分类树、辨识分析等等的特定程序。
“属性”也被称为“特性”、“变量”、或者从数据库的观点,是一个“域”。
“个体”是关于一个单元的测量值的集合――例如一个人的身高、体重、年龄等等;它也被称作“记录”、或者“行”(每一行通常代表一个记录,每一列代表一个变量)。
“置信度”在形如“如果买了A和B,就要买C”的关联法则里有特定的含义。置信度是已经买了A和B,还要买C的条件概率。
“因变量”在有约束学习里是那个被预测的变量;也被称作“输出变量”、“目标变量”、或者“结果变量”
“估计”指的是预测一个连续型输出变量的值;也被称作“预测”。
“特征”也被称作“属性”、“变量”,或者从数据库的观点,称为“域”。
“输入变量”是在有约束学习里作预测的变量;也被称作“自变量”、“预测变量”。
“模型”通常指的是一个数学公式,包括为它设置的参数(许多模型具有用户可以调节的参数)。
“结果变量”在有约束学习里是那个被预测的变量;也被称作“因变量”“输出变量”、“目标变量”、或者“输出变量”。
“P(A|B)”读作“已知B已经发生,A将发生的概率”
“预测”指的是预测一个连续输出变量的值;也被称作“估计”。
“记录”是关于一个单元的测量值的集合-例如一个人的身高、体重、年龄等等;它也被称作“个体”、或者“排”(每一排通常代表一个记录,每一列代表一个变量)。
“分数”指的是一个估计的值或者类。
“给新数据打分”意思是利用用训练数据得出的模型预测新数据里的输出值
相关推荐
ALLWITHLOVE 2020-02-26
刘名军 2019-11-09
muyurenzheng 2013-05-23
santiago00 2013-10-16
Mrright00 2012-06-04
数据挖掘工人 2013-10-21
数据挖掘纵横谈 2011-12-30
数据挖掘工人 2012-02-19
YeChao 2019-07-08
YichengGu 2019-07-01
dyhrj0 2019-07-01
ZweixunSJTU 2019-06-27
dyhrj0 2019-06-21
Lanxiuting 2015-12-17
锅巴 2017-08-15
ZweixunSJTU 2018-11-23
小皮飞 2018-10-26