数据挖掘之归一化
在阅读数据模型的文章中,经常看到针对特征维度进行归一化处理。
归一化的定义:
一种简化计算的方式,将有量纲的表达式,经过变换,化为无量纲的表达式,成为纯量,避免具有不同物理意义和量纲的输入变量不能平等使用。在统计学中,归一化的具体作用是归纳统一样本的统计分布性。归一化在0-1之间是统计的概率分布,归一化在-1--+1之间是统计的坐标分布。
归一化处理后,神经网络算法可以较好的收敛。
常见的归一化的函数如下
1,线性函数转换,表达式如下:
y=(x-MinValue)/(MaxValue-MinValue)
说明:x、y分别为转换前、后的值,MaxValue、MinValue分别为样本的最大值和最小值。
2,对数函数转换,表达式如下
y=log10(x) 说明:以10为底的对数函数转换。
3、反正切函数转换,表达式如下
y=atan(x)*2/PI
归一化的具体方法根据你的样本特征,需要选择恰当的方法。
相关推荐
alanlonglong 2020-11-11
Iamthedoctor 2020-09-08
Site 2020-08-20
83327712 2020-07-30
zhaorui0 2020-06-09
hnyzyty 2020-06-04
LetItBe 2020-02-18
卖小孩的咖啡 2020-01-19
GhostLWB 2020-01-18
GerwelsJI 2020-01-11
ALLWITHLOVE 2019-12-29
xiaoxue 2019-11-08
xueyuediana 2019-09-21
yishujixiaoxiao 2019-11-01
DataCastle 2013-03-23
hualalalalali 2019-07-01
kinghighbury 2019-06-30
mori 2019-06-27
langzi00 2013-10-10