首页 >> 方法大全

三种常用数据标准化方法

2022-05-14 方法大全 1304 作者:考证青年

简介

评价是现代社会各领域的一项常规工作,是科学管理决策的重要依据。随着研究领域的不断扩大,人们面临的评价对象也越来越复杂。仅仅根据一个指标来评价事物往往是不合理的。必须从整体的角度考虑问题,多指标综合评价方法应运而生。所谓多指标综合评价法,就是综合描述评价对象不同方面的多个指标的信息,得到一个综合指标,从而对评价对象进行整体评价,进行横向或纵向比较。

在多指标评价体系中,由于各个评价指标的性质不同,通常具有不同的维度和数量级。当各指标水平差异较大时,如果直接使用原指标值进行分析,综合分析中数值较高的指标效果会突出,而数值水平较低的指标效果相对减弱。因此,为了保证结果的可靠性,需要对原始指标数据进行标准化处理。

目前数据标准化的方法有很多,可以概括为线性法(如极值法、标准差法)、折线法(如三折线法)、曲线法(如半线法)。正态分布)。不同的标准化方法会对系统的评价结果​​产生不同的影响。不幸的是,在数据标准化方法的选择上没有通用的规则可循。

常用的方法有:min-max归一化(Min-max)、log函数转换、atan函数转换、z-score归一化(zero-mena,这种方法最常用)、模糊量化方法。本文只介绍了min-max法(归一化法)、z-score法(归一化法)、比例法(名称不清楚,归一化法)。

Data () 对数据进行缩放,使其落在一个小的特定区间内。常用于一些比较评价指标的处理中,去除数据的单位限制,将其转化为无量纲的纯值,以便对不同单位或量级的指标进行比较和加权。最典型的一种是数据归一化,即将数据统一映射到[0,1]区间。常见的数据归一化方法有:min-max归一化(Min-),也叫离散归一化,是对原始数据进行线性变换,使结果落入[0,1]区间。转换函数如下: 其中max是样本数据的最大值,min是样本数据的最小值。这种方法的一个缺点是,当添加新数据时,可能会导致 max 和 min 发生变化,需要重新定义。对数函数转换也可以通过以 10 为底的对数函数转换方法进行转换。具体方法如下:网上看了很多介绍,都是x*=log10(x),其实是有问题的。结果不一定落在[0,1]区间时方法,应该除以log10(max),max是样本数据的最大值,所有数据都必须大于等于1。 atan函数也可以用反正切函数对数据进行归一化:使用这种方法,需要注意的是,如果要映射的区间为[0,1]方法,则数据应大于等于0,且小于 0 的数据将映射到 [-1,0] 区间。并非所有数据标准化结果都映射到 [0,1] 区间。最常见的标准化方法是Z标准化,这也是SPSS中最常用的标准化方法:z-score标准化(零-)也称为标准差标准化。 ,处理后的数据符合标准正态分布,即均值为0,标准差为1,变换函数为: 其中μ为所有样本数据的均值,σ为所有样本数据的标准差.

1 什么是数据归一化()

缩放数据,使其落在一个小的特定区间内。常用于一些比较评价指标的处理,去除数据的单位限制,转化为无量纲的纯值,对不同单位或量级的指标进行比较和加权。

方法

2 常用的方法有哪些?方法一:归一化法

pic1

方法二:归一化方法

pic2

步骤如下:

1.求每个变量(指标)的算术平均值(数学期望)xi和标准差si;

2.标准化:

方法

zij=(xij-xi)/si

其中:zij 为标准化变量值; xij 是实际的变量值。

3.在反向指标之前交换符号。

标准化变量值在0附近波动。大于0表示高于平均水平,小于0表示低于平均水平。

方法三:归一化方法

pic3

三种常见的数据归一化方法/

关于我们

最火推荐

小编推荐

联系我们


版权声明:本站内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 88@qq.com 举报,一经查实,本站将立刻删除。备案号:桂ICP备2021009421号
Powered By Z-BlogPHP.
复制成功
微信号:
我知道了