数据的归一化处理

数据的归一化处理,第1张

是的,把需要处理的数据经过处理后(通过某种算法)限制在你需要的一定范围内。首先归一化是为了后面数据处理的方便,其次是保证程序运行时收敛加快。

归一化的具体作用是归纳统一样本的统计分布性。归一化在0-1之间是统计的概率分布,归一化在某个区间上是统计的坐标分布。轿拿归一化有同一、统一态帆侍和合一的意思。

1、(0,1)标准帆吵化:

这是最简单也是最容易想到的方法,通过遍历feature vector里的每一个数据,将Max和Min的记录下来,并通过Max-Min作为基数(即Min=0,Max=1)进行数据的归一化处理:

LaTex:{x}_{normalization}=\frac{x-Min}{Max-Min}

Python实现:

2、Z-score标准化:

这种方法给予原始数据的均值(mean)和标准差(standard deviation)进行数据的标准化。经过处理的数据符合标准正态分布,即均值为0,标准差为1,这里的关键在于复合标准正态分布,个人认为在一定程度上改变了特征的分布,关于使用经验上欢迎讨论,我对这种标准化不是非常地熟悉。

实现的方法和详细的 *** 作步骤如下:

1、首先,打开软件,如下图所示,然后进入下一步。

2、其次,完成上述步骤后,单击SparkLines图以查看趋势图,如下图所示,然后进入下一步。

3、接着,完成上述步骤后,纵坐标显示的数据没有归一化,如下图所示,然后进入下一步历拦。

4、然后,完成上述步骤后,执行以下归一化过程,然后选择整个数据列,如下图所示,然后进入下一步。

5、随后,完成上述步骤后,右键单击并选择“Normalize”选项,如下图所示,然后进入下一步。

6、接着,完晌梁成上述步骤后,d出框可以设置一些信息,默认即可,如下图所示肢谨胡,然后进入下一步。

7、最后,完成上述步骤后,可以看到数据已归一化,如下图所示。这样,问题就解决了。

origin在460nm处归一化处理的方法如下:

1、最小值校准。在Origin软件的工作表中导入ASCII数据。由于仪器的原因,测试的基线对应的值可能并不相同,各个Fig.1中各曲线第一行的值不都为0,即基线没有经过校准(校零)。可以手动设置列值校准(这一步或许不是必须)。

2、作图。选中各列备指作曲线可以得到未经归一化时的原图。调整坐标,使需要展示的结果即需要校准的横坐标8至10部分的曲线位于画布中央(调整过程及结果不演示)。依次点击:分析、数学、曲线归一化,打早橘开归一化菜单并选择从图片中选择范围(红圈标注处)以及选择归一化方法:归一化到区间0,1,这样就可以让多条曲线,根据某一横坐标范围内的最大值进行归一化并为1。拖动鼠标,蓝色框选取需要最大值所在的范围,并在归一化窗口中点击确定。在这个案例中由于测试结果都只是一个单峰,只要将其完全选中即可,对于其他情形的讨论见文章末尾。此时软件根据设置的条件,已经生成了四条归一化的曲线。新生成的四条曲线默认都是红色仿睁配,由于最大值为1,远远小于原曲线的最大值,此时在图中似乎与基线重合而且不能区分。

3、美化与输出。软件会自动统一曲线颜色与名称的关系等,到这一步只要根据个人习惯、美化需要、作图标准等修改具体细节,即可输出JPG等格式的最终结果。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/12460774.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-25
下一篇 2023-05-25

发表评论

登录后才能评论

评论列表(0条)

保存