數(shù)據標準化(為什么要進行數(shù)據標準化?)

| 2022-09-07 admin

在進行數(shù)據分析項目案例之前,需要了解數(shù)據的情況,有時候拿到的數(shù)據并不是想象中的完美數(shù)據,那么就需要進行預處理后才能使用。為了系統(tǒng)的縷清預處理的一般的步驟,這里進行詳細的梳理,采用sklearn工具包和手寫代碼驗證的方式進行。

數(shù)據標準化

1.1 標準化定義

標準化的定義:又被稱為均值移除(mean removal),對不同樣本的同一特征值進行處理,最終均值為0,標準差為1,采用此種方式我們只需要使用如下公式即可。

1.2 為什么要進行數(shù)據標準化?

在機器學習中,很多的算法和評估模型的好壞的方法都是基于距離(殘差)的處理