標準化 (Standardization) vs 正規化 (Normalization)

計算前の統計値
計算式
計算後の統計値

まとめ: どっちをいつ使う?

標準化 (Standardization)

  • 目的: データを平均0、標準偏差1の分布に変換する。
  • 特徴: 外れ値の影響を受けにくい。元のデータの分布の形が維持されやすい。
  • 使い所:
    • データに外れ値が含まれる可能性がある場合。
    • SVM、ロジスティック回帰、線形回帰など、多くの機械学習アルゴリズムで汎用的に使われる。

正規化 (Normalization)

  • 目的: データを0から1の範囲にスケーリングする。
  • 特徴: 外れ値に非常に敏感。「外れ値あり」データで試すと、ほとんどの点が0の近くに固まってしまうのがわかる。
  • 使い所:
    • 値の範囲を明確にしたい場合。
    • ニューラルネットワークの画像処理(ピクセル値を0-1に)や、距離ベースのアルゴリズム(k-NNなど)で有効な場合がある。