主題

標準化到底是 Standardizing or Normalization,通通叫作正規化?

Absinthe | 2021-03-12 13:00:36 | 巴幣 0 | 人氣 139

高中統計有學過「數據標準化」:其實就是大學常講的 Z-Score (Z-分數),又稱為「Standard Score (標準分數)」。英文維基上稱此方法是一種「Standardizing」或是「Normalizing、Normalization

其中 Normalization 又是統計學的專業用語,和高中的認知相同,就是將不同比例的資料可以映射至相同的比例尺做比較。除了  Z-Score,另一個常用的方法是「Min-max Feature Scaling」,以及其他五花八門的方法 https://en.wikipedia.org/wiki/Normalization_(statistics)

數據分析上 (統計、大數據、機器學習、深度學習) Normalization 就是分析資料前需要做的一個步驟,又稱為「資料預處理」,然而不知為何中文文章或書籍也會把 Normalization  翻譯為「正規化」,也許是想形容此方法是在「使各種規格統一」之類的意思吧。但問題是這個名字也造成許多混淆不同領域都有所謂的「正規化」,而且不光是中文模糊,連英文也常常叫作 Normalization,但本質上又是不同的東西。例如:機器學習 (Machine Learning) 領域針對 Cost Function 的某種調整方法也稱為正規化;資料庫對資料表的處理也稱為正規化;正規語言與自動機不但有正規化語言,也仍有一個演算法步驟叫作正規化。這種現象如同 Synchronization (同步) 已經被各種領域用爛了 (每個人心中都有自己的 Synchronization )。

難道不能取別的名字嗎?(´・ω・`)

創作回應

星星蝶舞
中文就是這麼難用
2021-03-12 18:45:08

相關創作

更多創作