python 特徵缺失值填充

來源:互聯網
上載者:User

標籤:eth   erp   數值   rom   size   function   python   cti   sof   

我們在進行模型訓練時,不可避免的會遇到某些特徵出現空值的情況,下面整理了幾種填充空值的方法

1. 用固定值填充

對於特徵值缺失的一種常見的方法就是可以用固定值來填充,例如0,9999, -9999, 例如下面對灰階分這個特徵缺失值全部填充為-99

data[‘灰階分‘] = data[‘灰階分‘].fillna(‘-99‘)
2. 用均值填充

對於數值型的特徵,其缺失值也可以用未缺失資料的均值填充,下面對灰階分這個特徵缺失值進行均值填充

data[‘灰階分‘] = data[‘灰階分‘].fillna(data[‘灰階分‘].mean()))
3. 用眾數填充

與均值類似,可以用未缺失資料的眾數來填充缺失值

data[‘灰階分‘] = data[‘灰階分‘].fillna(data[‘灰階分‘].mode()))
4. 用上下資料進行填充

用前一個資料進行填充

data[‘灰階分‘] = data[‘灰階分‘].fillna(method=‘pad‘)

用後一個資料進行填充

data[‘灰階分‘] = data[‘灰階分‘].fillna(method=‘bfill‘)
5. 用插值法填充
data[‘灰階分‘] = data[‘灰階分‘].interpolate()
6. 用KNN進行填充
from fancyimpute import BiScaler, KNN, NuclearNormMinimization, SoftImputedataset = KNN(k=3).complete(dataset)

python 特徵缺失值填充

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.