Streamlit

imputer

728x90

imputer

 

Nan데이터는 처리하기 쉽도록 판다스에서 Nan데이터 처리전용 함수를 제공함.

 

문제는 Nan이 아닌 0이나 필요없는 object등 다른 문자들로 데이터가 없음을 표시한 경우 처리가 쉽지않다.

 

이럴 때 imputer 사용.

 

from sklearn.impute import SimpleImputer

 

 

fill=SimpleImputer(missing_values= 0 , strategy='mean')
fill.fit_transform(df)

array([[ 6. , 148. , 72. , ..., 0.627, 50. , 1. ],
        [ 1. , 85. , 66. , ..., 0.351, 31. , 1. ],
        [ 8. , 183. , 64. , ..., 0.672, 32. , 1. ],
         ...,
        [ 5. , 121. , 72. , ..., 0.245, 30. , 1. ],
        [ 1. , 126. , 60. , ..., 0.349, 47. , 1. ],
        [ 1. , 93. , 70. , ..., 0.315, 23. , 1. ]])

728x90

'Streamlit' 카테고리의 다른 글

[Python]Visual Studio Code 개발환경 설정하기  (0) 2021.03.12