728x90
imputer
Nan데이터는 처리하기 쉽도록 판다스에서 Nan데이터 처리전용 함수를 제공함.
문제는 Nan이 아닌 0이나 필요없는 object등 다른 문자들로 데이터가 없음을 표시한 경우 처리가 쉽지않다.
이럴 때 imputer 사용.
from sklearn.impute import SimpleImputer
fill=SimpleImputer(missing_values= 0 , strategy='mean')
fill.fit_transform(df)
array([[ 6. , 148. , 72. , ..., 0.627, 50. , 1. ],
[ 1. , 85. , 66. , ..., 0.351, 31. , 1. ],
[ 8. , 183. , 64. , ..., 0.672, 32. , 1. ],
...,
[ 5. , 121. , 72. , ..., 0.245, 30. , 1. ],
[ 1. , 126. , 60. , ..., 0.349, 47. , 1. ],
[ 1. , 93. , 70. , ..., 0.315, 23. , 1. ]])
728x90
'Streamlit' 카테고리의 다른 글
[Python]Visual Studio Code 개발환경 설정하기 (0) | 2021.03.12 |
---|