-
[Python] Pandas 결측치Python/pandas 2022. 10. 13. 15:15728x90반응형
목차
Missing Data
Pandas는 주로 누락된 데이터르 ㄹ나타내기 위해 np.nan 값을 사용한다. 기본적으로 계산에는 포함되지 않는다.
Reindexing을 사용하면 지정된 축의 인덱스를 변경/추가/삭제 할 수 있다. 이 경우 데이터 복사본이 반환
df1 = df.reindex(index = dates[0:4], columns = list(df.columns) + ["E"]) df1.loc[dates[0] : dates[1], "E"] = 1 df1
DataFrame.dropna()는 결측치가 있는 행을 삭제.
df1.dropna(how = "any")
DataFrame.dropna()
DataFrame.dropna(axis=0, how=_NoDefault.no_default, thresh=_NoDefault.no_default, subset=None, inplace=False)Parameters :axis : {0 or ‘index’, 1 or ‘columns’}, default 0- 0, or ‘index’ : 결측값이 포함된 행을 삭제
- 1, or 'columns) : 결측값이 포함된 열을 삭제
how : {‘any’, ‘all’}, default ‘any’
- 'any' : NA 값이 있으면 해당 행 또는 열을 삭제
- 'all' : 모든 값이 NA이면 해당 행 또는 열을 삭제
thresh : int, optional
subset : column label 또는 sequence of labels, optional
inplace : bool, defatul False # 데이터 프레임을 새로 만들지 않고 수정할지 여부입니다.
Return:
NA 항목이 있는 DataFrame에서 삭제되거나 None(제자리인 경우) = True 이다.
DataFrame.fillna() 결측치를 채워준다.
df1.fillna(value = 5)
DataFrame.fillna ()
DataFrame.fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None)Parameters :value : scalar, dict, Series, or DataFramemethod : {'backfill', 'bfill', 'pad', 'ffill', None}, default Noneaxis : {0 or 'index', 1 or 'columns'}inplace : bool, default Falselimit : int, default Nonedowncast : dict, default is NoneReturn :DataFrame or None결측값이 채워진 개체이거나 None(제자리인 경우) = True 이다.isna()는 값이 nan인 boolean값을 가져온다.
pd.isna(df1)
반응형'Python > pandas' 카테고리의 다른 글
[Python] Pandas Merge (0) 2022.10.13 [Python] Pandas Operations (0) 2022.10.13 [Python] Pandas 선택하기 (0) 2022.10.13 [Python] Pandas 데이터보기 (1) 2022.10.11 [Python] Pandas 객체 생성 (0) 2022.10.11