ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [Python] Pandas 결측치
    Python/pandas 2022. 10. 13. 15:15
    728x90
    반응형

    목차

      Missing Data

      Pandas는 주로 누락된 데이터르 ㄹ나타내기 위해 np.nan 값을 사용한다. 기본적으로 계산에는 포함되지 않는다.

       

      Reindexing을 사용하면 지정된 축의 인덱스를 변경/추가/삭제 할 수 있다. 이 경우 데이터 복사본이 반환

      df1 = df.reindex(index = dates[0:4], columns = list(df.columns) + ["E"])
      
      df1.loc[dates[0] : dates[1], "E"] = 1
      
      df1

      DataFrame.dropna()는 결측치가 있는 행을 삭제.

      df1.dropna(how = "any")

      DataFrame.dropna()

      DataFrame.dropna(axis=0, how=_NoDefault.no_default, thresh=_NoDefault.no_default, subset=None, inplace=False)
       
      Parameters :
       
      axis : {0 or ‘index’, 1 or ‘columns’}, default 0
      • 0, or ‘index’ : 결측값이 포함된 행을 삭제
      • 1, or 'columns) : 결측값이 포함된 열을 삭제

      how : {‘any’, ‘all’}, default ‘any’

      • 'any' : NA 값이 있으면 해당 행 또는 열을 삭제
      • 'all' : 모든 값이 NA이면 해당 행 또는 열을 삭제

      thresh : int, optional

      subset : column label 또는 sequence of labels, optional

       

      inplace : bool, defatul False # 데이터 프레임을 새로 만들지 않고 수정할지 여부입니다.

       

      Return:

      NA 항목이 있는 DataFrame에서 삭제되거나 None(제자리인 경우) = True 이다.

       

      DataFrame.fillna() 결측치를 채워준다.

      df1.fillna(value = 5)

      DataFrame.fillna ()

      DataFrame.fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None)
       
      Parameters :
       
      value : scalar, dict, Series, or DataFrame
       
      method : {'backfill', 'bfill', 'pad', 'ffill', None}, default None
       
      axis : {0 or 'index', 1 or 'columns'}
       
      inplace : bool, default False
       
      limit : int, default None
       
      downcast : dict, default is None
       
      Return :
      DataFrame or None
      결측값이 채워진 개체이거나 None(제자리인 경우) = True 이다.
       

      isna()는 값이 nan인 boolean값을 가져온다.

      pd.isna(df1)

       

       

       

      반응형

      'Python > pandas' 카테고리의 다른 글

      [Python] Pandas Merge  (0) 2022.10.13
      [Python] Pandas Operations  (0) 2022.10.13
      [Python] Pandas 선택하기  (0) 2022.10.13
      [Python] Pandas 데이터보기  (1) 2022.10.11
      [Python] Pandas 객체 생성  (0) 2022.10.11

      댓글

    Designed by Tistory.