Python/pandas

[Python] Pandas Operations

Owen.white 2022. 10. 13. 16:29
728x90
반응형

목차

    Stats

    일반적으로 작업에서는 결측 데이터가 제외된다.

     

    기술통계량 수행

    df.mean()

    다른 축에서도 동일한 작업을 수행할 수 있다.

    df.mean(1)

    차원이 다르고 정렬이 필요한 개체로 작업한다. 또한 Pandas는 지정된 차원을 따라 자동으로 방송한다.

    s = pd.Series([1,3,5, np.nan, 6, 8], index = dates).shift(2)
    s

    df.sub(s, axis="index")

    Apply

    DataFrame.apply() 사용자 정의 함수를 데이터에 적용

    df.apply(np.cumsum)

    Histogramming

    s = pd.Series(np.random.randint(0, 7, size=10))
    s

    s.value_counts()

    String Methods

    아래의 코드 정보에서와 같이 str 속성에는 배열의 각 요소에서 쉽게 작동할 수 있는 일련의 문자열 처리 방법이 장착되어 있다.

    패턴 일치는 일반적으로 기본적으로 정규식을 사용한다. (경우에 따라 항상 사용)

    s = pd.Series(["A", "B", "C", "Aaba", "Baca", np.nan, "CABA", "dog", "cat" ])
    
    s.str.lower()

     

    반응형