-
[Python] Pandas 그룹화Python/pandas 2022. 10. 14. 09:21728x90반응형
목차
Grouping
"group by"란 다음 단계 중 하나 이상을 포함하는 프로세스를 말한다.
- 일부 기준에 따라 데이터를 그룹으로 분할
- 각 그룹에 독립적으로 기능 적용
- 결과를 데이터 구조로 결합
df = pd.DataFrame( { "A": ["foo", "bar", "foo", "bar", "foo", "bar", "foo", "foo"], "B": ["one", "one", "two", "three", "two", "two", "one", "three"], "C": np.random.randn(8), "D": np.random.randn(8), } ) df
sum() 함수를 그룹화한 다음 결과 그룹에 적용
df.groupby("A")[["C", "D"]].sum()
여러 열에 의한 그룹화는 계층적 인덱스를 형성하며, 다시 sum() 함수를 적용할 수 있다.
df.groupby(["A", "B"]).sum()
반응형'Python > pandas' 카테고리의 다른 글
[Python]Pandas Time series (0) 2022.12.22 [Python] Pandas Reshape (0) 2022.10.14 [Python] Pandas Merge (0) 2022.10.13 [Python] Pandas Operations (0) 2022.10.13 [Python] Pandas 결측치 (1) 2022.10.13