판다스
-
[Python] Pandas 객체 생성Python/pandas 2022. 10. 11. 16:16
Series pandas가 기본 정수 인덱스를 생성하도록 하여 값 목록을 전달하여 생성 import numpy as np import pandas as pd s = pd.Series([1, 3, 5, np.nan, 6, 8]) label이 지정된 열 DataFrame 을 사용하여 날짜/시간 인덱스가 있는 Numpy 배열을 전달하여 생성 date_range() dates = pd.date_range("20121001", periods=6) print(dates) df = pd.DataFrame(np.random.randn(6, 4), index=dates, columns=list("ABCD")) print(df) DataFrame 시리즈와 같은 구조로 변환할 수 있는 객체 사전을 전달하여 생성 df2 = ..
-
Python parquet 타입으로 읽기, 쓰기Python/etc 2022. 10. 6. 13:37
목차 csv 데이터는 읽는 것 보다 쓰는 데 더욱 많은 시간이 걸린다. arrow에서는 csv 포맷 쓰기를 지원하지는 않기 때문에 parquet 타입 파일을 활용해야 한다. csv를 parquet 타입으로 저장 import pyarrow.parquet as pq from pyarrow import csv pq.write_table(csv.read_csv('data.csv'), 'data.parquet') 데이터 프레임을 parquet 파일로 저장 데이터 프레임을 먼저 Table로 변환 후 parquet타입으로 저장한다. import pandas as pd df.to_parquet('data.parquet', engine = 'pyarrow', index = False) import pyarrow as p..