최근 포스트

[Python] Data sorting using Pandas

1 분 소요

※ 데이터 정렬 sort_values() pandas 라이브러리 series와 data frame을 정렬할 수 있음 매개변수 by : data frame을 정렬할 때 기준이 될 컬럼 ascending : 오름/내림차순 정렬 {True(d...

[Python] Loading files using Pandas

1 분 소요

※ DataFrame 불러오기 / 저장하기 ■ csv File file path: 파일 경로 및 이름 sep: 구분자 (default: ‘,’) header: 헤더의 위치. None일 입력하면 컬럼명이 0, 1, 2, …로 자동 부여됨 (default: ‘infer’)...

[Python] Making Pivot-Table using Pandas

최대 1 분 소요

※ Pivot Table 데이터를 조건에 따른 변수들의 통계량을 요약한 테이블 엑셀의 피벗테이블처럼 인덱스별, 컬럼별 값의 연산 가능 pivot table 계산 시, 비어있는 값은 fill_value=0을 통해 가능 # 기본 구조 > pd.pivot_table...

[Python] Handling Missing-Data using Pandas

1 분 소요

※ 결측값 처리 isna() : 결측값을 True로 반환 notna() : 결측값을 False로 반환 # 사용 예시 > df.isna() > df.isna().sum() # 결측값이 있는 행의 개수 > df.notna().sum() # 결측값이 없는 행...

[Python] Merging Data Frames using Pandas

1 분 소요

※ DataFrame 합치기 ■ merge() 두 개의 데이터를 특정 컬럼을 기준으로 합침 parameter on: 통합의 기준이 될 key 변수 left_on: df1의 key 변수 right_on: df2의 key 변수 ...