Data Science Blog

[Python] Handling string data in Pandas

2024-06-22 1 분 소요

※ 문자열 다루기 ■ contains() .str.contains(문자열) : 문자열을 포함하고 있는지의 유무 # 사용 예시 > df['Name'].str.contains('Mrs') # 컬럼 'Name'에서 'Mrs' 문자열을 포함하고 있는지 T/F 반환 &g...

2024-06-22 1 분 소요

※ Group by / Cross Tab ■ group by 같은 값을 한 그룹으로 묶어서 여러 가지 연산을 하는 함수. parameter as_index: 그룹으로 묶을 컬럼을 인덱스로 해서 시리즈형태로 출력할건지 / 데이터프레임으로 출력할건지 {T...

2024-06-22 최대 1 분 소요

※ Apply 함수 ■ apply 사용자 정의 함수를 데이터에 적용하고 싶을 때 사용 df.apply(함수, axis) {axis = 0 : 행방향, axis = 1 : 열방향} # e.g.1 > def function_name(x): if x['colA...

2024-06-16 3 분 소요

■ .explode() 특정 컬럼(리스트 타입인 컬럼)을 여러 행으로 분리시킴 > df.explode('colA') ■ .drop_duplicates() 중복값이 있는 컬럼값들의 행 제거 매개변수 subset: 중복 기준을 판단하는...

2024-06-15 2 분 소요

※ Fancy Indexing # Column Indexing > df['컬럼명'] # series 형식으로 출력 > df.컬럼명 ## 데이터프레임 형식으로 출력 > df.컬럼명.to_frame() > df[['컬럼명']] # Slicing ## 기본적으...