[Python] Handling string data in Pandas
※ 문자열 다루기 ■ contains() .str.contains(문자열) : 문자열을 포함하고 있는지의 유무 # 사용 예시 > df['Name'].str.contains('Mrs') # 컬럼 'Name'에서 'Mrs' 문자열을 포함하고 있는지 T/F 반환 &g...
※ 문자열 다루기 ■ contains() .str.contains(문자열) : 문자열을 포함하고 있는지의 유무 # 사용 예시 > df['Name'].str.contains('Mrs') # 컬럼 'Name'에서 'Mrs' 문자열을 포함하고 있는지 T/F 반환 &g...
※ Group by / Cross Tab ■ group by 같은 값을 한 그룹으로 묶어서 여러 가지 연산을 하는 함수. parameter as_index: 그룹으로 묶을 컬럼을 인덱스로 해서 시리즈형태로 출력할건지 / 데이터프레임으로 출력할건지 {T...
※ Apply 함수 ■ apply 사용자 정의 함수를 데이터에 적용하고 싶을 때 사용 df.apply(함수, axis) {axis = 0 : 행방향, axis = 1 : 열방향} # e.g.1 > def function_name(x): if x['colA...
■ .explode() 특정 컬럼(리스트 타입인 컬럼)을 여러 행으로 분리시킴 > df.explode('colA') ■ .drop_duplicates() 중복값이 있는 컬럼값들의 행 제거 매개변수 subset: 중복 기준을 판단하는...
※ Fancy Indexing # Column Indexing > df['컬럼명'] # series 형식으로 출력 > df.컬럼명 ## 데이터프레임 형식으로 출력 > df.컬럼명.to_frame() > df[['컬럼명']] # Slicing ## 기본적으...