# 시리즈 생성
>pd.Series(List)# 데이터프레임 생성
>pd.DataFrame(data,index,columns,…)## 데이터프레임 생성 예시
>data=np.arange(1,49).reshape(12,4)>index=np.arange(12)>columns=["A","B","C","D"]>df=pd.DataFrame(data,index,columns)# 데이터프레임 출력
>df.index# 인덱스 출력 # [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]
>df.columns# 컬럼명 출력 # ['A', 'B', 'C', 'D']
>df.values# 값들 df 형태로 출력
>df["컬럼명"]# 특정 column값들 indexing
■ 기초 Method
>df.head()# 상위 다섯 줄 출력
>df.tail()# 하위 다섯 줄 출력
>df.info()# data frame 요약정보
>df.describe()# data frame 통계정보 (수치형 변수만 출력)
>df.min(numeric_only=True)# 최솟값
>df.max(numeric_only=True)# 최댓값
>df.mean(numeric_only=True)# 평균
>df.median(numeric_only=True)# 중간값
>df.std(numeric_only=True)# 표준편차
>df.var(numeric_only=True)# 분산
>df.quantile(0.5,numeric_only=True)# 분위수 / 50%에 해당하는 값
>df.corr(numeric_only)# 상관관계
□ 타입 변환
>df.dtypes# 열의 타입을 시리즈로 반환
# 원하는 타입의 데이터만 추출
>df.select_dtypes('int')>df.select_dtypes('object')
원하는 타입으로 변환하기
# 기본 구조
>df[컬럼명].astype(타입)
# 사용 예시
>df['colA'].astype(str)# colA 타입을 문자열로 변경
>df['colB'].astype(int)# colB 타입을 정수로 변경
출처: https://arxiv.org/pdf/2209.14734
※ DiGress
a discrete denoising diffusion model for generating graphs with categorical node and edge attributes
...
댓글남기기