[Python] Data sorting using Pandas

2024-06-12 1 분 소요

※ 데이터 정렬

sort_values()

pandas 라이브러리
series와 data frame을 정렬할 수 있음
매개변수
- by : data frame을 정렬할 때 기준이 될 컬럼
- ascending : 오름/내림차순 정렬 {True(default) / False}
- key : 정렬 기준 함수 (주로 lambda 함수를 사용) (default: None)
- na_position : 결측이 있는 경우 어디에 배치할 것인지를 결정 {first(default), last}

# 기본 구조
# series 정렬
> data.sort_values(ascending, key, na_position)

# data frame 정렬
> df.sort_values(by, ascending, key, na_position)

# 특정 컬럼기준으로 value들 오름차순 정렬
> df.sort_values(by = "컬럼", ascending = True)

# 특정 컬럼기준으로 value들 내림차순 정렬
> df.sort_values(by = "컬럼", ascending = False)

# 여러 컬럼을 오름/내림차순 정렬
# e.g. 컬럼1을 기준으로 내림차순, 같은 값이면 컬럼2를 기준으로 오름차순, ...
> df.sort_values(by = ["컬럼1", "컬럼2", ...], ascending = [False, True, ...])

# e.g. 시리즈 정렬
> S = pd.Series(np.random.randint(1, 10, 10))
> S.iloc[0:3] = np.nan
> S
  NaN
  NaN
  NaN
  7.0
  2.0
  5.0
  4.0
  7.0
  3.0
  5.0

> S.sort_values()
  2.0
  3.0
  4.0
  5.0
  5.0
  7.0
  7.0
  NaN
  NaN
  NaN

> S.sort_values(ascending = False, na_position = 'first')
  NaN
  NaN
  NaN
  7.0
  7.0
  5.0
  5.0
  4.0
  3.0
  2.0

# e.g. 데이터프레임 정렬
> D = pd.DataFrame({'A':range(10), 'B':range(11,21)})
> D
   A  B
0  3  6
1  9  2
2  5  9
3  4  8
4  6  9

> D.sort_values(by = 'A')
   A  B
0  3  6
3  4  8
2  5  9
4  6  9
1  9  2

> D.sort_values(by = ['B', 'A'], ascending = False)
   A  B
2  5  9
4  6  9
3  4  8
0  3  6
1  9  2

Twitter Facebook LinkedIn

[Python] Data sorting using Pandas

※ 데이터 정렬

sort_values()

공유하기

댓글남기기

참고

[Python] Perceptron 학습 알고리즘 구현하기 (퍼셉트론)

[Paper] DiGress

[Deep Learning] Perceptron (퍼셉트론)

[Python] Tensor (텐서, 선형대수학)