최근 포스트

ggplot in R

4 분 소요

※ 데이터시각화 패키지: ggplot2 기본 구조 ggplot() : data와 x, y축 값을 넣어줌 target plot() : 만들고자 하는 plot / geom_point() / geom_line() / geom_bar() 등 ...

NA handling in R (결측치 처리하기)

6 분 소요

※ NA handling (결측치 처리) ◎ 사용할 패키지: tidyverse library(tidyverse) ◎ 예시 Data (df) name class math eng gender 1 Hwayoung 1 74.0 76 f 2 ...

R - Tips

1 분 소요

■ 지수표기법 변경 optins(scipen= 숫자) optins(scipen=100) ■ order 함수 order(DataFrame, decreasing = (T/F)) order(DataFrame, decreasing = (T/F)) ■ K-Means C...

단순회귀분석 - 회귀모형진단

1 분 소요

※ Measuring the quality of fit (적합성 측정) \(Cor(Y,\hat Y) = \lvert Cor(X, Y) \rvert\) $X, Y$산점도와 $Y, \hat Y$산점도는 동일한 패턴, 상관계수도 같다. ■ SST / SSR / SSE 종...

Logistic Regression (로지스틱 회귀)

2 분 소요

※ Logistic Regression (로지스틱 회귀) 종속변수가 범주형인 경우에 보통 사용. 종속변수가 연속형인 경우에 사용할려면 y의 범위가 주어져야 함. linear regression을 분류 모델로써 확장한 모델 linear regression 결과에 ...