caret in R
※ 머신러닝 패키지: caret
패키지 설치
dependencies : “TRUE”로 해줘야함 caret은 다른 패키지와 연관성이 있는 패키지라서.
> install.packages("caret", dependencies = TRUE)
> library(caret)
■ 함수 소개
□ trainControl()
- 데이터 훈련(train) 과정의 parameter 설정
- parameter
- method : 데이터 training 방법 지정 (“repeatedcv” / …)
- number : 훈련 데이터의 fold 개수
- repeats : Cross Validation 반복 횟수
- 사용 예시
> trainControl(
method = ,
number = ,
repeats =
)
□ expand.grid()
- 모든 벡터 혹은 인자(factor) 조합의 데이터 프레임 생성
- parameter
- k : k값의 범위 지정 (ex. k=1:10)
- 사용 예시
> expand.grid(k = 1:10)
□ train()
- 머신러닝의 알고리즘을 이용해 데이터학습을 통한 모델 생성
- parameter
- class : 타겟 ~ 피쳐
- data :
- method : 사용하고 싶은 머신러닝 방법
- “KNN” : K-Nearest Neighbor
- “LogitBoost” : Boosted Logistic Regression
- “LMT” : Logistic Model Trees
- “plr” : Penalized Logistic Regression
- “regLogistic” : Regularized Logistic Regression
- trControl : 학습 방법
- preProcess : 데이터 전처리 방법
- tuneGrid : 튜닝 파라미터 값 목록
- metric : 모형 평가 방식
- 사용 예시
> train(
target ~.,
data = train,
method = "KNN",
trControl = trainControl(),
preProcess = c("center", "scale"),
tuneGrid = expand.grid(k = 1:10),
metric = "Accuracy"
)
댓글남기기