최대 1 분 소요


※ 머신러닝 패키지: caret

패키지 설치

dependencies : “TRUE”로 해줘야함 caret은 다른 패키지와 연관성이 있는 패키지라서.

> install.packages("caret", dependencies = TRUE)
> library(caret)

■ 함수 소개

□ trainControl()

  • 데이터 훈련(train) 과정의 parameter 설정
  • parameter
    • method : 데이터 training 방법 지정 (“repeatedcv” / …)
    • number : 훈련 데이터의 fold 개수
    • repeats : Cross Validation 반복 횟수
  • 사용 예시
> trainControl(
    method = ,
    number = ,
    repeats =
)


□ expand.grid()

  • 모든 벡터 혹은 인자(factor) 조합의 데이터 프레임 생성
  • parameter
    • k : k값의 범위 지정 (ex. k=1:10)
  • 사용 예시
> expand.grid(k = 1:10)


□ train()

  • 머신러닝의 알고리즘을 이용해 데이터학습을 통한 모델 생성
  • parameter
    • class : 타겟 ~ 피쳐
    • data :
    • method : 사용하고 싶은 머신러닝 방법
      • “KNN” : K-Nearest Neighbor
      • “LogitBoost” : Boosted Logistic Regression
      • “LMT” : Logistic Model Trees
      • “plr” : Penalized Logistic Regression
      • “regLogistic” : Regularized Logistic Regression
    • trControl : 학습 방법
    • preProcess : 데이터 전처리 방법
    • tuneGrid : 튜닝 파라미터 값 목록
    • metric : 모형 평가 방식
  • 사용 예시
> train(
    target ~.,
    data = train,
    method = "KNN",
    trControl = trainControl(),
    preProcess = c("center", "scale"),
    tuneGrid = expand.grid(k = 1:10),
    metric = "Accuracy"
)

댓글남기기