Q. 만일 점진적 학습을 진행하는데 새로운 클래스 데잍어가 조금 들어오게 된다면 샘플 불균형 문제가 발생할텐데, 어떻게 해결할 수 있나요?

A. 적은 수의 새로운 클래스 데이터가 들어왔을 때, 가중치를 높게 부여해서 학습한다. cost sensitive learning이라고 한다.

  1. 클래스 리샘플링(Class Resampling)

    1. 오버샘플링(Oversampling) - 개수가 적은 부류의 데이터에 대한 샘플링 양을 증강
    2. 언더샘플링(Undersampling) - 개수가 많은 부류의 데이터에 대한 샘플링 양을 감쇠
  2. Threshold moving(활성함수 이동)

    a. 분류기의 출력이 활성함수(Threshold) 이상의 값을 가지는 경우에 대해서만 긍정(Positive)으로 예측하고, 나머지 경우는 부정(Negative)로 예측한다.