본문 바로가기

인공지능/머신러닝 이론

1-6. Advantage of having the Posterior Probability


< 목차 >

  1. 용어정의
  2. Advantage of having the posterior probability

1. 용어정의

- 아래페이지의 용어정의를 참고해주세요.


2. Advantages of having the posterior probability

2021.03.26 - [인공지능/머신러닝] - 5. Introduction to Classification Problems 에 이어서, Posterior probability 에 관한 정보를 얻는 것은 다음과 같은 장점이 있다.

 

  • Type l error, type ll error 에 가중치를 준 Loss matrix를 사용하여 decision을 쉽게 변경하고 적용할 수 있다.
  • 실제환경에서 많이 접하는, Unbalanced 데이터문제를 처리할 수 있다.

 

예로 들면, 실제로 암환자의 수는 정상인 수에 비해 극히 적고 우리는 아래와 같은 샘플링 방법으로 Unbalanced 문제에 대응 할 수 있으며, 예제에 적용하여 조금 더 자세하게 설명하자면 아래와 같다.

 

 

1. C1으로 분류되는 20명의 암환자와 C2로 분류되는 10000명의 정상인이 있다고 가정하면, 우리는 작은 데이터를 기준으로 최대로 샘플링할 수 있는 수를 고려하여 정상인 중에 20명, 암환자 20명을 각각 샘플링한다. 즉, 암환자의 N1' = 20, 정상인의 N2' = 20 이다.

2. Balancing 된 N1' 과 N2' 를 이용하여, 주어진 X-ray 영상데이터가 암환자의 것인지, 정상인의 것인지 Posterior probability(p')를 구한다.

3. 각 20개씩 샘플링되어 구한 확률분포 p'에 대해서 전체 데이터(N1, N2)와 샘플링된 데이터(N1', N2')를 이용하여 정규화하며, 이는 20명의 암환자와 10000명의 정상인에 대한 클래스 확률분포(p) 에 대응하는 것이다.

4. 마지막으로, 전체데이터에 대한 클래스별 확률분포(p) 의 총합이 1이 되도록 적합한 정수를 곱해준다.

 

728x90
반응형