< 목차 >
- 용어정의
- Advantage of having the posterior probability
1. 용어정의
- 아래페이지의 용어정의를 참고해주세요.
2. Advantages of having the posterior probability
2021.03.26 - [인공지능/머신러닝] - 5. Introduction to Classification Problems 에 이어서, Posterior probability 에 관한 정보를 얻는 것은 다음과 같은 장점이 있다.
- Type l error, type ll error 에 가중치를 준 Loss matrix를 사용하여 decision을 쉽게 변경하고 적용할 수 있다.
- 실제환경에서 많이 접하는, Unbalanced 데이터문제를 처리할 수 있다.
예로 들면, 실제로 암환자의 수는 정상인 수에 비해 극히 적고 우리는 아래와 같은 샘플링 방법으로 Unbalanced 문제에 대응 할 수 있으며, 예제에 적용하여 조금 더 자세하게 설명하자면 아래와 같다.
1. C1으로 분류되는 20명의 암환자와 C2로 분류되는 10000명의 정상인이 있다고 가정하면, 우리는 작은 데이터를 기준으로 최대로 샘플링할 수 있는 수를 고려하여 정상인 중에 20명, 암환자 20명을 각각 샘플링한다. 즉, 암환자의 N1' = 20, 정상인의 N2' = 20 이다.
2. Balancing 된 N1' 과 N2' 를 이용하여, 주어진 X-ray 영상데이터가 암환자의 것인지, 정상인의 것인지 Posterior probability(p')를 구한다.
3. 각 20개씩 샘플링되어 구한 확률분포 p'에 대해서 전체 데이터(N1, N2)와 샘플링된 데이터(N1', N2')를 이용하여 정규화하며, 이는 20명의 암환자와 10000명의 정상인에 대한 클래스 확률분포(p) 에 대응하는 것이다.
4. 마지막으로, 전체데이터에 대한 클래스별 확률분포(p) 의 총합이 1이 되도록 적합한 정수를 곱해준다.
728x90
반응형
'인공지능 > 머신러닝 이론' 카테고리의 다른 글
2-2. Maximum Likelihood and Least Squares (0) | 2021.03.29 |
---|---|
2-1. Linear Models for Regression (0) | 2021.03.29 |
1-5. Introduction to Classification Problems (1) | 2021.03.26 |
1-4. Decision Theory (0) | 2021.03.26 |
1-3. Introduction to Model Selection (0) | 2021.03.26 |