토니의 연습장
F1 Score: Precision과 Recall의 조화 평균 본문
📌 F1 Score란?
F1 Score는 **Precision(정밀도)**과 **Recall(재현율)**의 **조화 평균(harmonic mean)**으로 계산되며, 불균형한 데이터셋에서 모델의 성능을 평가할 때 중요한 지표입니다.
F1=2×Precision×RecallPrecision+RecallF1 = \frac{2 \times \text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}}
이 공식은 Precision과 Recall을 균형 있게 반영하여, 둘 중 하나가 너무 낮을 경우 전체 점수도 낮아지도록 설계되었습니다.
🚀 Precision (정밀도)
Precision=TPTP+FP\text{Precision} = \frac{\text{TP}}{\text{TP} + \text{FP}}
- TP (True Positives): 실제로 긍정 클래스인데 모델도 긍정으로 예측한 개수
- FP (False Positives): 실제로 부정 클래스인데 모델이 긍정으로 예측한 개수
즉, Precision은 모델이 "긍정 클래스"라고 예측한 것들 중에서 실제로 맞은 비율을 의미합니다.
⚡ Precision이 중요한 경우
- 잘못된 긍정 예측이 치명적인 경우 (예: 스팸 필터에서 정상 메일을 스팸으로 분류하면 안 됨)
🔥 Recall (재현율)
Recall=TPTP+FN\text{Recall} = \frac{\text{TP}}{\text{TP} + \text{FN}}
- FN (False Negatives): 실제로 긍정 클래스인데 모델이 부정으로 예측한 개수
즉, Recall은 "실제 긍정 클래스" 중에서 모델이 맞게 찾아낸 비율을 의미합니다.
⚡ Recall이 중요한 경우
- 놓치는 긍정 예측이 치명적인 경우 (예: 암 진단에서 암 환자를 ‘정상’으로 예측하면 큰 문제 발생)
🎯 F1 Score의 핵심
1️⃣ 조화 평균을 사용하는 이유
- 단순 산술 평균보다 Precision과 Recall의 작은 값에 더 민감합니다.
- Precision과 Recall이 비슷할 때는 높은 값을 갖지만, 둘 중 하나가 낮으면 전체 점수도 낮아집니다.
- 모델이 한쪽(Precision/Recall)에 너무 치우치지 않도록 균형 잡힌 평가를 제공합니다.
2️⃣ 극단적인 예제
모델PrecisionRecallF1 Score
A | 1.0 | 0.1 | 0.18 |
B | 0.1 | 1.0 | 0.18 |
C | 0.8 | 0.8 | 0.8 |
→ Precision과 Recall 중 하나가 극단적으로 낮으면, F1 Score도 낮아집니다.
📍 결론: Precision vs Recall, F1 Score를 언제 사용해야 할까요?
- Precision이 중요한 경우 → F1 Score보다는 Precision을 직접 확인 (예: 스팸 필터, 추천 시스템)
- Recall이 중요한 경우 → F1 Score보다는 Recall을 직접 확인 (예: 질병 진단, 보안 시스템)
- Precision과 Recall 간의 균형이 중요한 경우 → F1 Score 사용 (예: 문서 분류, 음성 인식)
즉, F1 Score는 Precision과 Recall이 비슷한 중요도를 가질 때 최적의 성능 지표입니다! 🚀
'AI 일반 > AI 면접 대비 기출문제' 카테고리의 다른 글
Transformer 요약 (0) | 2025.03.15 |
---|---|
ML/AI 엔지니어 면접 문항 총정리 (0) | 2025.03.12 |
SGD와 Adam 차이 (1) | 2025.03.08 |
Gradient descent (0) | 2025.03.08 |