토니의 연습장

F1 Score: Precision과 Recall의 조화 평균 본문

AI 일반/AI 면접 대비 기출문제

F1 Score: Precision과 Recall의 조화 평균

bellmake 2025. 3. 12. 17:55

📌 F1 Score란?

F1 Score는 **Precision(정밀도)**과 **Recall(재현율)**의 **조화 평균(harmonic mean)**으로 계산되며, 불균형한 데이터셋에서 모델의 성능을 평가할 때 중요한 지표입니다.

F1=2×Precision×RecallPrecision+RecallF1 = \frac{2 \times \text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}}

이 공식은 Precision과 Recall을 균형 있게 반영하여, 둘 중 하나가 너무 낮을 경우 전체 점수도 낮아지도록 설계되었습니다.


🚀 Precision (정밀도)

Precision=TPTP+FP\text{Precision} = \frac{\text{TP}}{\text{TP} + \text{FP}}

  • TP (True Positives): 실제로 긍정 클래스인데 모델도 긍정으로 예측한 개수
  • FP (False Positives): 실제로 부정 클래스인데 모델이 긍정으로 예측한 개수

즉, Precision은 모델이 "긍정 클래스"라고 예측한 것들 중에서 실제로 맞은 비율을 의미합니다.

Precision이 중요한 경우

  • 잘못된 긍정 예측이 치명적인 경우 (예: 스팸 필터에서 정상 메일을 스팸으로 분류하면 안 됨)

🔥 Recall (재현율)

Recall=TPTP+FN\text{Recall} = \frac{\text{TP}}{\text{TP} + \text{FN}}

  • FN (False Negatives): 실제로 긍정 클래스인데 모델이 부정으로 예측한 개수

즉, Recall은 "실제 긍정 클래스" 중에서 모델이 맞게 찾아낸 비율을 의미합니다.

Recall이 중요한 경우

  • 놓치는 긍정 예측이 치명적인 경우 (예: 암 진단에서 암 환자를 ‘정상’으로 예측하면 큰 문제 발생)

🎯 F1 Score의 핵심

1️⃣ 조화 평균을 사용하는 이유

  • 단순 산술 평균보다 Precision과 Recall의 작은 값에 더 민감합니다.
  • Precision과 Recall이 비슷할 때는 높은 값을 갖지만, 둘 중 하나가 낮으면 전체 점수도 낮아집니다.
  • 모델이 한쪽(Precision/Recall)에 너무 치우치지 않도록 균형 잡힌 평가를 제공합니다.

2️⃣ 극단적인 예제

모델PrecisionRecallF1 Score

A 1.0 0.1 0.18
B 0.1 1.0 0.18
C 0.8 0.8 0.8

→ Precision과 Recall 중 하나가 극단적으로 낮으면, F1 Score도 낮아집니다.


📍 결론: Precision vs Recall, F1 Score를 언제 사용해야 할까요?

  • Precision이 중요한 경우 → F1 Score보다는 Precision을 직접 확인 (예: 스팸 필터, 추천 시스템)
  • Recall이 중요한 경우 → F1 Score보다는 Recall을 직접 확인 (예: 질병 진단, 보안 시스템)
  • Precision과 Recall 간의 균형이 중요한 경우 → F1 Score 사용 (예: 문서 분류, 음성 인식)

즉, F1 Score는 Precision과 Recall이 비슷한 중요도를 가질 때 최적의 성능 지표입니다! 🚀

'AI 일반 > AI 면접 대비 기출문제' 카테고리의 다른 글

Transformer 요약  (0) 2025.03.15
ML/AI 엔지니어 면접 문항 총정리  (0) 2025.03.12
SGD와 Adam 차이  (1) 2025.03.08
Gradient descent  (0) 2025.03.08