딥러닝개발자
딥러닝코리아
딥러닝개발자
전체 방문자
오늘
어제
  • 전체글 (2)
    • 파이썬 기초 (1)
    • 데이터 사이언스 (0)
    • 머신러닝·딥러닝 (1)
    • 알고리즘·코딩 테스트 (0)
    • 논문 리뷰 (0)
    • 수학 (0)
    • 테크 칼럼 (0)

블로그 메뉴

  • 홈
  • 태그
  • 방명록

공지사항

인기 글

태그

  • 파이썬
  • Python Tutor
  • 검증 정확도
  • 딥러닝
  • Deep Learning
  • 선택 정렬
  • training accuracy
  • 학습 그래프
  • learning graph
  • 데이터 증강
  • validation accuracy
  • python
  • 파이썬 튜터
  • 학습 정확도
  • Selection Sort
  • Data Augmentation

최근 댓글

최근 글

티스토리

hELLO · Designed By 정상우.
딥러닝개발자

딥러닝코리아

[딥러닝] training accuracy보다 validation accuracy가 높은 경우?
머신러닝·딥러닝

[딥러닝] training accuracy보다 validation accuracy가 높은 경우?

2022. 8. 29. 22:00

딥러닝 모델을 학습시킬 때 오버피팅을 방지하고, 모델 정규화를 위해 training data와 validation data를 분리하여 사용하곤 합니다. 

 

통상 training accuracy가 validation accuracy보다 높은 경우가 많지만, 아래 그림과 같이 training accuracy보다 validation accuracy가 더 높은 상황이 발생합니다.

 

이 같은 상황은 대부분 모델 학습 과정에 적용한 데이터 증강으로 인해 모델 판별의 난이도가 증가하여 일어납니다.

 

이 경우 training accuracy와 validation accuracy 간의 간극을 좁히기 위해서 두 가지 전략을 취해볼 수 있습니다.

  1. 모델 학습에 적용된 data augmentation을 validation 과정에도 적용한다.
    → 이 경우 validation accuracy가 상대적으로 낮아지게 되면서, 두 accuracy 간 차이가 감소합니다.
  2. 모델 학습에 적용된 data augmentation을 제거한다.
    → 이 경우 training accuracy가 상대적으로 높아지게 되면서, 두 accuracy 간 차이가 감소합니다.

그러나 위에 제시된 두 극단의 방안 중 반드시 한 가지를 택해야 하는 것은 아닙니다.

 

모델 학습에 적용한 data augmentation을 검토해보고, 데이터 셋과 적용 도메인에 적합한지를 판단하여 data augmentation의 수준(예: 이미지의 회전 각도 등)을 조절하면 보다 이상적인 learning graph를 얻을 수 있습니다.

    딥러닝개발자
    딥러닝개발자

    티스토리툴바