Edge AI 강의 노트

Edge AI

모델 경량화 (Model Compression)

  • SW적으로 Edge AI를 달성하는 것을 배운다.
  • 모델 경량화 기법:
    • 모델 구조 최적화
    • 가지치기 (Pruning)
    • 양자화 (Quantization)
    • 지식 증류
모델 구조 최적화
  • Depthwise Convolution
Depthwise Separable Convolution
  • Depthwise convolution을 적용한 이후 1x1 convolution을 다시 적용하여 값들을 서로 섞는다.
  • 2단계로 나눠서 처리하는 방식.
  • 채널의 출력 수 만큼 연산량이 줄어든다.
  • 각 채널들은 다른 입력 채널의 값을 알지 못하기 때문에 기존 Convolution보다는 성능이 떨어진다.
MobileNet
  • Google에서 제안한 CNN 구조
  • 모바일 및 임베디드 환경에서의 실시간 추론을 목표로 설계
  • [Depthwise + Pointwise] 블록 구조

Pruning (가지치기)

  • Pruning + Fine-tuning 적용하면 기존 모델의 10%만 사용해도 기존의 성능을 낼 수 있다.
  • 작은 가중치 값은 모델에 기여도가 낮기 때문에 제거한다.

Tiny ML