Edge AI 강의 노트
Edge AI
모델 경량화 (Model Compression)
- SW적으로 Edge AI를 달성하는 것을 배운다.
- 모델 경량화 기법:
- 모델 구조 최적화
- 가지치기 (Pruning)
- 양자화 (Quantization)
- 지식 증류
모델 구조 최적화
Depthwise Separable Convolution
- Depthwise convolution을 적용한 이후 1x1 convolution을 다시 적용하여 값들을 서로 섞는다.
- 2단계로 나눠서 처리하는 방식.
- 채널의 출력 수 만큼 연산량이 줄어든다.
- 각 채널들은 다른 입력 채널의 값을 알지 못하기 때문에 기존 Convolution보다는 성능이 떨어진다.
MobileNet
- Google에서 제안한 CNN 구조
- 모바일 및 임베디드 환경에서의 실시간 추론을 목표로 설계
- [Depthwise + Pointwise] 블록 구조
Pruning (가지치기)
- Pruning + Fine-tuning 적용하면 기존 모델의 10%만 사용해도 기존의 성능을 낼 수 있다.
- 작은 가중치 값은 모델에 기여도가 낮기 때문에 제거한다.
Tiny ML