[최적화] 모델 경량화 , AutoML , Pruning , Knowledge Distillation , Tensor Decomposition , Quantization , Compiling
딥러닝 모델 경량화를 위한 다양한 기법을 간단히 소개합니다. 경량화 기법 중 AutoML에 초점을 둘 것이며, AutoML에 대한 자세한 내용은 여기를 참고해주세요. 1. 경량화 목적 On device AI smart phone, warch 등 IoT devices Limitation : Battery, RAM, Storage, Computing power AI on cloud(or server) on device AI에 비해 배터리, 저장공간, 연산능력 등의 제약은 줄지만, 같은 자원으로 더 적은 latency(한 요청의 소요 시간)와 더 큰 throughput(단위 시간당 처리 가능 요청 수) Computation as a key component of AI progress 시간이 지날 수록 AI 모..
2021. 11. 22.