사용자의 요구사항에 따라 딥러닝 모델을 목표 하드웨어에서 실행 시 추론 속도를 높이거나 처리량 증가, 전력 효율 증대, 메모리 사용량 감소 등을 위해 딥러닝 모델을 최적화하는 기술
[원문보기]