리포트

게시글 검색
[정보통신기획평가원] 강화학습 연구 및 융합 기술 동향
테크포럼
2021-04-01 11:14:36

강화학습은 제어를 위한 의사결정이 필요한 시스템 환경(Environment)에서 상태 변화에 따른 단일 혹은 다중 에이전트(Agent)의 반복적 행동과 이에 따른 보상(Reward) 학습을 기반으로 시스템 최적 제어를 달성하기 위한 인공지능(AI) 지능학습 단계인 기계학습(Machine Learning) 알고리즘이다. 강화학습은 일반적으로 시스템(시뮬레이션) 환경에서 에이전트(Agent)의 행동에 따라 잘 설계된 보상함수(Reward Function)를 통해 최적값을 형성되기 때문에 보상함수를 설계에 많은 시간과 노력이 필요하며 실제 환경에 적용하기 위한 한계점이 많다. 따라서 최근 이러한 문제점을 극복하고 개선하기 위해 진행되고 있는 새로운 연구 기술에 대해 살펴보고, 이와 함께 최근 제시되고 있는 융합 기술(Convergence of Application Skill)의 사례들에 대해 살펴보기로 한다.

 

 

[원문보기]

SNS 공유