뉴스센터

카테고리

리포트

검색

[정보통신기획평가원] 강화학습 연구 및 융합 기술 동향

테크포럼: 2021-04-01 11:14:36

https://www.techforum.co.kr/bbs/report/109070 URL COPY

강화학습은 제어를 위한 의사결정이 필요한 시스템 환경(Environment)에서 상태 변화에 따른 단일 혹은 다중 에이전트(Agent)의 반복적 행동과 이에 따른 보상(Reward) 학습을 기반으로 시스템 최적 제어를 달성하기 위한 인공지능(AI) 지능학습 단계인 기계학습(Machine Learning) 알고리즘이다. 강화학습은 일반적으로 시스템(시뮬레이션) 환경에서 에이전트(Agent)의 행동에 따라 잘 설계된 보상함수(Reward Function)를 통해 최적값을 형성되기 때문에 보상함수를 설계에 많은 시간과 노력이 필요하며 실제 환경에 적용하기 위한 한계점이 많다. 따라서 최근 이러한 문제점을 극복하고 개선하기 위해 진행되고 있는 새로운 연구 기술에 대해 살펴보고, 이와 함께 최근 제시되고 있는 융합 기술(Convergence of Application Skill)의 사례들에 대해 살펴보기로 한다.

[원문보기]

출력

SNS 공유 Twitter Facebook

테크포럼(주).

대표: 김서원

서울특별시 금천구 가산디지털1로 196 (가산동) 1206

고객센터: 070-7169-5396

사업자등록번호: 119-86-81577

통신판매신고번호: 제2014-서울금천-0056호