시리(Siri)는 모바일 지능형 개인 비서로써 자연어 기반의 상호작용(interaction)을 기반으로 하고 있다. 애플은 2010년 4월 시리사를 인수할 후 뉘앙스의 음성 인식 솔루션을 적용하여 아이폰 4S의 출시와 함께 서비스를 시작했다. 현재 제공되는 서비스로는 일정/알람 설정, 메시지/메일 전송, 주식/날씨 조회 그리고 지도/정보 검색 이다. 향후 한국어를 포함한 다국어 버전과 항공 예약 및 티켓 구매 등의 상거래(Transaction) 서비스 확장 및 AppleTV의 리모컨 대용으로도 활용할 예정이다.
시리의 핵심기술은 음성 상호작용을 포함할 인공지능 분야의 지능형 인터페이스(Intelligent Interface) 또는에이전트 기술 (Agent Technology) 등이다. 아이폰 4S의 모바일 플랫폼은 이러한 인공지능을 구현하기에 충분할 컴퓨팅 파워와 캐시 메모리 등의 하드웨어 사양을 지원하고 있다. 시리는 단순한 음성인식 엔진이 아닌 학습, 추론 및 대화 능력을 갖춘 실행 (do) 엔진으로서, 1) 자연어 형태의 음성 입력 이해, 2) 사용자의 의도를 미리 정의한 온톨로지 기반의 도메인 모델에 기반한 추론, 그리고 3) 서비스 API의 연동을 통해 사용자가 원하는 대답을 찾아 준다. 이는 구글을 포함한 다른 음성검색엔진과는 차별화되는 부분으로 시리의 검색기술은 모바일 환경의 대중화와 더불어 차세대 검색 모델로서 새삼 주목 받고 있다.
최근 스마트폰의 확산으로 사용자의 IT 디바이스와의 상호작용이 모바일 환경으로 변화되고 있다. 이에 음성 인터페이스는 모바일 검색환경의 약점으로 지목되고 있는 키보드와 디스플레이의 불편함을 극복할 수 있는 중요 입출력 수단으로 인식되고 있다.
이에 따른 데이터의 트래픽이 폭증할 수 있는데 이는 글로벌 네트워크와 클라우드의 발전으로 지원되고 또한 사용자의 상호작용 정보를 끊임없이 모을 수 있게 된 덕분에 각 개인의 특징을 잘 이해할 수 있는 여건이 마력되었다. 이런 변화로 인해 시리와 같은 지능형 서비스를 제공할 수 있게 된 것이다. 본고에서는 시리의 핵심요소 중 하나인 지능형 음성 인터페이스에 대한 세부적인 기술 및 서비스 적용 분야 등에 대해 전반적으로 살펴보고자 한다.