IT Solutions/Mobile

UX 관점에서 본 챗봇과 음성봇

2018.11.22 09:30

지난 13편에서 챗봇과 음성봇이 공통적인 영역이 존재하여 매우 밀접한 관련이 있음을 구조적으로 설명 드렸습니다.


음성인식 기반의 AI 서비스를 제공하는 데 있어서 챗봇은 핵심적인 역할을 하는 것이죠. 그러므로 둘을 별도로 떼어놓고 볼 필요가 없다고 생각합니다. 그래서 이번 글에서는 챗봇과 음성봇을 기반으로 서비스를 구현할 경우 UX 관점에서 고려해야 할 몇 가지 체크 포인트를 써보겠습니다.


 UX 체크 포인트 1. 인공지능 기술도 중요하지만 대화맥락을 구현해야 합니다.


인공지능(AI) 기술에 대한 기대가 높아지고 실제 높은 수준의 AI 기술이 제공되면서 챗봇이나 음성봇의 제공에 있어서 생긴 오해 중의 하나가 서비스를 구현할 때 음성인식이나 자연어 처리 기술만 있으면 된다는 오해가 존재합니다. 물론 음성인식과 자연어 처리는 당연히 높은 수준으로 제공되어야 우리가 기대하는 많은 지능형 서비스가 구현될 수 있습니다.


그런데 챗봇과 음성봇 서비스에서 주의할 점은 바로 대화맥락을 구현하는 것도 매우 중요합니다. 한 예를 들어 AI 스피커에 “올해 한글날이 무슨 요일이야?”라고 물으면 AI는 자체 보유한 DB에서 “화요일입니다”라고 대답을 들려줍니다. Q&A의 전형적인 모델이죠. 그런데 사람의 대화는 이것보다 더 복잡하게 전개됩니다. 더 궁금해서 “그럼 내년은? 내후년은? 10년 후는?”이라는 조건을 물어볼 수 있죠. 물론 이 또한 알고리즘을 구현하여 요일을 쉽게 답변할 수도 있습니다.


그런데 직장인이라면 더 복잡한 “그럼 징검다리 연휴야?”라는 우발적인 질문을 던지게 됩니다. 이때 이러한 대화맥락 시나리오가 구현되어 있지 않으면 “ 죄송해요…”라는 사과의 말을 내뱉게 됩니다. AI 스피커를 통해 이뤄지는 사용자들의 수많은 대화 맥락을 AI 스피커 제공사업자들이 모두 서비스로 구현할 수 없기에 소비자 불만족이라는 기사들이 쏟아지게 되는 이유이기도 하죠.


  

물론 복잡한 대화맥락을 촘촘히 설계하여 구현할 수도 있을 것입니다. 그런데 사용자는 대화의 흐름에 있어서 복합 조건을 동시에 발화하거나 대화를 이어나가는 도중 우발적인 질문으로 넘어가는 경우가 있습니다. 예를 들어 카페에서도 바닐라 커피를 주문하려다가 모바일 기프티콘의 유효기간을 물어볼 수도 있고, 영업시간이 몇 시까지인지 묻는 경우도 있죠.

 

이렇게 복잡한 대화맥락을 기획자가 모두 고려하여 구현할 수 있다면 좋겠지만 기대가 큰 만큼 실망도 클 수밖에 없기에 대대적으로 홍보를 했던 AI 서비스들이 실패(?)라는 오명을 쓰게 된 것도 이런 구조적인 이유 때문입니다.


 UX 체크 포인트 2. 의도 지향적 서비스일수록 대화맥락을 구성하기가 쉬워집니다.


그렇다고 해서 모든 챗봇 서비스가 동일한 상황에 놓인 것은 아니죠. 필자의 판단으로는 이용자들이 서비스를 이용하는 데 있어서 얼마나 의도 지향적인가에 따라 서비스 구현의 승패가 결정된다고 생각됩니다.


주문하려거나 요금제를 변경하려는 것과 같이 사용자가 반드시 해결(?)해야 할 목적성을 가진 봇일수록 예상할 수 있는 충분한 대화맥락을 사전에 기획할 수 있고 이를 서비스를 제공하면서 지속적으로 정확도를 개선할 수 있죠. 이렇게 의도 지향적인 서비스를 타로챗봇과 같이 기능형 봇(Function bot)이라고 보시면 될 듯합니다.



그런 면에서 볼 때 가정에 보급된 AI 스피커는 의도가 상당히 분산된 서비스입니다. 일기예보에서 뉴스까지 콘텐츠의 범위도 폭넓을뿐더러 사용자층도 매우 상이하여 그들이 의도하는 바를 특정 사업자가 모두 처리해준다는 것은 사실상 어불성설에 가깝다고 봅니다.


AI 스피커 사업자도 모든 것을 다 해주는 인공지능 스피커로 마케팅을 하는 것 보다 특정한 의도를 잘 처리할 수 있는 기능형 AI 스피커로 포지션을 옮겨야 비즈니스가 제대로 될 것이라 개인적으로 생각됩니다.


 UX 체크 포인트 3. 음성은 구조적으로 되물을 수 밖에 없습니다.


라디오 광고를 들어보면 TV 광고와 다르게 “OO에요. 제가 이번에..” 와 같이 광고 모델의 이름을 먼저 거론하는 게 나옵니다. 오로지 음성만으로 이뤄지는 라디오 광고 모델은 음성 AI 서비스를 제공하는 데 있어서 시사하는 점이 많습니다. 바로 육성만으로는 광고 모델이 누구인지 쉽게 알 수 없어서 제품과 모델의 신뢰성을 위해 실명을 언급하는 것이죠.


음성봇은 이런 측면에서 시각적으로 제공되는 챗봇에 대비해 한계를 가질 수밖에 없습니다. 사용자들이 귀담아듣지 않으면 전혀 기억을 못하게 될 수 있어서 되물어보는 상황이 생기게 됩니다.


또한, 아직은 음성인식 기술이 완벽하지 않아 음성에서 텍스트로 변환되는 과정(Speech-to-Text)과 자연의 의도 이해(Natural Language Understanding) 과정에서 오차가 생길 가능성이 존재합니다. 그래서 기계가 잘 인식했는지 사용자에게 컨펌(Confirm)받는 과정이 부득이하게 생길 수밖에 없죠.


그런데 문제는 이렇게 매번 컨펌(confirm)을 받다 보면 사용자가 원하는 바를 정확하게 처리할 수 있지만, 단계가 너무 늘어나는 문제가 발생하게 됩니다. 그러다 보면 음성인식 서비스로서의 강점을 발휘하지 못하게 되죠.


그런 문제를 해결하기 위해 AI 스피커 사업자들은 음성 주문 서비스를 제공할 때 배송지 정보나 결제정보를 미리 지정해둔 기본정보로 처리하게 해두었죠. 주문 가능한 상품에 대한 제약을 두는 경우도 있습니다. 이 또한 사용자가 해당 정보를 음성으로 쉽게 변경하기 어렵고 특정 결제 수단만 써야 하는 제약으로 인해 서비스 이용에 있어서 큰 제약으로 작용하고 있습니다.


l 음성봇은 STT 및 NLU 과정에서의 오차로 인해 사용자 선택을 되물어보는 컨펌을 거치는 한계를 가지고 있다.


 UX 체크 포인트 4. 비동기화의 문제는 음성봇이 해결해야 할 기술적 난제이다.


비동기화의 의미를 이해하려면 우리의 대화를 살펴볼 필요가 있습니다. 친구나 가족과 대화할 때 상대방이 말을 한 후 대화를 이어가는 경우도 있지만, 상대방이 말을 하는 동시에 자신도 말을 할 수 있죠.


상대방의 말을 들으면서 말을 해도 우리는 대화를 이해하게 됩니다. 그렇지만 현재의 음성 AI는 화자와 청자가 명확하게 비동기화되는 기술적 한계를 보유하고 있습니다. 아무래도 상대의 말을 소음으로 인식하게 되어 정확한 인식이 되지 않기 때문에 별도의 청각 모드(Listen mode)를 제공하여 정확하게 인식시키기 위한 것이죠.



그런데 실제 연속적인 대화를 할 경우 이 청각 모드(Listen mode)가 UX를 방해하는 느낌을 받게 됩니다. 1~2초의 짧은 대기 상태도 길게 느껴져 답답함을 주게 되죠. 하드웨어의 성능이 높아지고 망 속도가 빨라지면 이러한 대기 상태의 시간은 사람이 느끼지 못할 정도로 줄어들게 되겠지만 여전히 말하는 것과 동시에 듣는 것은 당분간은 사람만이 가능하지 않을까 생각됩니다.


 UX 체크 포인트 5. 음성봇은 정말 사람과의 대화처럼 만들 수 있다.


그럼에도 음성봇은 챗봇에 대비해서 우월한 요소가 존재하죠. 바로 음성합성(TTS) 기술의 발전입니다. 최근 들어 네이버나 구글과 같은 AI 사업자는 특정인의 목소리나 운율로 음성을 재생할 수 있는 인공지능 기술을 내놓고 있습니다. 마치 실제 사람과 대화하듯 목소리나 톤이 자연스럽게 나오는 기술이 나날이 발전되고 있는 것이죠. 이러한 음성합성의 기술 진화는 감정의 전달이 가능하게 만들어 정서적인 서비스를 제공하게 할 것입니다.


챗봇 기술과 음성봇 기술은 구조적으로 닮은 점도 많을뿐더러 UX 적으로 상호보완될 수 있습니다. 그래서 AI 스피커 사업자들이 점차 음성만 지원되던 스피커에서 디스플레이를 갖춘 스피커를 도입하고 있는 것이죠. 최근에 여러분들이 광고를 통해 접하시는 구글 어시스턴트는 시각적인 챗봇과 음성의 보이스봇이 잘 융합된 서비스라고 볼 수 있습니다.



더불어 홀로그램을 통해 등장하는 지능형 아바타와의 일상적인 대화도 가능하겠죠. AI 인식 기술과 AR 기술, 홀로그램 기술의 결합은 현실에서 한계를 갖춘 로봇을 사이버 공간에서 무한한 능력을 갖춘 아바타로 재탄생시키지 않을까 생각합니다. 언젠가 다가올 미래겠죠?


글 l LG CNS 미래신사업담당



* 해당 콘텐츠는 저작권법에 의하여 보호받는 저작물로 LG CNS 블로그에 저작권이 있습니다.

* 해당 콘텐츠는 사전 동의 없이 2차 가공 및 영리적인 이용을 금하고 있습니다.



Posted by IT로 만드는 새로운 미래를 열어갑니다 LG CNS
위로