IT Insight

인간처럼 추론하는 인공지능의 등장!

2018.02.19 09:30

추론 영역은 오랫동안 인간의 고유 영역이라고 여겨지며 기계적으로는 구현하기에 매우 어려운 분야 중 하나였습니다. 수많은 정보를 단순히 조합해 검색, 추천 기능으로 구현하는 것은 가능했으나 주어진 정보로 새로운 명제를 도출하는 추론(Inference•Reasoning) 과정을 기계적으로 구현하는 것은 매우 어려웠습니다.



텍스트, 이미지 등으로 주어지는 정보를 인식해 정보의 문맥적 의미를 이해하는 것은 기본이고 같은 정보라도 상황별로 변화하는 문맥적 관계를 스스로 이해하는 과정이 요구되기 때문이죠. 하지만 최근 발전된 딥러닝, 그중 학습 알고리즘의 진화로 인해 추론 분야의 인공지능도 빠르게 연구, 개발되고 있습니다.


인공지능 분야의 혁신 스타트업 중 하나인 메타마인드(MetaMind)[각주:1]는 추론 문제를 해결하는 인공지능을 구현한 논문[각주:2]을 발표했습니다. ‘Ask me Anything’이라는 논문 제목처럼 메타마인드의 인공지능은 텍스트로 제공된 다양한 정보를 이해하고 조합해 추론 유형의 질문에 답하는 방식입니다.

 

아래와 같이 우유(Milk)의 위치가 전제들 속에 직접 주어지지 않지만, 우유를 가지고 있는 사람이 위치한 곳에 우유가 위치한다는 정보를 유추해 우유의 위치를 추론해 냅니다. 사람의 관점에서는 매우 단순한 문제로 보일 수 있지만, 인공지능의 관점에서는 텍스트로 주어진 수많은 정보 중 질문과 연관성이 있는 정보만을 선별적으로 인지하고 문맥적 관계를 유추해내야 하므로 매우 어렵습니다.


l 추론 문제 유형


물론 이러한 추론 기능을 수행하는 인공지능은 과거부터 구현됐지만 상당한 수준 인간의 개입이 요구되고 성능 또한 큰 한계를 가지고 있었습니다. 그 예로 구글의 지식 그래프(Knowledge Graph), 애플 시리(Siri)의 기반이 되는 울프럼 알파(Wolfram Alpha), IBM의 Deep Q&A 등과 같은 주요 IT 기업들이 방대한 데이터를 활용해 추론을 기반으로 개발한 지능형 서비스들이 있습니다.


위의 시스템들은 인간의 질문에 대해 엄청난 데이터 속에서 질문과 연관성 있는 정보들을 분석하고 조합해 답을 합니다. 질문에 대한 답이 직접적으로 데이터에 존재하지 않더라도 부분 정보들의 조합을 통해 답을 찾아간다는 점에서 추론에 해당한다고 할 수 있지만 이러한 시스템들을 구현하기 위해서는 많은 인간의 관여가 필요합니다.


데이터가 구조화된 형태로 저장되어야 하며 이들 간의 관계 등이 전문가에 의해 사전에 정교하게 정의되어야 합니다. 따라서 복잡한 수준의 문제나 미리 정의되지 않은 문제의 유형에 대해서는 답을 하기 어려웠습니다.


최근 딥러닝 기반의 추론 방식은 과거와 달리 인간의 개입을 최소화하며 인공지능이 스스로 정보의 문맥적 의미를 이해해 추론해 낸다는 점에서 크게 다릅니다. 이것이 가능한 이유로 크게 세 가지 요인이 작용했는데요. 딥러닝을 통한 인공지능의 언어 분야의 ‘인지•이해’ 발전입니다.


특히 개별 단어 단위가 아닌 구문 단위의 함축된 의미가 word2vec, GloVe, Fasttext와 같은 단어 세트(Word Embedding)를 통해 분석됩니다. 또한, Attention, LSTM과 같은 딥러닝 분야의 알고리즘 고도화를 통해 인공지능은 이제 긴 문장, 여러 문단으로 구성된 텍스트를 처리하면서도 답을 찾기 위해 중요한 정보를 선별적으로 집중하거나 기억해 추론과정에 활용하게 됩니다.


마지막으로 추론 과정을 학습할 수 있는 학습용 데이터가 주요 연구기관 및 기업들에 의해 공개되고 있습니다. 마이크로스프트(Microsoft)에 의해 인수된 말우바(Maluuba)는 CNN 뉴스를 활용해 추론 형태의 Q&A 데이터 세트를 만들어 공개하고 있습니다.


위 이미지와 같이 텍스트 형식의 CNN 뉴스와 추론형 문제를 하나의 세트로 제공하며 약 12만 개에 이르는 문제로 구성되어 있습니다. Facebook은 약 20개에 이르는 다양한 형태의 추론형 Q&A 데이터 세트를 공개하고 있습니다. 단순한 연역법, 귀납법에서부터 경로•위치, 추론 등과 같이 다양한 난이도의 문제를 포함하며 약 2만 개의 데이터 세트로 구성되어 있습니다.


이외 스탠퍼드대의 SQuAD(10만 개), 마이크로소프트의 MACRO 등 다양한 기관의 추론형 데이터 세트가 공개되고 있습니다. 특히 스탠퍼드와 마이크로소프트는 데이터 세트를 공개하면서 연구자, 개발자들이 자신들의 인공지능 성능을 경쟁할 수 있는 경진대회[각주:3]를 운용 중이며 매우 다양한 연구 단체들이 참여하며 실시간으로 순위가 바뀌면서 인간의 추론 능력에 가까워지고 있습니다.


 인간과 같은 추론 방식의 등장: Relational Network


딥마인드(DeepMind)는 지난 6월 관계 네트워크(Relational Network)라는 논문[각주:4]을 발표했습니다. 관계형 추론(Relational Reasoning)이 가능한 인공지능을 구현한 논문으로 인공지능 학계에서는 올해 가장 혁신적인 논문 중 하나로 꼽히고 있습니다. 인공지능이 인식된 객체(영상•이미지, 텍스트)에 대해 서로 간의 상대적인 관계를 추론하는 것이 가능하다는 것으로서, 인공지능의 추론 과정이 이제 인간과 같은 유사한 방식으로 구현 가능하다는 것을 의미합니다.


l 관계형•비관계형 추론


관계형 추론이 가능한 인공지능을 구현하기 어려운 것은 단순히 개별적인 정보들을 인식하고 이해하는 것을 넘어 각 정보 사이의 상대적인 관계를 파악해 논리적 결론에 도달해야 하기 때문입니다.


예를 들어 위와 같은 이미지를 보았을 때 기존 이미지 인식 지능에 기반한 인공지능은 단순히 나무의 개수는? (네 그루), 색깔은? (초록, 갈색), 모양은? (타원형, 마름모형)과 ‘비관계형 질문(Non-relational Question)에만 높은 정확도로 응답할 수 있지만 “나무 간의 높이 차이가 가장 큰 나무들 중 오른쪽에 위치한 나무의 모양은?”과 같은 ‘관계형 질문(Relational Question)’에는 쉽게 답을 하지 못합니다. 인식된 객체 간의 관계가 명확히 이해되어야만 답을 찾을 수 있기 때문이죠.


이러한 관계형 질문에 대해 딥마인드가 발표한 인공지능은 단번에 인간의 정확도를 뛰어넘었는데요. CLEVR 데이터 세트[각주:5]는 아래와 같은 이미지 내 사물들에 대한 매우 복잡한 관계에 대해 답을 하는 Q&A 데이터 세트입니다.


인공지능으로 구현한 알고리즘 정확도에서 기존 방식의 최고 성능은 68.5%로써 인간의 정답률인 92.6%에 크게 미치지 못했습니다. 하지만 딥마인드의 관계형 네트워크 기반의 인공지능은 단 한 번에 정답률 95.5%를 달성하며 인간 수준을 초월했습니다.


l 관계형 추론 테스트를 위한 문제(CLEVR)


딥마인드의 또 다른 논문[각주:6]에서는 이러한 관계형 추론에서 한발 더 나아간 예측까지 가능한 인공지능을 제안했습니다. 논문에서 제안된 인공지능은 사물의 움직이는 패턴을 학습합니다.


사물들이 서로 부딪히며 움직이는 각도, 속도가 지속해서 변화하는 패턴을 학습해 향후의 움직임을 추론해 예측하는 것이죠. 논문에 따르면 약 6프레임의 움직임을 학습해 향후 200프레임의 향후 움직임을 예측했을 때 150프레임까지는 실제와 거의 일치하는 수준으로 예측하는 것으로 나타났습니다.


상호 관계의 관찰에 기반한 예측•추론


이러한 딥마인드의 두 논문은 인간 수준의 추론이 가능한 인공지능 구현의 첫 시작으로 평가받고 있습니다. 단순히 방대한 데이터 속에서 인간보다 빠르고, 정확하게 답을 찾는 것이 아니라 인간처럼 사물, 정보 등에 대해서 사람처럼 생각하며 추론하는 것이 가능해진 것을 의미합니다. 미리 정의된 관계를 학습하는 것에서 그치지 않고 인간과 같이 유연한 사고가 가능해지는 것이기도 하죠. 이러한 추론 분야의 발전은 향후 다양한 산업에 큰 영향을 미칠 것으로 전망됩니다.


예를 들어 지능형•자율주행 관련 인공지능 구현에 있어 기존에는 단순히 차간 거리, 속도, 장애물의 위치, 표지판•신호등 등과 같은 비관계형 정보를 기반으로 주행 관련 지능이 구현되었습니다. 하지만 관계형 지능이 적용된다면 지속해서 차선을 급격하게 변경하는 자동차의 향후 주행 패턴을 추론•예측하여 주의하거나, 초보 운전 차량과 같이 주의가 요구되는 차량의 움직임을 추론해 회피하는 등의 기능을 구현할 수 있게 되는 것입니다.


이러한 관계형 지능은 앞으로 인간과 같은 추론 역량을 기반으로 자동차 산업뿐만 아니라 제조 공정, 금융, 보안 등 매우 다양한 분야에 적용할 수 있을 것으로 예상됩니다.


글 | 이승훈 책임연구원(shlee@lgeri.com) | LG경제연구원


* 해당 콘텐츠는 저작권법에 의하여 보호받는 저작물로 LG CNS 블로그에 저작권이 있습니다.

* 해당 콘텐츠는 사전 동의 없이 2차 가공 및 영리적인 이용을 금하고 있습니다.



  1. 딥러닝의 3대 핵심 연구자 중 하나인 Andrew Ng의 제자, Richard Socher가 설립, Salesforce에 인수(약 350억원, 2016년) [본문으로]
  2. A. Kumar, et al. Ask me Anything: Dynamic Memory Networks for Natural Language Processing , ICML 2016 [본문으로]
  3. https://rajpurkar.github.io/SQuAD-explorer/ [본문으로]
  4. A. Santoro, et al, A simple neural network module for relational reasoning, 2017. 6 [본문으로]
  5. CLEVR Data Set: 70,000개의 이미지와 699,989개의 관계•비관계형 추론 QA를 담은 Dataset(Stanford Univ.) [본문으로]
  6. N. Watters, et al, Visual Interaction Networks, 2017.6 [본문으로]
Posted by IT로 만드는 새로운 미래를 열어갑니다 LG CNS
위로