IT Insight

시각 인식 인공지능, 자율주행 기술 앞당긴다.

2018.09.20 09:30

2014년 이후 인공지능 분야는 딥러닝을 시작으로 매우 빠르게 진화하고 있습니다. 혁신적인 연구들이 경쟁적으로 출현하고 있는 가운데 이러한 연구들이 특정 산업 영역에 종속되지 않고 다양한 산업에 활용 가능한 범용 기술이라는 점이 더욱 큰 의미가 있는데요.


인공지능 연구를 선도하는 많은 연구 기관과 학계에서는 다양한 산업 중 응용 분야가 명확하고 활용 가치가 높은 자율주행 분야를 우선하여 탐색하고 있으며 실제 다양한 인공지능 분야의 연구가 자율주행 기능으로 빠르게 적용되고 있습니다.


다양한 인공지능 기술 중 시각 인식과 관련된 연구들은 매우 빠르게 자율주행 분야로 적용되고 있습니다. 이는 자율주행 기능의 가장 핵심 기술이 사물 인식 기술이기 때문인데요. 전방 충돌 방지, 차선 이탈 방지, 차간 거리 조절 등 지능형 주행 및 자율주행과 관련한 모든 기능을 구현하기 위해서는 주변 상황을 인식하는 것에서부터 시작하기 때문입니다.



물론 사물 인식 기술은 단순히 차량 주변의 물체를 감지하는 것을 넘어 인식된 사물의 종류를 판단하는 기술을 포괄적으로 의미합니다. 인식된 사물이 차량 인지, 표지판 인지 보행자 인지에 따라 전혀 다른 주행 제어 기능으로 연결되어 구현되기 때문입니다.


특히 자율주행 기술 분야의 인식 기술은 다양한 사물에 대한 높은 정확도의 인식과 이에 따른 실시간 처리가 필수적이기 때문에 기술 구현의 난이도가 매우 높습니다. 시각 정보에 기반해 운전하는 사람과 달리 자동차는 매우 다양한 정보를 복합적으로 활용해야 인식의 정확도와 속도를 보장할 수 있기 때문입니다.


l 기존 방법 vs. 딥러닝 기반 방법


모빌아이(Mobileye)와 같은 매우 소수의 기업이 카메라를 통해 수집된 정보만으로 전방의 차량 및 차선의 감지하거나 다양한 교통 표지판을 인식하는 기술을 구현하고 있으며, 그 외 대부분의 경우는 카메라를 통해 수집되는 정보와 레이더, 라이다, 초음파, 적외선 센서 등 매우 다양한 센서를 복합적으로 활용해왔습니다.


하지만 최근 빠르게 발전한 딥러닝 기반의 인공지능 기술은 이러한 기존 한계를 혁신적으로 극복하고 있는데요. 딥러닝을 활용한 시각 인식 지능은 이미 인간의 수준을 넘어서고 있습니다.


실제 인공지능을 통해 이미지 속 사물의 정확도를 측정하는 경진 대회인 ImageNet Challenge[각주:1]에서는 인간의 인식률을(94.90%) 추월했습니다. (지난 2015년 마이크로소프트가 96.43%의 정확도를 달성함. 2017년 정확도: 97.85%)


 l 이미지 인식 기술의 발전 (출처: ImangeNet Challenge 참조)


이렇게 발전된 인식 지능은 자율주행 기술 구현에 빠르게 적용되고 있습니다. 다양한 사물을 높은 정확도로 인식할 수 있게 한 기술은 주행 차량의 주변의 차량을 인식하고 종류를 분류하거나, 보행자를 인식하고, 각종 표지판을 인식해 그 의미를 인식하는 수준으로 구현되고 있습니다.


더 나아가 관련 연구 기관과 기업에서는 어두운 밤이나, 눈, 비가 내리는 기상 환경 아래서도 높은 정확도로 사물을 인식할 수 있는 기술로 발전시켜 나가고 있는 상황입니다. 실제 엔비디아(NVIDIA) 등 일부 기업들의 현재 구현되는 인식 관련 데모들은 인간의 시각으로는 인식하기 어려운 물체들을 인공지능이 더 높은 성능으로 인식해 내기도 합니다.


l 엔비디아의 차량 주행 영상 인식 기술(차량, 보행자, 표지판 인식, 분류, 눈, 흐린 날씨 차량 인식) 

(출처: nvdia.com)


단순한 인식 수준을 넘어 인공지능은 인식된 사물들의 의미를 이해하는 수준까지 발전하고 있습니다. 차량 주변의 사물들을 단순히 인식하는 수준을 넘어 보행자의 움직임, 차량의 진행 방향, 도로가 차도인지 인도인지 등과 같이 이미지 내 인식된 사물들의 문맥적 의미(Context Awareness)를 이해하게 되는 것입니다.


이러한 문맥적 의미를 이해하는 것은 인식된 사물에 따라 각기 다른 기능의 차량 제어 기술의 구현으로 이어진다는 점에서 매우 중요한 역할을 합니다. 과거에는 다양한 센서에서 복합적으로 수집된 정보를 종합적으로 분석해야 인식된 사물의 의미를 분석할 수 있어 OEM 및 일부 Tier 1 기업들만 제한적으로 자율주행 기능의 구현이 가능했습니다.


하지만 카메라 정보만을 통해 사물을 인식하고 이해하게 되는 것이 가능해지면서 인공지능 역량을 갖춘 새로운 기업들이 그 역할을 대신할 수 있게 되었습니다.


l AutoX 자율 주행 구현(밤, 낮, 시내, 고속도로 주행 데모) (출처: autox.ai)


실제 AutoX라는 신생 벤처 기업은 다른 센서에는 전혀 의존하지 않고 오직 카메라를 통해 입력된 영상만으로 주변 상황을 인식하고 자율주행 기능을 구현합니다. 6개의 카메라를 통해 입력되는 자동차 주변 환경 정보를 딥러닝으로 학습한 시각 지능이 마치 사람처럼 인지하고 자동차를 제어합니다.


AutoX의 창업자이자 프린스턴대 교수인 Xiao는 자율주행 분야의 전문가가 아닌 컴퓨터 비전(Vision) 분야의 전문가로서 해당 기술을 구현해 내고 있습니다. AutoX와 같은 딥러닝 기반의 비전 기술에 기반한 스타트업들이 최근 빠르게 등장하고 있는 상황입니다.


글 l 이승훈 책임연구원(shlee@lgeri.com) l LG경제연구원


* 해당 콘텐츠는 저작권법에 의하여 보호받는 저작물로 LG CNS 블로그에 저작권이 있습니다.

* 해당 콘텐츠는 사전 동의 없이 2차 가공 및 영리적인 이용을 금하고 있습니다.



  1. 스탠퍼드대에서 주관하는 영상인식 분야 경진대회로서 1,000가지 종류의 사물로 구성된 100만 장의 이미지가 무작위로 주어지며 각 이미지 속에 존재하는 사물의 종류를 알아맞히는 경쟁 [본문으로]
Posted by IT로 만드는 새로운 미래를 열어갑니다 LG CNS
위로