본문 바로가기

기계 번역

상형문자도 풀어내는 AI의 능력! AI의 한계는? 우리는 매일 여러 방법으로 수많은 사람, 사물과 소통합니다. 만나서 직접 이야기를 하거나, 문자나 메신저, 채팅을 통해 이야기를 나눕니다. 심지어 컴퓨터와 프로그래밍 언어를 통해 소통합니다. 소통을 위해 글씨를 쓰기도 하고 수화 같은 몸짓으로 표현하기도 합니다. 일반적으로 사람은 언어라는 매개체를 통해 소통합니다. 전 세계적으로 매일 약 7,000개에 달하는 언어가 사용됩니다. 더욱 놀라운 사실은 7,000개의 언어는 역사적으로 알려진 언어의 1/4 정도밖에 되지 않는다는 것입니다. 약 3만 개 이상의 언어가 사용됐는데, 지금까지 3/4에 해당하는 언어가 사라졌고 앞으로도 언어는 계속 소멸할 것으로 예상합니다. 그렇다면 이미 사라진 과거의 언어는 어떻게 해석할 수 있을까요? 혹은 우리가 지금까지 확인할 .. 더보기
LG CNS, AI 기반 언어지능 연구에 박차를 가한다! 국내 대표 IT 기업인 LG CNS가 AI 언어지능 연구를 위한 질의응답 학습 데이터셋을 무료 공개하고 학회 저술 활동도 활발히 진행하는 등 AI 기반의 언어지능 연구 활동을 활발히 진행하고 있습니다. LG CNS가 공개한 KorQuAD란? LG CNS가 사이트(https://korquad.github.io)를 통해 공개한 KorQuAD 데이터셋은 질의응답(MRC;Machine Reading Comprehension) 과제를 위한 한국어 표준 데이터로, 인공지능이 한국어 질문에 대한 답변을 하기 위해서 필요한 학습 데이터입니다. KorQuAD 데이터셋은 1,550개의 Wikipedia article에 대해 10,649 건의 하위 문단과 크라우드 소싱을 통해 제작한 63,952개의 질의응답 쌍으로 구성되어.. 더보기