IT Life

이제는 공공 데이터도 누구나 쉽고 자유롭게 활용하는 시대! - 'LOD(Linked Open Data)'의 현재와 미래 -

2015.09.14 09:30

안녕하세요?  LG CNS 대학생 기자단 이민기입니다. 


최근 공공기관의 투명한 운영이 화두가 되면서 이를 개선하기 위한 방법으로 ‘LOD’의 도입이 주목을 받고 있습니다. LOD란 'Linked Open Data'의 줄임말로 우리나라에서는 '공공 데이터'로 불리는데요. 이러한 공공 데이터는 최근 IT 선진국에서 많이 사용되고 있다고 합니다. 공공 데이터는 현재 어떠한 역할을 하고, 우리에게 어떠한 편익을 주고 있을까요? 지금부터 함께 살펴보겠습니다.   


LOD(Linked Open Data)는 '연결 데이터 규격(Linked Data)'과 '데이터 개방(Open Data)'이 결합된 형태인데요. 즉 인터넷 상에서 데이터를 공유하고, 재사용 가능한 데이터를 개발하거나 활용하여  새로운 가치를 창출하는 개념이라고 볼 수 있습니다. 


좀 더 쉽게 말하자면 우리가 일상에서 쉽게 접할 수 있는 도서관이나 박물관 등의 공공 기관에서 다루는 데이터를 누구나 활용할 수 있도록 하는 것이죠. 그리고 이를 통해 다른 데이터를 재생산할 수 있도록 하는 것이 바로 'LOD'입니다.  


그렇다면 LOD의 현재 구축 현황은 어떠할까요? 그리고 어떠한 원칙을 바탕으로 구축되고 있을까요?


국제 사회의 추세를 따라 현재 우리나라 공공기관들은 투명한 운영을 위해 국민들이 접근하기 어려웠던 정보들을 보다 쉽게 접근할 수 있도록 공개하고 있습니다. 통계 자료 등의 여러 가지 자료들을 점진적으로 공개하고 있는 상황이죠.   


그 동안에는 정보 검색 시 불필요한 정보들 사이에서 필요한 정보를 골라내야 했는데요. 이제는 LOD 기반의 정보 시스템에서 데이터 간 연관된 정보를 활용하여 분석하기 때문에 더욱 정확한 정보를 검색할 수 있습니다. 


앞서도 잠시 언급했지만 국내의 공공 기업들은 운영의 투명성을 갖추고 공공 데이터 품질을 높이기 위해 LOD 구축을 시도하고 있습니다. 


<한국사 콘텐츠(http://contents.koreanhistory.or.kr)>


작년 4월, 미래창조과학부와 한국정보진흥원은 2013년 국가 DB 사업으로 LOD를 적용한 생물 정보 DB구축 및 한국사 DB 구축 사업을 완료했다고 밝혔는데요. 특히 한국사 DB는 국사편찬위원회, 한국학중앙연구원의 민족문화대백과사전, 문화재청의 유물•유적 데이터 등 국내 한국사와 관련된 자료를 통합하여 이용자들에게 정보의 접근성과 사용 편의성을 확보하여 제공하고 있습니다. 


<LOD 발행 서비스 (출처: 국사편찬위원회 한국사 LOD)>


한 예로 만약에 강감찬 장군에 관한 교육용 영상 콘텐츠를 제작하려면 그 동안에는 여러 개의 역사 기관 서비스에서 키워드를 입력하고, 관련 내용을 다운받아 사용해야 했습니다. 그러나 LOD를 이용하면 ‘강감찬’이라는 키워드와 관련된 분산된 연관 자료를 한 번에 검색할 수 있습니다. 


<수목원이 구축한 LOD 연계 정보 (출처: 2014 링크드 오픈 데이터 국내 구축 사례집)>


다음으로 생물 정보 DB는 국가 자연사 연구 종합 정보 시스템과 국가 생물종 지식 정보 시스템에 분산된 생물 정보를 통합하여 제공하며 접근성을 향상하였습니다. 또한 지금까지는 개별 DB 간 연계를 통한 검색이 쉽지 않았으나 LOD를 통해 상이한 DB 간의 정보 연동이 가능하게 되었는데요. 한국사 DB와 생물 정보 DB 간의 연동이 LOD로 인해 가능하게 되어 이제는 서로 연관된 정보도 제공받을 수 있습니다.


마지막 사례는 도서관인데요. 전세계적으로 LOD를 가장 많이 활용하는 공공 기관은 도서관입니다. 우리나라의 국립중앙도서관도 흐름에 맞추어 LOD를 활용하는 공공기관 중 하나인데요. ‘정부3.0’의 핵심 가치인 ‘개방•공유•소통•협력’을 위해 공공 정보의 적극적 개방과 공유를 언급하며, 국내 공공 기관의 LOD 도입 및 확산을 위해 노력하고 있습니다.  


그 중에서 국립중앙도서관은 도서관 관련 시스템 간에서만 활용되었던 정보 자원들을 많은 이용자들에게 개방하고 있는데요. RDF[각주:1]를 활용하여 공유하고 다양한 웹 자원과의 자유로운 연계를 통하여 도서관 및 웹 데이터를 더욱 풍성하게 만들고자 노력하고 있습니다. 그 결과 소장하고 있던 데이터 약 880만 건을 LOD 방식으로 제공하였습니다. 


지금까지 LOD의 정의, 구축 사례 등을 살펴보았는데요. LOD는 전세계적으로 붐을 일으키며 여러 국가의 공공기관을 시작으로 확장되고 있습니다. 그리고 현재는 공공기관뿐만 아니라 민간 기업까지 확대되어 더욱 폭넓은 데이터를 공유할 수 있게 되었는데요. LOD의 본래 취지였던 공공 데이터 품질의 향상을 뛰어넘어 이제는 사회적•경제적 가치가 높은 데이터 개방을 통해 다양한 비즈니스 창출에도 기여하고 있습니다. 


이러한 배경으로 세계 각국의 공공기관들은 이를 채택하여 활용하고 있죠. 우리나라 미래창조과학부 역시 이러한 트렌드에 맞춰 국립공원 탐방로, 위험 지역, 화장실, 야영장 정보 등 민간 활용 효과가 큰 데이터를 LOD 기반으로 변환하여 활용성을 높이기 위해 힘쓰고 있습니다.   


처음 LOD는 공공 데이터 품질 향상과 공공 기관의 투명한 운영을 위한 것이었지만, 이제는 점점 더 다양한 분야로 확장되고 있는 상황인데요. 앞으로 이용자들에게 더 큰 이익을 주고, 나아가 새로운 비즈니스 아이템으로까지 자리잡는 모습을 기대합니다.  




  1. Resource Description Framework의 약어. XML 등을 이용한 웹에 관련된 메타데이터에 대한 범용적인 기술 언어로 메타데이터의 속성을 정의함으로써 서로 다른 응용 프로그램끼리의 데이터 교환 등이 효율적으로 이루어지도록 한다. [네이버 지식백과] [본문으로]
Posted by IT로 만드는 새로운 미래를 열어갑니다 LG CNS
위로