IT Solutions/Big Data

빅데이터 시각화 분석 ②

2016.10.18 09:30

지난 1편에는 데이터를 시각화하는 ‘정보 시각화 방법 다섯 가지’를 알아봤는데요. 이번 시간에는 빅데이터 시각화의 범위 및 빅데이터 시각화 절차와 도구 등에 대해 자세히 소개해 드리도록 하겠습니다.


● 빅데이터 시각화 분석 ①http://blog.lgcns.com/1208


 빅데이터 시각화의 범위


l 정보 디자인에서 빅데이터 시각화 영역 

(출처: 한국데이터베이스진흥원의 데이터 분석 전문가 가이드 도서, 재구성)


앞서 언급한 대로 빅데이터 시각화는 정보 시각화에 가깝습니다. 빅데이터 시각화는 데이터를 기반으로 객관적 표현에 더 초점을 맞추는 경우가 많으므로, 정보형 메시지를 전달하기 위한 데이터 시각화와 일맥상통합니다. 


반면 데이터 자체보다는 데이터를 기초로 해석된 의미의 설득형 메시지를 전달하기 위한 경우에는 인포그래픽을 주로 활용하게 됩니다. 주로 신문기사나 뉴스에서 활용하는 그것입니다.


 빅데이터 시각화의 절차와 도구


빅데이터 시각화는 최소한으로 편집된 데이터를 사용하여 데이터의 최초 형태보다 접근하기 편하게 데이터를 가공하고, 직관적으로 분석해서 쉽게 결과를 도출할 수 있어야 합니다. 


하지만 양적인 정보와 질적인 정보가 모두 객관적으로 제공되어야 하기 때문에 구성 방법이나 환경이 매우 복잡합니다. 빅데이터 시각화 분석을 위해 적합한 환경이 구성되고 난 후에 시각화를 어떻게 할지 고민해야 합니다.

 

l 빅데이터 시각화 프로세스 (출처: 한국데이터베이스진흥원의 데이터 분석 전문가 가이드 도서, 재구성)


빅데이터 시각화 프로세스는 정보 시각화와 유사한 절차를 거칩니다. 빅데이터 시각화도 데이터에서 유의미한 정보를 찾아 다양한 시각화 형태로 사용자에게 제공되기 때문입니다.


1단계 정보구조화 단계에서는 질문을 먼저 만들어내거나 전달하려는 목표를 먼저 설정할 수도 있지만, 빅데이터에서 제공하는 데이터를 가지고 밑 작업을 하면서 시각화의 목표가 될 만한 것들을 발견하고 설정하기도 합니다. 


여기에서는 수집 및 탐색하기, 분류하기, 배열하기, 재배열하기라는 4단계로 나누어, 시각화를 위한 정보 구조화 단계에 초점을 맞춰 작업을 진행합니다. 사실 빅데이터의 시각 표현에 있어서 많은 데이터를 수작업으로 조직화하거나 분류하기보다는 다양한 시각화 툴을 사용해 개발하는 경우가 대부분입니다. 


또한 아예 데이터를 갖고 인공지능의 한 분야인 기계학습 알고리즘(Machine Learning Algorithm)을 접목해 데이터를 파악하고 이를 통해 사람이 파악할 수 없었던 결과들을 자동으로 시각 추출하는 방법도 활발하게 연구되고 있습니다.

 

l 빅데이터 시각화 도구 (출처: 한국데이터베이스진흥원의 데이터 분석 전문가 가이드 도서, 재구성)


2단계 정보 시각화 단계에서는 시각화 툴을 이용해 시각화에 필요한 그래프나 시각화의 기본 틀을 잡을 수 있습니다. 일반적으로 많이 사용하는 툴은 위와 같이 기초 수준부터 전문가 수준에 이르기까지 다양합니다. 빅데이터에서는 전문가 수준의 툴을 이용해 다양한 데이터를 시각화하는 것이 필요합니다. 


이러한 ‘데이터 시각화 툴’은 일반적으로 자신의 데이터를 분석하기 위한 플랫폼을 의미하기도 합니다. 전통적으로 엑셀, 파워포인트를 많이 활용했지만 최근에는 Qlik, Tableau, Spotfire 등의 전문 시각화 솔루션과 더불어 R과 같은 전문 프로그래밍 언어도 많이 활용되고 있습니다. 


물론 R과 같은 전문 언어를 사용해 그래프로 나타냈다고 무조건 좋은 것은 아니며, 시각화 툴에서 제공하는 다양한 그래프를 어떤 이유로 쓰는지, 어떻게 표현해야 하는지 고민해보고 적합한 도구와 그래프를 활용해서 빅데이터 시각화 분석 작업을 진행해야 합니다.


3단계인 정보 시각 표현에서는 최종적으로 시각적인 완성을 하는 단계로, 시각화 툴로 선택한 그래프를 시각적으로 더 다듬거나 시각 표현을 극대화하는 방안을 실험하면서 완성하게 됩니다. 


세부적인 데이터를 시각화하기 위한 그래픽의 7요소, 전체적인 시각화를 완성하기 위한 그래픽 디자인의 기본 원리, 인터랙션 디자인을 통해 방대한 양의 데이터 시각화를 탐험할 수 있게 하는 다양한 시각화 방법을 습득할 필요가 있습니다. 


 결론


빅데이터는 그 자체가 곧 현실입니다. 빅데이터를 시각화한다는 것은, 곧 우리 주위에서 어떤 일이 벌어지는지 시각적으로 보여준다는 것을 뜻합니다.

 


작고 깊은 개개인의 차원에서 어떤 일이 벌어지고 있는지 볼 수도 있고, 그보다 더 크게 전 세계적으로 어떤 일이 벌어지고 있는지 보여줄 수도 있습니다. 잘 만들어진 시각화는 데이터를 전혀 모르는 사람, 심지어는 들을 생각이 없었던 사람에게도 아주 훌륭한 이야기를 전달할 수 있습니다.


인간은 여러 세기에 걸쳐 데이터를 차트와 그래프로 그려왔지만, 그중 어떤 것이 좋고 나쁜지를 연구하기 시작한 시기는 불과 수십 년 전입니다. 

 


데이터와 정보에 대한 새로운 접근법들이 도입됨에 따라 시각화 기술은 지금까지 계속 발전하고 있으며, 이러한 기술은 정보에서 도출할 수 있는 지식을 구체화하는 방법론이기 때문에 향후 의사결정에 지대한 영향을 미칠 수 있는 분석 전략이 될 수 있습니다.


글 | LG CNS 빅데이터사업담당



* 해당 콘텐츠는 저작권법에 의하여 보호받는 저작물로 LG CNS 블로그에 저작권이 있습니다.

* 해당 콘텐츠는 사전 동의없이 2차 가공 및 영리적인 이용을 금하고 있습니다.




저작자 표시 비영리 변경 금지
신고
Posted by IT로 만드는 새로운 미래를 열어갑니다 LG CNS
위로