IT Life

빅데이터 활용, 어디까지일까? - 빅데이터와 범죄 예방 -

2014. 5. 21. 10:32

 


안녕하세요! LG CNS 대학생 기자단 탁윤영입니다. 

LG CNS가 남미 콜롬비아의 수도 보고타 시에 교통 시스템을 구축, 운영한 이후로 시민들의 대중 교통 이용에 대한 편리성, 만족도가 높아졌다는 소식은 이미 LG CNS 블로그나 언론 매체를 통해 접해보셨을 것입니다. 보고타 시에서는 그간 축적된 탑승/환승 정보와 버스 운행 기록을 토대로 버스 노선도 설계하는데요. 이러한 교통 흐름을 최적화할 수 있는 것은 전부 빅데이터로 가능한 일입니다.


빅데이터가 가져온 것은 교통 체계의 혁신만이 아닙니다. 이러한 교통 시스템 구축이 보고타시의 범죄율을 낮추데 크게 기여하고 있다고 합니다. 교통 시스템 관리와 범죄율 감소는 특별히 관련이 없어 보이기도 한데요. 실제 보고타 시의 버스가 장소나 시간에 관계없이 운행되는 시절에는 버스를 타기 위해 기다리는 시민들이 거리 범죄에 노출되었습니다. 하지만 LG CNS가 구축한 교통 시스템에 의해 이제는 정해진 버스정거장과 일정한 시간이 지켜지면서 도심의 위험한 상황을 줄이는데 기여한 것입니다.


저는 빅데이터가 마케팅 분야에 한정되어 활용된다고 생각해서 그런지, 이러한 사실이 정말 흥미로웠습니다. 이렇듯 최근에는 빅데이터가 교통 시스템뿐 아니라 사회 시스템을 효율화하는데 다양한 역할을 하고 있는데요. 그 분야 중 하나가 바로 범죄 해결입니다. 오늘은 범죄 예방(pre-crime)과 수사에 있어 빅데이터가 어떻게 활용해지는지 실제 사례를 중심으로 살펴보겠습니다. 

 

2013년 4월 15일 미국 보스톤 마라톤(Boston Marathon)의 결승 지점에서 두 개의 폭탄이 폭발하면서 3명의 사상자와 260여 명의 부상자를 발생시킨 보스톤 테러사건이 있었습니다. 보스턴 마라톤(Boston Marathon)은 1896년부터 미국 매사추세츠 주의 보스턴에서 매년 열리는 대회로 큰 의미가 있는 행사입니다. 그만큼 당시의 테러 사건은 미국 사회에 큰 충격으로 다가왔죠. 하지만 올해에도 마라톤 대회가 개최되었고, 3만 6쳔여명의 참가자가 등록하여 지난 해 발행한 사건을 기억하고 희생자들을 추모했습니다. 여기서 잠깐! 그런데 범인은 어떻게 되었을까요? 작년 사건 이후 신속한 수사 진행과 범인 검거가 이루어졌다고 하는데요. 저는 당시 범행 현장이 방대했기 때문에 대부분 사건 해결에 상당한 시간이 걸릴 거라고 예상했습니다. 하지만 범인 검거까지 걸린 시간은 나흘에 불과했다고 합니다. 

이렇게 신속한 범인 검거가 가능한 시스템의 핵심에 빅데이터가 있었습니다. 이는 그간 주목받아온 빅데이터를 활용한 범죄 수사가 빛을 발한 순간이라 할 수 있는데요. 보스톤 테러 수사국에서는 사건이 발생한 직후 범인 검거의 단서가 될 수 있는 대량을 데이터를 모두 수집하였습니다. 길이나 건물에 설치된 CCTV, 사람들이 SNS로 발송한 메시지나 사진, 시민의 촬영 영상 등이 이에 포함되죠. 이 데이터의 총량은 10TB 정도였다고 합니다. 이처럼 방대한 양의 데이터 분석을 위해 일일이 데이터 형식을 통일시키고, 식별코드를 부여했습니다. 이러한 과정을 통해 용의자의 범위를 좁혀나가고, 구체적인 용의자의 인상착의를 빠르게 파악하였고, 범인 검거로까지 이어졌습니다. 빅데이터를 활용한 이와 같은 수사 방법은 범죄 해결에 있어 담당 경찰의 직관이나 순간적 단서에 의존하는 방식과 비교했을 때 ‘혁명’이라고 표현해도 과장이 아닌 것입니다. 

 

보스톤 테러 사건에서와 같이 빅데이터를 범죄예방이나 수사 등 사회 안전망 확보에 활용하는 것은 현재 우리나라를 포함한 해외 각국에서 활발한 논의가 이루어지고 있는 이슈입니다. 국내에서는 올해 1월 빅데이터 활용 확대 방안을 국무회의에 보고하고 관련 예산을 전년대비 크게 늘렸습니다. 그 결과 올 한해 동안 빅데이터 관련 사업은 총 38건이고, 사업 예산은 556억여 원으로 집계되었죠. 


특히 최근 경찰청의 ‘지리적 프로파일링 시스템’은 범죄 예방 및 수사에 빅데이터 사업이 적용된 것과 맥을 같이 합니다. 여기서 ‘지리적 프로파일링 시스템’이란, 다양한 공간통계분석기법을 경찰의 범죄수사데이터에 적용, 범죄위험지역 예측을 통한 방범 전략 수립 및 연쇄 범죄자 거주지 예측을 통한 수사활동 전개가 가능한 시스템을 말합니다. 지리적 프로파일링 시스템은 빅데이터를 범죄 수사 분야에 적용한 국내 사례로, 빅데이터를 활용하여 국민의 생명과 재산을 범죄로부터 차단, 보호하기 위한 ‘정부 3.0’의 주요 사업 분야입니다.

아래 그림을 보시면 지리적 프로파일링이 실제로 어떻게 활용되는 있는지 구체적으로 알 수 있습니다. 먼저 지리적 프로파일링이 적용된 지도는 범죄 밀집 정도를 기준으로 구역마다 다른 색상으로 나타납니다. 붉은색으로 표시된 지역이 범죄 빈도가 높은 곳이죠. 범죄위험지역을 중심으로 순찰노선과 거점 근무 지점 등을 유동적으로 변경하는 등 순찰 활동에 지리적 프로파일링의 결과를 적극 활용합니다. 프로파일링 데이터 활용은 CPTED(범죄예방환경설계)에도 큰 영향을 줄 것으로 기대되고 있습니다. 

<지리적 프로파일링 적용 프로세스 (출처: 정부 3.0 공식 블로그)>

 

셉테드(CPTED)라는 용어가 조금 생소하게 느껴질 수 있을 것 같은데요. 셉테드는 환경설계를 통한 범죄 예방(Crime Prevention Through Environmental Design)’을 줄인 말로 건물과 가로등, CCTV과 같은 감시장비 등을 범죄 예방을 위한 방향으로 설계 건축하는 기법을 말합니다. 셉테드 개념을 활용한 제도는 유럽과 북미 지역에서는 활발하기 진행되고 있는데요. 국내에도 셉테드가 최근에 소개되어 그 중요성과 효과를 인지하고 있으며, 이를 활용한 도시 디자인 정책이 점차 늘어나는 추세입니다. 

셉테드를 통한 도시설계 과정을 살펴보면 여기에서도 빅데이터의 중요성을 실감할 수 있죠. 셉테드는 시간대별, 장소별 강력 범죄 발생 건수의 데이터와 길의 형태, 장소의 폐쇄성 그리고 경사도 등과 같은 지형적 특성 등과 같은 통합적인 데이터 베이스를 바탕으로 범죄 예방 계획이 수립됩니다. 이를 통해 범죄 은신처가 될 수 있는 담을 없애거나 높이를 제한하거나, 범죄가 빈번하게 발생하는 골목길에 CCTV를 설치하는 등 도시 환경을 개선시킵니다. 

 <셉테드(CPTED): 환경 설계를 통한 범죄 예방 과정 (출처: 경기도 공식 블로그)>


2013년 경기도 디자인 총괄 추진단이 발표한 취약지역 범죄예방을 위한 공공서비스 디자인 매뉴얼 개발에 이러한 셉테드의 정보 통합적인 성격을 엿볼 수 있는데요. 구체적인 디자인에 앞서 수행된 데이터 통합 분석을 통해 도출된 결과는 다음과 같습니다. 불 꺼진 골목, 단절된 주택 밀집 지역 등 비교적 폐쇄적이고 어두운 장소, 20시 ~ 03시 59분 사이의 심야 시간대에 범죄 발생 가능성이 높다는 것입니다. 이러한 결과를 바탕으로 셉테드는 구체적인 계획을 수립하는데요. 폐쇄적 공간에는 열린 공간을 확보하여 자연적 방범능력을 높이고, 어둡고 좁은 골목에는 할로겐 조명과 CCTV 등 기능적 시설물을 설치하는 것입니다. 


경기도 디자인 총괄 추진단은 경기도 지역의 실질적인 셉테드 효과를 위해 각 시군 지역의 세부적이고 실질적인 지역적 특성을 반영하는 통합 데이터 베이스 구축에도 지원을 아끼지 않을 예정이라고 합니다.


국내 최초 셉테드 시범지역으로 선정되었던 경기도 부천시는 범죄우발 지역을 중심으로 셉테드를 시행하여 범죄발생률을 20%나 감소시키며 그 효과를 입증하기도 했는데요. 이는 부산광역시를 비롯한 여러 지자체에서 셉테드 계획을 수립하는 계기로 작용하였습니다.

 

보스턴 테러사건과 우리나라 검찰청의 지리적 프로파일링 시스템에서 볼 수 있듯이, 빅데이터는 우리 사회에서 범죄 예방과 수사에 폭넓게 활용되고 있습니다. 이처럼 사회 안전망 구축을 위한 빅데이터 활용은 더욱 가속화될 것으로 예상되며, 실제 많은 국가에서 도입하고 있습니다.


분 

용 

고 

 미국 국세청의 탈세 탐지

시스템 구축

- 데이터분석, 이상징후 발견, 예측 모델링으로 과거

   행동정보를 분석, 사기패턴과 유사한 행동을 검출

- 연간 3,450억 달러의 세금 누락과 불필요한 세금 

   환급을 절감

미국 2010년 기준 탈세금액은 3,373억

달러로 저소득층 의료보장 총액보다 많음(향후 의료보험과 복지 프로그램 관련 사업에 적용을 검토) 

영국의 범죄지도 

- 범죄지도를 구성하여 제작하고 크라임 파인더를

   제공

사용자가 주변의 범죄를 시각적으로 

인식할 수 있는 증강현실 앱 제공 

샌프란시스코의 범죄 사전

예보체계 

- 과거 8년 동안 범죄 발생지역과 범죄 유형을 분석

   하여 후속 범죄 가능성을 예층

- 제한된 경찰 인력을 효율적 재배치

예보된 10곳에서 실제 7건의 사건 발생

(정확도 71%) 

버팔로시의

오퍼레이션 클린

스윕 프로그램 

- 311, 911 민원 수집내용, 거주지 상태 정보, 정부

  부서의 문제점을 하나의 시스템에 통합하여

  분석한 자료를 기반으로 정부 산하부서와 비영리

  단체가 우선순위를 정해 보다 나은 서비스를 제공 

버팔로시는 북부의 사양화된 공업 도시로 기반시설에 문제가 발생하고 주택관련 민원전화가 많은 지역 

<미국의 사회안전망 속에 자리 잡은 빅데이터 사례 (출처: 경기개발연구원)>


이러한 추세를 감안하면 현재 ‘정부 3.0’ 핵심과제를 논하는데 있어 빅데이터를 제외시킬 수 없을 것입니다. 실제 정부 3.0에서는 빅데이터의 과학적 분석을 통해 대한민국의 장기적인 미래 발전을 수립하겠다는 의지를 보이고 있는데요. 현재 안전, 경제, 재난 등에 한정되어 있는 빅데이터 활용범위를 해외의 선진 사례를 바탕으로 탈세방지, 이익집단 및 NGO와 정부 간 거버넌스 등 사회 곳곳에 빅데이터 활용을 확대하는 방안까지 구체적으로 고민해야 할 것입니다.


지금까지 사회 안전망 구축에 활용되는 빅데이터에 대해 살펴보았습니다. 빅데이터는 갑자기 생겨난 것이 아니라 지금까지 있었던 분석방법에 비해 데이터 처리량, 유형, 분석속도, 분석범위 측면에서 더욱 광범위해지고 더 다양해진 것이라 할 수 있는데요. 따라서, 빅데이터의 활용을 높이기 위해서는 분석 전문가를 양성하고 다양한 분야에서 활용될 수 있도록 관심과 다각적인 노력이 필요한 시점이라고 생각됩니다. 




Posted by IT로 만드는 새로운 미래를 열어갑니다 LG CNS

댓글을 달아 주세요

  1. BlogIcon 로크웰 2014.05.26 13:41  댓글주소  수정/삭제  댓글쓰기

    지금까지의 빅데이터의 활용분야에서도 가장 바람직한 예가 아닐까 싶습니다. 우리 나라에도 속히 활용되길 바랍니다. 글 잘읽었습니다.

  2. BlogIcon 128 데이터 2014.05.26 13:58  댓글주소  수정/삭제  댓글쓰기

    좋은 글 읽었네요. 앞으로도 셉테드와 같이 빅데이터를 유용하게 활용할 만한 많은 시스템과 인력이 구축되길 바랍니다.

  3. BlogIcon 이영선 2014.05.30 14:04  댓글주소  수정/삭제  댓글쓰기

    기사 너무 유익한거같아요~~ 기자님도 너무 이쁘세요!

  4. BlogIcon Daniel 2015.02.19 19:57  댓글주소  수정/삭제  댓글쓰기

    범죄 빅데이터 전문가는 어디로 취직하나요? 검찰청?

  5. BlogIcon Daniel 2015.02.19 19:57  댓글주소  수정/삭제  댓글쓰기

    범죄 빅데이터 전문가는 어디로 취직하나요? 검찰청?

  6. 2018.05.15 14:52  댓글주소  수정/삭제  댓글쓰기

    비밀댓글입니다

  7. Sunny 2018.06.05 00:52  댓글주소  수정/삭제  댓글쓰기

    보스턴 테러는 빅데이터 수사 실패 사례..즉 사전에 예방에 실패하고 테러에 성공한 뒤에 검거한 사례인데 여기다 때려붙이시면...심지어 보스턴 테러 전에 그 인물들이 수상쩍다는 신고까지 무시한 빅데이터라는 사실! 빅데이터를 맹신하지 않았다면 그 전에 수사해서 잡을수 있었던 상황이 빅데이터 맹신하다가 망한 사례에요. 그리고 그 반대 상황이 있는데 빅데이터가 잘못 인지해서 건물을 촬영한 예술가가 쓸데없이 조사받거나 SNS에서 자신의 기분을 설명한 글때문에 미국 입국이 거부된 빅데이터 오류사례도 있지요. 빅데이터는 정확도가 너무 낮아서 문제이죠. 미국의 보안전문가들도 이야기하듯 빅데이터로 수사하면 쓸데없이 경보가 자주 울리거나 필요한 경보가 안울리거나 둘중 하나라고 말이죠.

위로