본문 바로가기

알고리즘

사진 1,000장은 빅데이터일까? 안녕하세요! 코지입니다. 오늘은 빅데이터에 대해서 알아보려고 해요! 빅데이터라는 단어는 누구나 들어봤을 텐데요. ‘빅데이터가 무엇입니까?’라는 질문을 받으면 어떻게 대답할 수 있을까요? 큰 데이터? 대용량 데이터? 틀린 말은 아니지만 조금 부족한 설명일 수 있겠네요. 우리가 매일 스마트폰으로 찍는 사진 한 장의 크기(용량)가 2MB(메가바이트) 정도라고 했을 때, 1,000장의 사진은 2,000MB, 바로 2GB(기가바이트) 정도인데요. 이 정도는 빅데이터라고 말할 수 없다고 해요. ‘내가 바로 빅데이터야’라고 소개할 정도가 되려면, 그 크기가 수십 TB(테라바이트)에서 PB(페타바이트)는 되어야 한다고 하는데요. TB(테라바이트), PB(페타바이트)라고 하니 감이 잘 안 오시나요? 1PB는 100GB .. 더보기
AI는 '스스로 학습'할 수 있을까? 수많은 학습 데이터를 주기만 한다면, 딥러닝은 문제를 잘 풀 수 있다고 알려져 있습니다. 예를 들어 1,000개의 카테고리에 대해 130만 장의 분류된 이미지가 있는 ImageNet 태스크에 대해 딥러닝 알고리즘은 Top 5 기준 98% 이상의 정확도를 달성하며 사람의 판별 정확도를 뛰어넘었습니다. 하지만 태스크에 맞는 데이터를 수집하는 것은 비쌉니다. 세상에는 이미지가 넘쳐나지만, 각각의 이미지가 어떤 의미를 가지는지 사람이 일일이 분류해 라벨을 만드는 것은 오래 걸리고 힘이 듭니다. 지도 학습, 비지도 학습, 그리고 자기 지도 학습 데이터와 라벨이 주어질 때 라벨을 이용해 태스크를 수행하는 방법을 학습하는 것을 지도 학습(Supervised learning)이라고 부릅니다. 이미지 분류, 양불판정, .. 더보기
‘알고리즘 저널리즘’은 뉴스 산업의 구세주가 될 수 있을까? 애슐리는 필자가 재직하는 미국 대학에서 ‘저널리즘’ 수업을 듣는 학생입니다. 며칠 전 그녀가 이메일을 보내왔습니다. “숙제하러 스타벅스에 갔는데 월스트리트저널 신문 웹사이트에 접속해 무료로 뉴스를 읽을 수 있었습니다. 신문 산업이 많이 어렵다는데, 신문사가 독자를 늘리기 위해 스타벅스와 이런 방식으로 제휴하는 게 흥미롭습니다.” 젊은 사람들이 종이 신문을 읽지 않는 게 더 이상 새로운 소식이 아닌 시대입니다. 종이 신문이 과연 얼마나 생존할 수 있을까요. 전망이 밝지 않은 게 사실입니다. 얘슐리가 말한대로, 실제로 세계의 최대 커피 체인 스타벅스는 2019년 10월1일부터 매장의 무료 와이파이(Wi-Fi)를 쓰는 고객들에 한해 월스트리트저널, USA투데이, 시애틀타임스, 뉴욕데일리 등 7개 신문의 뉴스를.. 더보기
4족 보행 로봇 기술의 진화 4족 보행 로봇의 원조는 지난 1965년 GE가 미군의 위탁을 받아 개발한 '워킹 트럭(Walking Truck)'입니다. 사람이 로봇 안에 들어가 조작하는 거대한 탑승형 로봇인데, 아래 이미지를 보면 60년대 기술이라고 믿어지지 않을 정도로 탁월한 기량을 보여주고 있습니다. 로봇 몸체에 각종 배선이 치렁치렁 매달려 있지만 육중한 다리를 들어 나무들이 겹겹이 쌓여 있는 곳에 사뿐히 올라선 후 나무를 하나씩 발로 차면서 균형을 잡고 내려오는 모습이 인상적입니다. 워킹 트럭은 진흙에 빠진 지프 트럭을 발로 밀어붙여 빼내는 장면도 연출합니다. 조작도 비교적 쉬웠다고 합니다. 하지만 워킹 트럭은 유압 시스템 구동에 엄청난 기름을 소비하고 미군의 자금 지원이 계속 이뤄지지 않아 개발이 중단되고 말았습니다. l 워.. 더보기
수경재배는 왜 기술 용어가 되었을까? 수경재배(Hydroponics)는 '흙 대신 영양소가 용해된 물을 이용해서 식물을 생장시키는 것'을 의미합니다. 낯선 용어는 아니지만 선호되는 개념도 아니었습니다. 세부적인 재배 방법에 따라 다르지만, 초기 비용이 많이 들고, 관리가 쉽지 않으며, 병원균 오염의 속도도 빠른 등 여러 단점이 경작에 비해서 큰 이점을 보이지 못했기 때문입니다. 그런데 최근에는 급격한 인구 증가와 농지로 사용할 수 있는 토지의 감소로 수경재배는 식량 확보를 위한 대안 중 하나로 주목을 받고 있습니다. l 아이언 옥스의 수경재배 로봇 (출처: http://ironox.com/) 유엔 식량농업기구(FAO)의 보고서에 따르면, 2050년이면 세계 인구는 96억 명까지 늘어날 전망입니다. 식량 부족을 해결하려면 식량 생산을 지금보다.. 더보기
양자 컴퓨팅 시대, 양자 암호 기술과 보안 2013년 미국 국가 안보국(National Security Agency) 요원이었던 에드워드 스노든(Edward Joseph Snowden)은 영국의 가디언지를 통해 미국 정부가 전 세계 통신망을 도청해왔다는 사실을 폭로했습니다. '프리즘'이라는 비밀 프로젝트를 통해 미국 국가 안보국이 전 세계를 대상으로 통화 및 인터넷 사용 기록을 무차별적으로 수집하고 사찰해왔다는 사실은 많은 이들에게 충격을 주었습니다. 스노든이 제공한 자료를 토대로 2014년 1월 워싱턴 포스트는 미국 국가 안보국(NSA)이 인터넷 암호화를 거의 깰 수 있는 양자 컴퓨터 개발을 추진하고 있다고 보도했습니다. 스노든의 폭로 후 얼마 안 되어 중국 지도부에서 중국이 이미 해킹을 차단할 수 있는 양자 암호화 통신을 사용하고 있다고 발표.. 더보기
법률을 준수하는 보안 설계 프로젝트 수행 시 정보 시스템을 구축하게 되고 정보 시스템을 보호하기 위해 보안 솔루션들을 도입하게 되는데 이때 ‘보안 관련 법률을 잘 준수되는 시스템을 구축되도록 하려면 어떻게 하면 될까?’ 고민하였던 적이 있었습니다. 보안 법률을 잘 준수하기 위한 절차 및 설계 방법에 대해 이야기하고자 합니다. 1. 준수해야 될 보안 법률 식별하기2. 법적 요건 도출하기3. 보안 설계 요건 도출하기4. 설계 시 반영•검토하기 위와 같은 절차대로 수행하면 보안 관련 법률을 준수하는 보안 설계가 가능하지 않을까요? 준수해야 될 보안 법률 식별하기 보안 관련 어떤 법률을 적용받아야 하는지는 해당 기관 또는 기업이 어떤 비즈니스를 하고 있는지? 구축 대상 시스템이 어떤 업무를 수행하게 되는지?에 따라 적용받는 법률이 다양할.. 더보기
소셜 미디어, 인도 총선에서 ‘가짜 뉴스’와 어떻게 싸웠나? “세계 역사상 최대 규모의 선거가 될 것이다.” 미국 일간지 뉴욕 타임스는 지난 4월 11일부터 치러진 인도 총선을 이렇게 표현했습니다. 13억4천만 명의 인구를 보유한 인도에서 이번 선거의 유권자 수는 9억 명에 달합니다. 세계 인구의 10%가 투표장을 향하게 되는 셈입니다. 1백만 개의 투표소가 설치되었고, 선거 관리를 담당하는 인력이 1천2백만 명에 달합니다. 선거를 하루에 치르는 것은 아예 불가능해 6주 동안 7차례에 걸쳐 투표가 진행되고 개표는 5월 23일 하루에 실시될 예정입니다. 이번 선거가 중요한 이유는 543명의 연방 하원을 선출하는 총선의 결과에 따라 차기 총리가 결정된다는 것입니다. 주요 관심사는 현재 여당인 인도 국민당(BJP)을 이끄는 현 나렌드라 모디 총리가 야당인 인도 국민 회.. 더보기