IT Insight

우주에 승리호가 있다면 지구에는 '그린AI'가 있다!

2021. 2. 19. 09:30

조 바이든 미국 대통령의 취임과 함께 연관 검색어에서 쉽게 볼 수 있는 단어가 바로 ‘친환경’입니다. 바이든 대통령은 취임 전부터 환경 및 에너지 문제에 많은 관심을 보였으며, 취임 후 관련된 새로운 정책을 쏟아내고 있습니다.

 

친환경에 대한 관심은 전세계적인 트렌드입니다. 고기를 대신할 대체육 개발, 태양광발전 같은 친환경 에너지 개발 등 많은 국가와 기업이 환경 오염을 줄이기 위해 노력 중이죠. 테크 기업들도 인공지능이 배출하는 탄소로 환경 문제가 생긴다는 연구 결과가 늘어남에 따라 해결책을 찾고 있습니다.

 

탄소발자국 (출처: CO2 Living)

 

 환경오염을 유발하는 컴퓨터

최근 가장 핫한 환경 오염 이슈는 ‘탄소 배출’입니다. 탄소 배출은 개인, 기업, 국가의 모든 활동에서 발생하는 이산화탄소를 말합니다. 화석 에너지 사용과 전기 소비가 모두 탄소 배출로 이어집니다.   

 

보통 공장 가동이나 자동차 운행으로 생기는 매연 등을 떠올리는데, 컴퓨터가 최근 환경오염 주범으로 지목되고 있습니다. 전기를 기반으로 작동하는데다가 수요가 워낙 많기 때문입니다. 컴퓨터는 생산 과정에서 많은 양의 화석 연료와 화학 물질을 사용합니다. 컴퓨터를 폐기하는 과정에서도 많은 환경오염이 발생하는데, 연간 전자기기 폐기물 양만 약 5,000만 톤에 이릅니다. 컴퓨터에는 납과 같은 중금속을 비롯해 독성 화학물질이 포함되어 있어 매립할 경우 토양과 지하수를 오염시킵니다.

 

또한, 업무와 개인 용도로 사용하는 컴퓨터는 많은 전력을 소비합니다. 세계인구의 20% 이상인 약 13억 명 정도가 개인용 컴퓨터를 사용 중입니다. 컴퓨터 1대의 전력 사용량은 1년에 약 750킬로와트로 냉장고보다 500킬로와트 높습니다. 대기 상태인 컴퓨터와 모니터에 공급되는 전력도 적지 않습니다. 컴퓨터를 대기 상태로 설정하거나 모니터를 절전 상태로 전환하는 것도 전력이 소모되기 때문이죠.

 

컴퓨터에서 사용하는 전력을 공급하기 위해 발전소는 많은 에너지를 소비하며 그만큼 환경오염 물질 배출도 늘어납니다. 매년 수백만 톤의 이산화탄소, 메탄 등 온실가스가 대기 중으로 배출되는 것이죠.

 

 새로운 환경오염의 주범으로 지목된 인공지능

대량의 컴퓨터를 사용하는 인공지능은 얼마나 많은 탄소를 배출할까요?

 

2019년 한 연구에서 언어처리 인공지능 모델을 구축한 후 GPU가 27년 동안 계산해야 하는 분량을 6개월간 학습하는 실험을 진행했습니다. 실험 결과 연구팀은 7만 8,000파운드(약 35톤)에 달하는 탄소가 배출된 것으로 추정했습니다. 사람이 평생 내뿜는 탄소 배출량의 두 배에 달하는 양입니다. 구글의 언어처리 인공지능은 학습 과정에서 약 284톤에 달하는 탄소를 배출합니다. 인공지능의 특성상 학습을 지속해야 하므로 탄소 배출량은 계속 증가할 수밖에 없습니다.

 

오픈에이아이(OpenAI)가 공개한 GPT-2, GPT-3와 같은 인공지능은 기존 인공지능 모델보다 더 많은 데이터를 학습합니다. GPT-3는 학습 과정에서 덴마크 가정 126가구가 연간 소비량에  해당하는 에너지를 사용하고, 탄소를 배출하는 것으로 알려졌습니다.

 

GPT-2는 출시 당시 구성된 매개 변수가 15억 개였는데, 최신 모델인 GPT-3는 무려 1,750억 개의 매개 변수로 구성됩니다. 리소스 사용량도 GPT-3가 GPT-2에 비해 100배 정도 많습니다. 극단적인 계산이지만, 최근 딥러닝을 비롯한 인공지능에 사용하는 컴퓨팅 리소스는 평균 3~4개월마다 두 배 정도 증가했습니다. 이러한 인공지능의 급성장은 환경에 큰 영향을 미칠 수밖에 없습니다.

 

인공지능 학습에 사용하는 데이터 세트 크기도 증가하고 있습니다. 2018년 11월 구글이 공개한 인공지능 언어 모델 BERT(Bidirectional Encoder Representations from Transformers)는 자연어처리(NLP) 인공지능의 최신 딥러닝 모델로 30억 개의 단어 데이터 세트를 학습했습니다. 이후 오픈에이아이가 공개한 GPT-2는 400억 개의 단어 데이터 세트를 학습했고, 작년에 공개된 GPT-3는 무려 5,000억 개의 단어 데이터 세트를 학습했습니다.

 

 GPT-3 (출처 : 오픈에이아이)

 

딥러닝 학습에서 데이터 세트는 연산 과정을 거쳐 매개 변수를 업데이트하는데, 이러한 과정에서 컴퓨팅 리소스가 필요합니다. 문제는 이러한 학습 과정에서만 컴퓨팅 리소스와 에너지가 사용되는 것이 아니라는 점이죠.

 

학습이 아닌 실제로 인공지능이 사용되면 추론 과정에서 더 큰 리소스가 발생합니다. 자율주행차량의 인공지능은 실제 주행할 때마다 끊임없이 주변 환경을 계산하고 추론해야 합니다. 이처럼 인공지능이 학습을 지나 실제 산업 환경에 적용되면 소모하는 에너지가 더 커질 것입니다.

 

인공지능 데이터 세트가 크고 더 오랜 학습 시간을 거칠수록, 인공지능 성능은 발전합니다. 따라서 거대한 데이터 세트와 모델링을 통해 기하급수적으로 늘어나는 에너지 소비와 탄소 배출에 대해 고민할 필요가 있습니다.

 

 환경오염을 줄이기 위한 노력과 그린 AI

과연 인공지능이 만들어낼 환경 오염에 대해 스탠퍼드, MIT 등 대학을 비롯해 학계에서도 실험 및 연구가 이루어지고 있습니다. 구글, 마이크로소프트, 아마존, 애플 등 대형 IT 기업도 탄소 제로를 선언했습니다.

 

MIT는 탄소 배출을 줄일 수 있는 딥러닝 신경망 연구와 알고리즘을 고안했습니다. GPU 사용 시간을 줄이고 전력 소비를 크게 감소시켰습니다. 연구팀이 사용하는 IBM의 슈퍼컴퓨터는 초당 2,000 조 개의 계산이 가능하지만 탄소 배출은 기존보다 1/1000까지 줄인 세계 최고 친환경 슈퍼컴퓨터로 꼽힙니다. 

 

IT 기업의 데이터 센터도 탄소 중립을 선언했습니다. 전 세계 탄소 배출의 3.6%를 차지하는 데이터 센터가 탄소를 줄인다면 환경 오염도 그만큼 줄어듭니다. 구글 CEO 순다 피차이는 2030년까지 모든 데이터센터와 사무실에서 온실가스를 배출하지 않는 탄소 중립을 선언했습니다. 제프 베조스 아마존 CEO도 2040년까지 탄소 제로를 실현하겠다고 밝힌 바 있습니다. 마이크로소프트는 ‘AI for Earth’라는 프로젝트를 통해 글로벌 환경 문제를 해결하는 클라우드와 인공지능 프로그램을 지원하고 있습니다.

 

AI for Earth (출처 :  마이크로소프트)

 

기업의 노력과 더불어 인공지능으로 환경오염을 줄이고 에너지 소비를 최적화하는 연구 활동인 ‘그린 AI(Green AI)’도 진행 중입니다. 

 

인공지능이 학습을 진행할 때 사용되는 전력량을 측정하고 탄소 배출량으로 변환하는 프로그램도 개발돼 있습니다. 이 프로그램은 세계 여러 지역의 다양한 시간대에서 측정한 전력 소모 데이터를 수집해, 탄소 배출을 예측합니다. 어느 지역, 어느 시간에 가장 많은 탄소 배출이 발생하는지 확인하고 저탄소 배출 국가에 위치한 컴퓨터에서 학습을 진행합니다. 예를 들어 특정 시간대 에스토니아에서 인공지능 학습을 진행할 때 발생하는 탄소 배출량이 스웨덴보다 최대 60배 높다는 예측이 나오면 이를 조정해주는 방식이죠.  

 

인공지능을 개발할 때 알고리즘 설계부터 에너지 효율을 염두에 두고 설계할 수 있고, 꼭 학습에 필요한 컴퓨팅 리소스만 사용하는 방법도 있습니다. 알고리즘마다 에너지 효율이 다르기 때문에 친환경에 도움이 되는 알고리즘을 목표로 개발하는 것입니다. 인공지능 학습을 클라우드에서 진행할 때 재생 에너지를 사용해 탄소 배출을 낮출 수도 있습니다. 많은 기업이 재생 에너지를 활용하는 추세로 구글 클라우드는 AWS(아마존웹서비스)보다 재생 에너지 사용 비중이 더 높습니다.

 

날씨나 에너지 관련 기관이 수집한 데이터를 활용해 환경 관련 데이터 세트 분석도 필요합니다.  각국의 기상청이나 나사(NASA), 유럽 항공우주국(ESA), 미국 환경보호국(EPA)와 같은 기관에서 제공하는 데이터를 수집해 탄소 배출과 기후 변화 등을 예측하는데 활용하는 것이죠. ‘그린 AI’ 활동에서 인공지능을 통해 환경을 지키고 지속 가능한 발전을 이끌어 내기 위해서는 전 세계에 흩어져 있는 데이터를 통합하고 함께 관리 및 연구하는 것이 중요합니다.

 

날씨, 온도, 기상 정보, 전력 소비량 등 환경과 관련한 데이터를 통합해 분석하는 노력은 계속 늘고 있습니다. 구글 클라우드 플랫폼에는 기후 관련 데이터 세트를 누구나 확인할 수 있습니다.   데이터 모델링 및 분석 플랫폼 ‘캐글’에도 300여 개 이상의 환경 관련 데이터 세트가 있습니다.

 

효율적인 데이터 학습과 매개 변수 수집, 불필요한 학습을 줄이고, 에너지 효율적인 하드웨어를 사용하는 등 탄소 배출을 줄이는 데 도움이 될 수 있는 방법들은 이처럼 다양합니다. 하지만 그 자체로는 문제를 해결하기에 충분하지 않기에 인공지능 분야에서의 장기적인 변화가 필요합니다.

 

그린  AI (출처 :  보스턴 대학교)

 

 탄소중립과 인공지능

컴퓨터와 인공지능의 탄소 배출은 전체 배출량에 비해 많은 비중은 아닙니다. 하지만, 앞으로 더 많은 탄소를 배출할 것이라는 사실은 자명합니다. 인공지능 알고리즘의 연산 성능은 전력과 비례하기 때문이죠.

 

앞으로 인공지능은 알고리즘 설계부터 ‘그린 AI’를 목표로 설계해야 합니다. 전기를 적게 사용하고 불필요한 에너지 낭비를 줄여야 합니다. 언급한 바와 같이 인공지능은 탄소 배출의 주범이 아니라 탄소 배출과 환경 오염을 방지할 수 있는 역할을 맡아야 합니다.

 

‘그린 AI’는 회사 비용을 절약하고 환경 보호를 할 수 있는 인공지능이 나아가야 할 방향입니다. 많은 국가와 기업이 탄소 배출을 줄이고 탄소 중립을 위한 노력을 시작했습니다. 우리나라도 2050년 탄소 중립을 선언한 만큼 인공지능과 IT 기술이 가져올 환경 위험 신호에 대해 진지하게 접근할 필요가 있습니다.

 

 

글 ㅣ 윤준탁 ㅣ  IT 저널리스트

 

* 해당 콘텐츠는 저작권법에 의해 보호받는 저작물로 LG CNS 블로그에 저작권이 있습니다.

* 해당 콘텐츠는 사전 동의없이 2차 가공 및 영리적인 이용을 금하고 있습니다.

 

 

Posted by IT로 만드는 새로운 미래를 열어갑니다 LG CNS

댓글을 달아 주세요

  1. RI 2021.02.21 15:37  댓글주소  수정/삭제  댓글쓰기

    WHY를 추론하기위해서는 현재(RUN-TIME)에 대한 상황인지가 필요합니다.
    인과관계는 현재영역에서만 관찰될 수 있기 때문입니다.

    그렇지만 현재 물리적 머신은 데이터를 통해 관측하기때문에, 현재에대한 상황인지가 이론적으로 불가능합니다. 데이터는 스냅샷 사진같아서, 데이터가 생성되는 순간 과거가 되버리고 마는, 현재(NOW)의 정보를전혀 가지고 있지 않는, 즉 causality neural pathways를 모두 상실한 non-contextual 정보입니다. 따라서데이터중심 인공지능에서는 상관관계와 확률/통계로 의사결정을 하는것입니다. 마치 백미러를 보고 운전하는것과 같다고 보시면 될것 같습니다. 현재와 비슷한 관계모델을 만들려고 할 수록 에너지가 많이 소모되는 모델. 이러한 패러다임에서 GREEN AI를 기대하는 것 자체가 무리가 있습니다.

    주류 기업에서 돈벌이 마케팅으로 무작정 딥러닝이다 인공지능이다 한다고 해서 우르르 몰려다니지말고,
    차근차근 "앞을 보며 운전하는 인공지능을 어떻게 만들어야 할지 고민해보는 것"이 필요합니다.

    어차피 왜 죽었는지 "똥"(데이터)을 살피는 뒷북치는 인공지능은
    애초부터 독약을 먹지 않게 해주는 앞을 보는 인공지능에게 밀리게 되어있으니까요.

위로