IT Solutions/스마트 물류

IT 공룡들, 수요 예측 서비스를 시작하다

2019.08.08 09:30

사실 수요 관리자 입장에서 시계열 예측이나 분석 시스템에 투자하는 일은 투자 대비 효과가 낮은 영역입니다. 많은 양의 데이터 클렌징과 한땀 한땀 제거해야 하는 아웃라이어(Outlier), 각종 파라미터를 조정해야 하는 등 사용 가능한 수요 예측 정보를 획득하기까지의 과정은 오랜 시간이 소요되었고, 이마저도 최종 수요 예측값으로 바로 사용할 수 없는 참조용 베이스라인 정도입니다.


과거 데이터 기준으로 수립한 시계열 예측에 미래 수요를 변화시키는 새로운 요인들을 추가해야만 수요 예측이 완성되기 때문입니다.



최초 시계열 수요 예측의 모델이 되었던 항공 수요처럼 추세, 계절성, 이벤트 등 영향도 분석이 잘 되는 비즈니스 유형이 많지 않고, 수요 예측 모델 정확도를 높이는 과정에서 통계 전문가와 업무 전문가 사이의 의사소통 및 데이터 검증 절차도 오래 걸리는 작업일 수밖에 없었습니다.


이러한 과정을 빠르고 쉽게 해주겠다고 페이스북이 머신러닝 기반의 프로펫(Prophet)을 17년 초에 공개했고, 아마존 AWS는 18년 11월에 다른 클라우드 기반의 인공지능(AI) 서비스와 함께 포캐스트(Forecast)를 공개했습니다.


 페이스북 프로펫(Prophet)과 아마존 포캐스트(Forecast) 서비스의 시작


● 아마존 포캐스트가 기대되는 이유


아마존 클라우드 사업 부문인 아마존 웹서비스(AWS)는 시장점유율이 33%에 이를 만큼(과거에는 더 높은 점유율이었지만 후발주자가 마켓쉐어를 늘렸음) 이미 많은 기업의 방대한 데이터를 관리하고 있고, 자연스럽게 자신들의 노하우가 기반이 된 알고리즘을 추가하면서 17년 클라우드 기반 인공지능 서비스를 시작했습니다.



개발자들이 매핑 테이블을 코딩해 올리는 데이터 이관 작업을 현장의 업무 담당자가 개발자 도움 없이 손쉽게 할 수 있는 서비스 등 기존 서비스가 데이터 관리 측면에서 강점이 많기 때문에 클라우드 기반 인공지능 서비스는 기존 서비스와 시너지를 발휘할 수 있어 자연스럽게 클라우드 고객들을 신규 서비스로 끌어들일 수 있습니다.


고객들이 먼저 서비스해달라고 요청했던(수많은 상품 머천다이저들을 대체했던) 개인별 추천 서비스를 마케팅 및 수요 관리 담당자들을 위한 통합된 서비스로 구성되어 제공될 수 있으며, 유통과 물류에서 아마존이 쌓아온 노하우와 성공 체험들이 현실적인 활용 측면에서 고객들에게 강하게 어필될 수 있습니다.


● 페이스북 프로펫(Prophet)은 어떻게 활용하는가?


이제 먼저 수요 예측 머신러닝 패키지를 공개했던 페이스북 이야기를 하겠습니다. 수요 계획 담당자에게 이런 질문을 한다고 가정하겠습니다.


'장기간의 시계열 데이터를 추세적인 증감, 추세가 변하는 변곡점, 휴일이나 스포츠 행사 같은 이벤트, 그리고 오차 이 4가지 요인들의 영향을 구분할 수 있는가? 그리고, 각각의 요인들이 전체 추세에 미치는 영향의 정도를 숫자로 구분할 수 있는가?'



기존의 아리마(ARIMA) 같은 시계열 모델에서는 이러한 요인들을 식별하고 정확한 값을 얻기 위해서는 오랜 시간 파라미터를 조정해 나가는 전문적인 작업이 필요합니다. 페이스북 프로펫은 시계열 분석에 대한 전문적인 지식을 가지고 있지 않더라도 직관적으로 이해할 수 있는 몇 가지 파라미터를 가지고 시계열 모델을 만들어 바로 활용할 수 있도록 만들어져 있습니다.


그리고, 이세돌을 이긴 구글의 알파고에도 활용되었던 마코프 체인(Markov Chains)으로 모델을 학습을 시킬 수도 있습니다. 또한, 시간에 종속적인 모델 구조가 아니기 때문에 일정한 주기의 데이터를 완벽하게 보유하고 있지 않아도 수요 예측이 가능합니다. 아리마 등으로 주기적인 데이터를 튜닝이 잘했을 때보다는 정확도가 떨어질 수 있지만, 앞에서 언급했듯이 데이터 클렌징, 아웃라이어 제거, 파라미터 조정의 과정이 간소화되기 때문에 투자 효율성이 높습니다.


통계 전문 지식을 공부하거나 통계 전문가의 도움 없이 상품 기획자나 수요 관리자가 파라미터값을 조정해가면서 요인들의 영향 값들을 확인하고 실무에 활용하는데 유용하고, 머신러닝 학습으로 바로 연결이 가능하기 때문에 학습할 수 있는 데이터가 충분하다면 시계열 분석 측면에서 활용도가 높습니다.


 시민 데이터 과학자(Citizen Data Scientist) 환경을 제공


이러한 서비스들은 SCM 수요 분야에서 엑셀의 통계 함수 활용법 정도만 알아도 과거에는 용어조차 이해하기 어려웠던 통계 패키지와 머신러닝을 쉽게 활용할 수 있게 지원합니다. 시민 데이터 과학자라는 용어가 아직 보편화된 용어는 아니지만, 이러한 인공지능 환경을 제공해 보편화시키는 것을 이르는 용어이며, 아직 서비스가 시작된 지 얼마 되지 않았고, 아직은 많은 기업이 제대로 활용하기 위해 머신러닝 서비스를 학습하는 중이라고 할 수 있습니다.


아직 누가 강자인지, 어떤 서비스가 우위를 점할지 모르는 단계입니다. 여기에 두 회사와 경쟁하고 있는 마이크로소프트는 세계 최대 소스 저장소인 깃허브를 18년에 인수했습니다. 깃허브에는 엄청나게 많은 R(통계 머신러닝 언어) 소스, 커뮤니티, 공개 패키지들을 보유하고 있으며, 조만간 이러한 서비스들은 마이크로소프트의 엑셀이나 엑세스, 그리고 또 다른 시각화 도구들과 결합해 지금의 엑셀 함수와 도표 그리기처럼 사용할 수 있게 될 전망입니다.


l 출처: 아마존 2019 Seoul submit


수많은 수요 관리자들의 강력한 도구인 엑셀이 머신러닝과 결합된다면 마이크로소프트는 클라우드와 인공지능 분야에서 강력한 경쟁자가 될 것입니다. 아직은 IT 공룡 중에 누가 이 분야에 최종 강자가 될 것인지 알 수 없지만, 통계 공부로 씨름하는 것보다 시민 데이터 과학자로서 활용을 준비하고 고민하는 것이 더 유효하다고 할 수 있습니다.


글 l LG CNS 엔트루컨설팅 SCM/물류그룹


* 해당 콘텐츠는 저작권법에 의하여 보호받는 저작물로 LG CNS 블로그에 저작권이 있습니다.

* 해당 콘텐츠는 사전 동의없이 2차 가공 및 영리적인 이용을 금하고 있습니다.



Posted by IT로 만드는 새로운 미래를 열어갑니다 LG CNS
위로