IT Life

중단 없는 사물인터넷(IoT)을 위하여, 장애허용시스템(FTS)

2015.04.08 09:59

이번 스페인 바르셀로나에서 개최된 모바일 월드 콩그레스(MWC) 2015의 핵심 주제는 바로 사물인터넷(Internet of Things, IoT)이었습니다. 특히, 자동차 관련 사물인터넷(IoT) 기술이 눈에 띄었는데요. 오늘은 사물인터넷(IoT) 제품에 대한 소개와 함께 이들의 보안 시스템을 완성하는 장애허용시스템에 대해 소개해 드리도록 하겠습니다. 


 

<‘MWC 2015’에서 LG전자의 모델들이 스마트워치 ‘LG 워치 어베인 LTE’로 아우디 자동차를 제어하는 모습

(출처: LG전자 보도자료)>


‘MWC 2015’에서는 자동차 관련 사물인터넷(IoT) 기술의 최신 모델이 소개 되었습니다. LTE를 넘어 5G 네트워크를 자동차에 직접 구현하는 기술도 나왔는데요. 아우디 미국 지사는 AT&T와 합작하여 2016년형 아우디 자동차에 4G/LTE 유심(USIM)을 탑재하였습니다. 이를 통해 자동차 안에서도 무선인터넷 관련 서비스를 제공받을 수 있게 된 것입니다. 


자동차뿐만이 아닙니다. 웨어러블 디바이스(Wearable Device)형 사물인터넷 제품 중 헬스케어(Healthcare) 제품들이 다수 선보였습니다. 특히, 스마트워치(Smart Watch)의 핵심 기능으로 GPS(Global Positioning System)나 자이로센서(Gyro Sensor), 심박측정센서 등이 눈에 띄었습니다. 


이번 ‘MWC 2015’에서 본 바와 같이 다양한 센서를 활용한 헬스케어 기능이 본격적으로 자리 잡기 시작하고 있으며, 앞으로 사물인터넷(IoT) 제품과 그 기술을 활용하는 서비스 분야 모두에서 큰 도약이 있을 것이라고 예상됩니다. 

 

장애 허용 시스템(Fault tolerant system, 이하 FTS)은 결함 감내 시스템이라고 불리기도 합니다. 기본적으로 FTS는 시스템 내부의 부품에서 결함이나 고장이 발생하여도 부분적 혹은 정상적으로 기능을 수행할 수 있도록 하는 시스템을 말합니다. 즉, 문제 발생 시 관리자가 조치를 하는 동안 정상 상태와 마찬가지로 구동할 수 있도록 해주는 것이죠. 물론, 문제가 지속되면 다른 시스템 장애로까지 이어져 치명적인 시스템 손상을 일으킬 수 있습니다. 따라서 고장 시 장애 발생에 대비할 수 있는 시간을 최대한 확보해 주는 것이 FTS 기술의 핵심입니다. 


FTS는 전력선 배분 시스템이나 신호등 제어 시스템처럼 사회 기반 시설에 가장 많이 적용되고 있는데요. 비행기나 배에서 사용하는 항로 제어 시스템에도 FTS가 적용됩니다. 이처럼 FTS는 보통 고장이 발생하면 인명이나 재산에 피해를 일으키는 안전 필수 및 임무 필수 분야에 적용되는 내장형 시스템(Embedded System)입니다. 그리고 최근 사물인터넷(IoT) 기술의 확산과 함께 FTS의 적용분야가 사물인터넷으로 확산되기 시작했습니다. 

 

최근 FTS를 많이 적용하는 사물인터넷(IoT) 분야는 헬스케어(Healthcare)입니다. 헬스케어 사물인터넷은 보통 GPS나 자이로센서 등을 이용해 운동량, 심박수 등을 측정, 계산하는 수준이죠. 그런데 여기에 FTS를 적용하면 훨씬 광범위한 기능을 수행할 수 있습니다.


예를 들어, 사물인터넷을 적용한 헬스케어 기기로 환자의 건강관리를 한다고 가정해보면 병원에서는 사물인터넷을 통해 환자의 상태에 대한 정보를 전송 받고, 빅데이터로 이를 분석해야 합니다. 이를 가능하도록 하기 위해서는 환자의 상태를 검사한 후 정확한 값을 고장 없이 지속적으로 전송할 수 있어야 하는데요. 따라서 FTS는 안정적 서비스 제공을 위해 필수적인 기능이라고 할 수 있습니다.  

<환자의 상태 정보 확인할 수 있는 스마트워치(Smart Watch)>


최근 대형 병원의 병원 간 연계 시스템은 인터넷 기반으로 구축하여 내부 시스템의 데이터를 송수신하고, 병원의 각종 서비스를 취합해서 데이터를 통합, 분석하는 방향으로 나아가고 있는데요. 결국 각 시스템의 말단 센서의 연결은 인터넷을 통해 이루어지게 되므로, 사물인터넷 시스템 구축은 자연스러운 흐름이라고 할 수 있습니다. FTS가 센서 부문까지 확장되는 추세라고 볼 수 있죠. 따라서 더 정확한 정보를 수집하고 시스템을 유지하기 위해 FTS 도입은 필연적인 흐름입니다. 

 


일반적으로 FTS에서 제공하는 장애 복구 방식은 롤백(Roll-back) 방식이중화 방식으로 나뉩니다. 


‘롤백 방식’은 시스템이 고장난 시점의 이전 상태로 시스템의 상태를 되돌리는 것을 말합니다. 이를 위해, 시스템은 정상 상태일 때 현재의 상태를 스냅샷(Snap shot) 방식으로 저장하고 점검 지점을 지정해 둡니다. 이후 특정 문제가 발생하면 지정한 점검 지점으로 이동해 저장한 스냅샷으로 복구를 진행하죠. 


또 하나는 ‘이중화 방식’입니다. FTS에서 사용하는 이중화 방식은 복제(Replication), 다중화(Redundancy), 다양화(Diversification)로 나뉠 수 있는데요. 

<FTS의 복제 방식 개념도> 


‘복제 방식’은 같은 시스템을 복수로 준비해 병렬로 실행시킵니다. 그런 다음 다수의 시스템을 만족한 결과를 올바른 결과로 채택합니다. 하나의 값으로 시스템이 작동하다가 문제가 생기더라도 이미 작동 중인 다른 시스템에서 제대로 된 값을 찾아 채택하는 것입니다. 

 

<FTS의 다중화 방식 개념도> 


‘다중화 방식’은 동일한 시스템을 복수로 준비해 구동합니다. 마스터-슬레이브(Master-Slave) 방식, 혹은 액티브-스텐바이(Active-Standby) 방식으로 불리는데요. 마스터나 액티브가 문제가 생겼을 때 슬레이브나 스텐바이 시스템을 구동시키죠. 기본적으로 서버 시스템에서 가장 많이 사용하는 방식입니다. 

 

<FTS의 다양화 방식 개념도> 


‘다양화 방식’은 같은 성능의 서로 다른 형식의 하드웨어를 여러 개 준비합니다. 그 위에 복제 방식과 같이 동일한 시스템을 운용하죠. 다양화 방식의 특징은 모든 시스템에서 똑같은 장애가 일어나지 않기 때문에 제대로 된 값을 찾아서 장애를 복구할 수 있다는 점입니다. 


이처럼 보통 FTS는 롤백 방식과 이중화 방식으로 시스템의 장애를 허용하고 복구하는 메커니즘을 운용합니다.

 

사물인터넷에서 사용할 수 있는 FTS의 방식은 이중화 방식의 복제와 다중화입니다. 


‘복제 방식’의 경우 사물인터넷 시스템에서 장애로 인해 잘못된 값을 생산하는 것을 막을 수 있습니다. 뿐만 아니라, 정상적인 상황에서도 생성된 값을 바로잡을 수 있는 장점이 있습니다. 


다만 동일한 시스템을 2개 이상 준비해서 운용해야 하므로 실제로 시스템에 들어가는 자원의 소모가 많습니다. 사물인터넷 시스템이 대부분 내장형 시스템(Embedded System)을 기반으로 합니다. 그래서 일반 PC보다 시스템 자원 환경이 제한적일 수밖에 없는데요. 따라서 복제 방식에서는 자원 효율성의 문제가 발생합니다. 


‘다중화 방식’은 동일한 시스템을 2~3대 운영하지만, 메인으로 사용되는 시스템에 주력 자원이 들어가고 나머지는 대기 자원에 배치됩니다. 그래서 복제 방식보다는 자원 효율성은 좋은 편이죠. 하지만 단점이 없는 것은 아닙니다. 시스템 자체에서 생긴 문제로 인해 잘못된 데이터가 생산될 수 있죠. 


따라서, FTS를 도입하는 입장에서는 성능 면에서 복제 방식이 다중화 방식보다 우수하지만 시스템 환경의 제약이 있어 사물인터넷 시스템에서는 다중화 방식을 많이 사용합니다. 


사물인터넷으로 영역이 확대되면서 정확한 데이터 수집을 위한 FTS의 역할은 점차 증가하고 있습니다. 앞서 소개한 자동차 분야도 마찬가지이죠. 시스템 장애로 차량 제어에 잘못된 데이터가 생성된다면 그 피해는 엄청날 것입니다. 이것이 바로 FTS가 ‘선택이 아닌 필수’로 자리 잡을 수 밖에 없는 이유일 것입니다. 


글 l 이학준 (http://poem23.com/ 필명: ‘학주니’)



Posted by IT로 만드는 새로운 미래를 열어갑니다 LG CNS
위로