정보 !일반 상식 이야기

"전 세계가 먹통 됐다" 패닉…순식간에 '대혼란' 빠졌다

하나님아들 2024. 7. 20. 01:15

"전 세계가 먹통 됐다" 패닉…순식간에 '대혼란' 빠졌다

이주현/김인엽/이승우2024. 7. 19. 
MS 클라우드 먹통…세계가 멈췄다
패닉 빠진 '초연결 사회'
美·獨·인도 등 항공기 결항
국내 LCC 예약·발권 차질
금융·방송·통신 동시 마비
"한 곳의 장애, 세계에 타격"
< 독일공항 대혼란 > 19일 독일 함부르크 공항 제1터미널이 항공권 발권을 기다리는 승객으로 가득 찼다. 마이크로소프트 클라우드 서비스에 오류가 발생하면서 이를 기반으로 운영되는 온라인 발권 시스템 ‘나비테어’가 마비된 영향이다. AP연합뉴스


미국 마이크로소프트의 클라우드 서비스 장애로 전 세계가 혼란에 빠졌다. 각국 항공사를 비롯해 영국 금융가, 언론사 등의 서비스가 먹통이 됐다. 모든 데이터와 서비스가 클라우드로 집중되는 ‘초연결’ 사회에서 한 번의 장애가 얼마만큼 광범위하게 영향을 미칠 수 있는지를 보여준 사례라는 지적이 나온다. 

19일 로이터, AP통신 등에 따르면 마이크로소프트 클라우드 서비스에서 장애가 발생하면서 미국 내 일부 항공편이 결항했다. 로이터통신에 따르면 아메리칸항공, 델타항공, 유나이티드항공 등은 이날 오전 일부 항공편의 운항을 중단했다. 미국 저비용항공사(LCC)인 프런티어항공도 일부 항공편 운항을 일시 멈췄다.

 

데이터 추적업체 플라이트웨어에 따르면 프런티어항공은 이날 항공편 147편을 취소하고 212편을 지연시켰다. 미국뿐 아니라 다른 국가에서도 항공편이 결항하거나 체크인이 지연되는 사례가 나왔다. 인도에서는 인디고, 아카사항공, 스파이스제트 등이 이륙을 취소하고 항공편 운행을 일시 중단했다. 독일과 호주에서도 항공편이 대거 결항했다. 베를린 국제공항은 “기술적 결함으로 인해 체크인이 지연되고 있다”고 했다.

국내에서도 제주항공, 이스타항공, 에어프레미아 등 일부 LCC의 항공권 예약·발권 시스템에 오류가 발생했다. 온·오프라인 모두에서 항공권 예약에 오류가 생기면서 이날 공항에서는 직원들이 수기로 발권했다.

서비스 장애를 겪은 업체는 마이크로소프트 클라우드 서비스를 기반으로 운영되는 스페인 아마데우스의 발권 시스템인 ‘나비테어’를 사용하는 것으로 알려졌다. 클라우드는 한데 집중해 서버를 쓰는 경우가 많아 중앙부에서 문제가 생기면 관련 서비스를 이용하는 업계 전체에 영향을 미칠 수 있다.

클라우드를 도입하는 기업과 기관이 늘면서 전 세계적 클라우드 장애가 빈번해질 수 있다는 우려가 제기된다. 클라우드 시장은 점점 커지고 있다. 특히 생성형 인공지능(AI)을 비롯해 대규모 컴퓨팅 파워가 있어야 하는 서비스가 증가하면서 클라우드의 중요성도 커지고 있다.

세계적으로 가장 많이 쓰이는 오픈AI의 챗GPT 역시 마이크로소프트의 클라우드를 사용한다.

< 국내 LCC, 수기 발권 대응 > 미국 마이크로소프트(MS)의 클라우드 서비스를 사용 중인 제주항공과 이스타항공, 에어프레미아 항공권 예약 및 발권 시스템에 19일 오류가 발생했다. 제주국제공항 출발층 발권 카운터에서 제주항공 직원들이 항공권을 수기로 발급하고 있다. 연합뉴스

 데이터 한곳에 두는 클라우드…사고 터지자 전세계 '속수무책'
글로벌 2위 마이크로소프트 클라우드 먹통 '대혼란'

19일 전 세계에서 벌어진 온라인 플랫폼 장애의 원인은 마이크로소프트의 클라우드 서비스 오류다. 이 회사에 따르면 두 종류의 서비스가 문제를 일으켰다. 하나는 전 세계 항공사들이 사용하는 스페인 아마데우스의 발권 시스템 ‘나비테어’다. 다른 하나는 클라우드 보안을 위해 적용한 미국 보안 업체 크라우드스트라이크다.

 

 ○파리올림픽도 비상계획 가동

나비테어는 항공권 예약과 발권 등을 지원하는 승객 서비스 시스템(PSS)이다. 대형 항공사보다는 노선이 많지 않은 지역항공사와 저비용항공사(LCC)가 주요 고객이다. 나비테어는 마이크로소프트의 클라우드 서비스 애저(azure)를 통해 서비스 중이다. 나비테어에 문제가 생기면서 이 시스템을 도입한 전 세계 항공사에서 문제가 동시다발적으로 발생했다.

다른 문제는 미국 사이버 보안기업 크라우드스트라이크의 업데이트 오류다. 이 회사는 공지를 통해 “자사의 새로운 센서 업데이트와 관련된 것으로 보인다”고 밝혔다. 임시로 시스템을 정상화하려면 문제를 일으킨 일부 sys 확장자 파일을 삭제하거나 폴더 이름을 변경해야 한다고 설명했다.

호주 시드니 한 슈퍼마켓의 결제 장비에 오류를 알리는 ‘블루 스크린’이 떠 있다. AFP연합뉴스

두 건의 오류는 전 세계적으로 파장을 미쳤다. 항공사는 물론 금융가와 언론계도 혼란에 빠졌다. 영국 보도 매체인 스카이뉴스는 기술적 문제로 이날 오전 한때 생방송 송출을 중단했다. 런던증권거래소(LSE)는 이날 오전 8시에 장을 열었지만, 전날 마감 가격이 그대로 떠 있었다. LSE 모기업인 LSEG가 소유한 뉴스·데이터 플랫폼 워크스페이스가 통신 문제를 겪으면서다. 서던, 템스링크, 개트윅익스프레스 등 영국 철도회사들도 “광범위한 정보기술(IT) 문제로 지연이 예상된다”고 공지했다.

호주와 뉴질랜드의 주요 도시에선 항공편 결항은 물론 이동통신, 은행 서비스, 방송 등도 한때 정지됐다. 이스라엘과 독일에선 병원 시스템 이상으로 수술 등이 취소되기도 했다. 오는 24일 개막을 앞둔 파리올림픽도 클라우드 장애의 영향을 받았다. 파리올림픽 조직위원회는 이날 성명을 통해 “전 세계적 사이버 정전 사태로 IT 서비스 운영에 피해가 발생했다”며 “업무를 계속하기 위한 비상계획을 가동했다”고 밝혔다.

 ○사고 한 번에 전 세계 마비 우려도

클라우드는 ‘구름’이라는 단어 그대로 각종 데이터를 기업이나 기관이 보유한 서버가 아니라 외부 서버에 저장하는 기술이다. 이용자 입장에선 직접 서버를 갖춰 운영할 필요 없이 이용한 만큼만 비용을 낼 수 있어 경제적이다. 클라우드는 시간이 지나면서 빠르게 진화하고 있다. 단순히 데이터를 외부 서버에 저장하는 서비스형 인프라(IaaS)에서 클라우드 내에서 각종 소프트웨어를 제공하는 서비스형 소프트웨어(SaaS)로 시장의 중심축이 이동하고 있다. 전사적자원관리(ERP), 고객관계관리(CRM), 공급망관리(SCM) 등 기업용 솔루션 대다수가 SaaS 형태로 제공되고 있다.

생성형 인공지능(AI)의 부상과 함께 클라우드의 중요성은 더욱더 커지고 있다. 생성 AI는 학습과 추론에 그래픽처리장치(GPU), 신경망처리장치(NPU) 같은 컴퓨팅 파워가 필요하다. 개인용 컴퓨터나 기업이 보유한 서버에서 이 같은 작업을 수행하기란 사실상 불가능하다. 이 때문에 대부분 생성 AI는 클라우드 형태로 제공된다. 글로벌 3대 클라우드 기업인 아마존웹서비스(AWS), 마이크로소프트, 구글클라우드는 물론 네이버클라우드 같은 국내 업체들도 AI를 구동할 수 있는 하이퍼스케일 데이터센터 건립에 적극적이다.

업계에서는 이번 사고로 클라우드 시스템의 결정적인 단점이 드러났다는 지적이 나온다. 핵심 시스템에 문제가 생기면 해당 클라우드 플랫폼을 활용하는 전 세계의 서비스가 한꺼번에 중단될 수 있다는 점이 확인됐다는 설명이다. 업계 관계자는 “분산형 시스템 설계에 대한 클라우드 고객들의 요구가 본격화될 것”이라고 말했다.

마이크로소프트의 클라우드 서비스는 작년에도 두 차례 접속 문제를 겪었다. 지난해 1월엔 네트워크 연결 문제로 약 90분 동안 애저, 팀즈, 아웃룩 등 다수 서비스에서 접속 장애가 발생했다.

지난해 6월에는 해커집단의 분산서비스거부(DDoS) 공격으로 오피스 제품군과 클라우드 서비스 접속에 문제가 생겼다.

이주현/김인엽/이승우 기자 deep@hankyung.com