상단으로 이동하기

마이크로소프트 '코타나' 포스트PC 시대의 플랫폼Posted Jan 19, 2017 1:19:07 PM

이상우

읽을 가치가 있는 글을 쓰고 싶습니다.
aspen@thegear.co.kr

마이크로소프트(MS)는 올해 자신들의 취약점을 보완하는 새로운 카테고리의 윈도우 기기에 주목하고 있다. 이 회사는 지난해 12월 중국 심천에서 진행된 하드웨어 개발자 컨퍼런스 '윈헥'에서 '코타나와 회화 플랫폼'과 '관리가 쉬운 높은 신뢰성의 윈도우10 사물인터넷'이라는 2가지 흥미로운 섹션을 진행했다. 윈도우 음성 인식 기능인 '코타나'의 플랫폼화를 위한 움직임이라는 분석이다. 3월 공개될 윈도우10의 '크리에이터스 업데이트'에서 마이크로소프트는 코타나의 새 기능으로 '원거리 음장'와 '웨이크 온 보이스 프롬 모던 스탠바이(Wake on Voice from Modern Standby)'를 추가한다. 원거리 음장 기능은 주위 소음을 뚫고 4~5미터 거리에서 음성 명령을 인식하는 것을 뜻한다. 웨이크 온 보이스 프롬 모던 스탠바이 기능은 전원을 끈 상태부터 완전히 켜진 상태까지 단계별 전력 조절이 되는 디스플레이다.
마이크로소프트도 아마존 에코처럼 인공지능 스피커 시장에 뛰어든다는 얘기다.


MS 인공지능 스피커는 디스플레이 달린 아마존 에코

두 섹션의 핵심은 코타나와 윈도우10 IoT 코어다. 윈도우10 IoT 코어는 사물인터넷 기기 개발에 최적화된 OS다. 우리가 일반적으로 사용하는 윈도우를 사물인터넷 기기에 맞게 커스터마이징한 것이다. 그래서 윈도우10 IoT 코어는 데스크톱 PC 윈도우보다 요구되는 메모리 용량이 적고 프로세서 성능 또한 뛰어나지 않아도 된다. 최소 메모리 용량은 256~512MB이고, 저장 공간도 2GB이면 충분하다. 이것은 음성 인식 기능이 적용된 윈도우10 IoT 기반 사물인터넷 기기 개발의 비용 절감으로 연결될 가능성이 높다.

윈도우10 크리에이터스 업데이트에 맞춰 윈도우10 IoT 코어에는 디스플레이가 붙어 있는 사물인터넷 기기의 코타나 지원이 예정돼 있다. MS가 공개한 자료(Windows 10 IoT Core + Cortana)도 아마존 에코와 같은 윈도우10 기반의 다양한 음성 인식 제품 출시 가능성을 높인다. 아마존이 2015년 6월 출시한 아마존 에코는 비단 음악만 틀어주는 것이 아니라 음성 명령을 통해 다양한 기기를 제어하고 스피커를 통해 사용자가 정보를 습득할 수 있는 "스마트 홈 구현을 위한 제품"이라는 평가를 받아왔다. 아마존 에코에 탑재되는 음성 비서 '알렉사'는 사용자 음성 명령에 음악, 영상 재생을 하고 심지어 오늘의 날씨와 뉴스를 알려준다. 아마존은 개발자 포럼을 통해 알렉사 API와 툴, 문서, 코드 샘플 등을 공개하며 서비스와 관련 제품 출시를 독려하고 있으며 최종적으로 아마존이 중심이 되는 스마트홈 에코 시스템 구축이 목표다. 일단 아마존이 초반 기세를 잡은 것은 분명하다.

지난 5일부터 8일까지 미국 라스베이거스에서 열린 'CES 2017'은 아마존 알렉사의 무서운 기세를 확인할 수 있는 자리였다. 아이러니하게도 아마존은 CES에 자사 제품을 전혀 내놓지 않았다. 그런데도 알렉사를 흡수한 제품은 자동차에서 가전제품에 이르기까지 망라되어 있다. 포드자동차는 차내에서 알렉사에게 좋아하는 스포츠 팀 경기 결과를 물어보거나 주행 중 집 주차장 셔터를 조작하고 슈퍼마켓에 물건을 주문할 수 있다고 밝혔다. LG전자는 공항 안내 로봇과 잔디깎이 로봇, 허브 로봇에 알렉사를 적용했다. LG전자는 스마트 냉장고에도 알렉사 기능을 연동한다. 중국 화웨이는 최신 스마트폰 '메이트 9'에 알렉사를 탑재했으며, 레노버도 알렉사를 넣은 '레노버 스마트 어시스턴트'를 내놓았다. 이 같은 알렉사의 진격은 당분간 이어질 것으로 보인다.


4미터 거리에서 음성 인식

마이크로소프트의 코타나 플랫폼화 전략도 아마존 에코와 사실 많이 다르지 않다. 윈도우10 두 번째 업데이트 '크리에이터스 업데이트'에서 코타나는 PC를 직접 조작할 수 없는 조금 떨어진 거리에서 음성 명령을 인지하는 것은 물론 심지어 PC가 없는 공간에서의 사용도 가능하다. 윈도우폰 8.1에 처음 탑재된 코타나는 개인 음성 비서로 출발해 윈도우10에 옯겨와서도 "PC 앞에 앉아 있는 사용자와의 대화"에 치중했다. 엑스박스 원에서는 TV와 물리적인 거리가 있기에 좀 떨어진 거리에서 음성 제어가 되도록 개선이 있었지만 대체적으로 근거리(Near-field)에서 상호 작용에 초점을 뒀다. 그러나 윈도우10 크레에이터스 업데이트는 원거리 음장(Far-field) 기능이 추가돼 몇 미터 떨어진 장소에서 음성 제어는 물론 절전 모드에 있어도 음성 명령에 반응해 깨어나도록 했다. 기존 컴퓨터 활용을 넘어선 스마트홈 그러니까 아마존 에코 같은 새로운 기기의 등장을 예고하는 업데이트인 것이다.

현재 윈도우10에 탑재된 코타나는 컴퓨터와 사용자 사이의 거리가 50cm 정도로 가까워야 음성 명령에 반응을 한다. 코타나의 제약이기 보다 컴퓨터에 내장된 스피커에 따른 제한이다. 컴퓨터 내장 또는 외장 표준 마이크 대부분은 사용자가 컴퓨터 바로 앞에서 화면을 바라보는 것을 기준해 노이즈를 최대한 줄여 편안하게 쓰도록 튜닝 되어 있다. 그래서 원거리에서도 또렷하게 음성 전달이 가능한 기술이 필요하다. 마이크로소프트는 크리에이터스 업데이트에서 추가하는 원거리 음장 기능이 4m 정도 떨어진 장소에서도 코타나가 응답한다고 한다. 꽤 멀다. 이 거리에서 사용자 음성을 정확하게 알아 듣는 마이크가 필요한 만큼 아마존 에코를 닮은 디스플레이 달린 윈도우10 기기가 논리적으로 힘을 얻는다. 디스플레이는 윈도우10 IoT 코어의 기본 지원 사양이다. 애플도 마이크로소프트와 비슷한 생각이다. 애플 필 쉴러 부사장은 미국 백채널과 인터뷰에서 최고의 인공지능은 구글 홈이나 아마존 에코처럼 "주방이나 벽에 걸어두는 것"이 아니라 아이폰처럼 항상 사용자 가까이 있는 존재라며 디스플레이의 가치와 중요성을 강조했다.

마이크로소프트가 코타나를 통해 주시하는 미래는 스마트폰 '다음'이다. 키보드나 마우스 중심의 인터페이스를 사용하는 PC에서 터치 인터페이스를 사용하는 스마트폰으로 컴퓨팅은 진화했다. 스마트폰 시대의 터치 인터페이스 다음은 사물인터넷 시대가 되면서 음성이 된다는 것이 마이크로소프트의 생각이다. 전문가들은 오래전부터 음성이 마우스, 키보드 같은 기존의 인터페이스를 대체할 가장 강력한 인터페이스라고 예측했다. 대화만큼 편리한 인터페이스가 어디 있겠는가. 스타트랙 같은 SF 영화에서 흔히 보는 인공지능 로봇의 인터페이스도 바로 음성이다. 


참고 링크 : 인공지능 스피커가 인기 있는 4가지 이유

이 기사를 읽은 분들은 이런 기사도 좋아했습니다.