상단으로 이동하기

'스마트 스피커' 글로벌 IT 기업들의 격전장Posted Jul 4, 2017 3:26:51 PM

이상우

읽을 가치가 있는 글을 쓰고 싶습니다.
aspen@thegear.co.kr

아마존, 구글, 마이크로소프트(MS), 애플… 글로벌 IT 기업들이 앞다퉈 스마트 스피커 경쟁에 합류하고 있다. 아마존 에코 시리즈는 출시 2년 만에 미국 등 글로벌 시장에서 500만대 이상 판매됐다. 아마존 에코를 뒤쫓는 구글은 작년 11월 '구글 홈'을 내놨고 애플은 이달 열린 개발자 콘퍼런스에서 '홈팟'의 연말 출시를 예고했다. 마이크로소프트도 가을 경 하만카돈과 협력해 코타나가 구동되는 '인보크'를 투입하며 안드로이드의 아버지 앤디 루빈(에션셜 홈)도 가세한다.

국내서는 통신사가 적극적이다. SK텔레콤은 작년 9월 '누구' 출시 후 지금까지 10만 대를 판매했다. KT도 올해 초 스피커형 셋톱박스 '기가지니'를 내놨다. 네이버는 일본 메신저 자회사인 라인과 함께 인공지능 플랫폼 클로바를 적용한 스마트 스피커 '웨이브'를 올 가을 공개한다. 스피커에서 라인 메시지를 주고 받을 수 있게 될 전망이다. 때아닌 스마트 스피커 붐이다.

참고 링크 : 인공지능 스피커가 인기 있는 4가지 이유


인공지능의 진화

스마트 스피커는 '인공지능(AI) 음성비서'를 내장한 인터넷 연결형 무선 기기다. 사용자 목소리 인식을 위한 마이크가 내장된다. "음악을 재생해 줘"라고 말하면 음악이 재생되는 식이다. 음성으로 인터넷 검색이나 일정을 확인하고 스마트폰과 연동해 전화를 걸 수도 있다. 아마존 에코는 전등이나 TV 등 가전기기 제어와 아마존 쇼핑몰과 연계해 자동 주문하는 기능도 포함됐다. 사용자와 소통하는 음성은 일방적인 요청은 물론 자연어와 대화의 맥락을 이해하고 사용자 행동 패턴을 분석한 필요한 서비스를 제공하는 끊임없이 진화하고 있다.

<표 1> 글로벌 IT 기업의 주요 스마트 스피커와 플랫폼[<표 1> 글로벌 IT 기업의 주요 스마트 스피커와 플랫폼]


최근 스마트 스피커가 쏟아지고 있는 배경은 무엇보다 인공지능의 빠른 진화가 꼽힌다. 음성비서와 인간처럼 대화하려면 대화의 의도와 패턴을 인공지능이 학습하고 이해해야 한다. 학습에 필요한 데이터는 많을수록 인공지능은 빨리 사람의 말을 이해하고 사람은 더 편리하게 사용할 수 있기 때문에 글로벌 IT 기업들은 스마트폰 등에 음성비서를 탑재하고 방대한 데이터 수집에 공을 들이고 있다. 스마트 스피커도 이런 데이터 수집에 유용한 도구다. 왜냐하면 스마트폰 다음으로 사용자가 거부감이 없이 말을 건넬 수 있는 장치로 인식되어서다. 공간을 자유롭게 올길 수 있다는 점도 매력적이다.

LG전자는 CES 2017에서 알렉사 플랫폼이 적용된 가전제품을 공개했다. [LG전자는 CES 2017에서 알렉사 플랫폼이 적용된 가전제품을 공개했다. ]

주요 글로벌 기업들이 인공지능 음성인식 기술을 대하는 공통점은 개방이다. 모바일 시대를 맞아 구글은 안드로이드 운영체제를 누구나 쓸 수 있도록 개방하며 시장을 장악했다. 지금처럼 생태계가 중요한 시대에는 자사 플랫폼이 많이 퍼져 사용될수록 이득이다. 아마존은 보다 광범위한 생태계 구축을 위해 누구든 자유롭게 알렉사를 갖다 쓸 수 있도록 'ASK(Alexa Skills Kit)'이라는 개발 킷을 보급해왔다. 타사도 알렉사를 탑재해서 음성으로 피자를 주문하고 택시를 부르고 드론을 제어하는 등의 기능을 제공할 수 있다. 불과 6개월 만에 7000개가 넘는 파트너를 확보했다. LG전자, 화웨이, 폭스바겐 등이 알렉사를 적용한 서비스를 제공하거나 준비 중이다.


애플 홈팟 내부 구조[애플 홈팟 내부 구조]

애플 홈팟은 거실 한복판에서 말을 걸듯 시리에게 명령을 내릴 수 있다. 하지만 홈팟은 음성인식 보다는 트위터, 우퍼, 오디오 프로세서 등의 음악, 특히 애플뮤직에 초점을 맞췄다. 시리의 개념 정의가 워낙 광범위하고 지속적으로 변화하는 측면이 많아 음성인식 기능을 너무 강조해 한 쪽으로 고착화시키지 않으려는 똑똑한 결정이다. 사운드 품질 강조만으로도 홈팟은 아마존 에코의 최대 약점을 효과적으로 공략했다. 깊으면서도 깨끗한 베이스 음색을 구현하는 대형 우퍼, 맑은 고영역대 어쿠스틱 음색을 구현하는 7개의 빔포밍 트위터, 애플 A8 고성능 칩이 탑재되고 6개의 마이크로폰 배열을 통한 공간 제약 없는 음성 제어가 특징이다. 영어, 중국어, 프랑스어, 독일어, 이탈리아어, 스페인어 등 6개국어를 우선 지원하며 올 연말 미국과 영국, 호주에서 먼저 판매가 시작된다.



투명한 프라이버시 정책 필요

스마트 스피커는 사용자와 자연스러운 대화뿐아니라, 사용성 측면에서 아직 해결해야할 과제가 많다. 예를 들면 아마존 에코는 영어권 이외 언어 지원을 이제 시작했고 아이 목소리와 TV에서 나오는 소리를 사용자 목소리로 착각해 온라인 쇼핑에서 물건을 주문한 일도 있었다. 개인정보보호도 중요하게 다뤄져야 한다. 스마트 스피커는 대기 중에도 마이크가 켜져 있기 때문에 대화 내용과 음성 명령이 항상 수집되고 무선 인터넷을 통해 클라우드 서버로 전송되기 때문에 데이터 도난이나 해킹에 대한 우려가 있다. 에션셜 홈은 상단 디스플레이를 통해 작동 중임을 알 수 있게 했으며 애플 홈팟은 음성 분석을 본체 내부에서 처리한다고 밝혔다.

디스플레이가 작동 중 상태를 알려주는 에션셜 홈[디스플레이가 작동 중 상태를 알려주는 에션셜 홈]

어쨌든 음성인식은 스마트폰과 스피커에서 출발, 스마트 가전으로 확산되고 있다. 가전제품들은 점점 더 기능이 복잡해지고, 사물인터넷을 통해 가전끼리 정보를 주고 받는 단계에 이르렀다. 이렇게 기능이 많아지면 당연히 제어도 복잡해진다. 스마트 가전은 복잡한 리모컨을 대신해 스마트 스피커를 통해 목소리로 명령을 내릴 수 있는 환경을 구축하는데 방점을 두고 있다. 자동차 업체들도 물리적인 접촉을 하지 않고 차량의 다양한 기능을 제어할 수 있는 방법을 생각하기 시작했다.

자동차 산업 시장조사기관인 IHS에서 미국 등 주요 국가의 자동차 소비자들을 대상으로 설문조사를 실시한 결과 가장 선호하는 자동차 인터페이스는 터치스크린과 음성 인식 방식인 것으로 조사됐다. 음성으로 모든 것을 제어할 뿐만 아니라 몸짓과 시선 등 제스처 입력 인터페이스가 결합된 케이스도 등장할 것이다. 스마트 스피커의 핵심 기능의 딥러닝 기반 음성인식 기술은 로봇 분야로 영역을 넓혀간다. 샤프의 '로보홍'을 비롯해 에이수스 '젠보'와 독일 보쉬의 '쿠리' 등 선두 업체들의 제품이 놀라운 변화를 예고하고 있다.  


이 기사를 읽은 분들은 이런 기사도 좋아했습니다.