지능형 음성인식이 요즘 스마트폰 시장의 핵심 화두다. 애플이 지난해 6월 지능형 음성인식 기능인 '시리'를 출시했고 팬택, 삼성전자, LG전자가 잇따라 자사 스마트폰에 지능형 음성인식 기능을 도입했다. 구글도 지난달 27일(현지시간) 미국 샌프란시스코에서 열린 연례 개발자 콘퍼런스에서 지능형 음성인식 기능을 추가한 새 운영체제(OS) 안드로이드 4.1(코드명 젤리빈)을 공개하고 나섰다.

 

그렇다면 각 기업이 자사 스마트폰의 핵심 기능으로 내세우는 음성인식 기술은 얼마나 뛰어나며 어떤 기능을 수행할까.

 

소비자들의 궁금증을 풀기 위해 지능형 음성인식 기능을 탑재하고 국내에 출시된 삼성전자의 '갤럭시S3', LG전자의 '옵티머스뷰', 팬택의 '베가레이서2'와 애플의 '아이폰4S'(iOS6 베타1 버전)를 입수해 지난달 28일과 29일 이틀에 걸쳐 야심한 밤, 골방에서 기계와의 대화를 시도해봤다.

 

◆스마트폰이 친구가 된다

 

"안녕?"

첫 만남이니만큼 일단 인사로 출발해본다.

갤럭시S3(이하 갤스)는 "만나서 반갑습니다." 옵티머스뷰(이하 뷰)는 "안녕하세요", 아이폰4S는'(이하 4S) "네 안녕하세요, 준"하고 답한다. 베가LTE2(이하 베가)는 "죄송합니다. 하신 말씀을 이해하지 못했습니다. 웹을 검색할까요?"라며 친구가 되기를 거부한다.

 

"만나서 반가워."

친근함을 표시했더니 갤스는 "반갑습니다. 앞으로 잘 부탁드리겠습니다"라고 친절하게 인사한다. 뷰는 "그러네요. 별일 없으셨어요? 그동안?"이라고 한다. 우리 전에 본 적 있었나?

4S는 "네 인터넷에서 만나서 반가워를 검색해 드려도 될까요?"라고 한다. 물 건너온 지 얼마 안 돼서 그런지 한국말을 잘 이해를 못 한다. 베가는 이번에도 "죄송합니다…"라고 한다. 이 녀석은 친근한 말 상대는 아니다.

 

이어 "사랑해"라고 하자 "사랑한다는 말은 그리 간단히 뱉을 수 있는 말이 아니랍니다"(갤스), "우린 그럴 수 없는 사이라는 걸 잘 아시잖아요"(4S), "에이, 부끄럽게, 저도 사… 사… 사랑합니다"(뷰)란다. 베가는 역시 "죄송합니다…"만 반복한다. 기계와의 사랑은 아직 무린가 보다.

 

◆전화 걸기·문자 보내기 음성으로

 

"집에 전화 걸어줘."

장난스러운 인사는 이제 그만하고 기능 테스트에 들어가 본다.

"누구에게 전화하시겠어요?"(갤스, 베가), "이름을 말씀하세요"(뷰), "집 전화번호로 전화 거는 중"(4S). 집을 알고 있는 건 4S뿐이다. 4S는 '집'이라는 검색 항목이 따로 존재하고 국산 스마트폰들은 1음절의 단어는 잘 못 알아듣는다.

 

"조풍연한테 내일 오후 5시에 종각역에서 보자고 문자 보내줘."

친구이름을 빌려 문자 보내기 테스트를 해본다. 발음이 어려운지 '풍연', '종각'이라는 단어를 대부분의 스마트폰이 알아듣질 못한다. 뷰만이 딱 한번에 알아듣고 정확하게 문자를 보내준다. 다른 녀석들은 여러 번의 시도 끝에 문자를 보낼 수 있었다. 차라리 문자를 직접 치는 게 더 빠르겠다.

 

"내일 날씨가 어때?"

너무 쉬운 주문인가 보다. 네 녀석 모두 정확히 날씨를 알려준다.

 

◆맛집 찾기·영화 검색도 손쉽게

 

이어 본격적인 아이큐 테스트에 들어간다.

 

"근처 맛집 추천해줘"

"네 알겠습니다. 일치하는 음식점 15곳을 찾았습니다. 이중 12곳은 꽤 가까이 있습니다."(4S) 그런데 15곳이 다 횟집이다. 4S는 회를 좋아하나 보다.

베가는 '맛집'으로 웹 검색을 해준다. 그런데 속초 맛집이 등장한다. '근처'라는 단어를 빼먹고 검색했다. 뷰는 서버에 연결이 안 된다며 검색을 거부한다. 먹는 데는 관심이 없는 녀석이다. 갤스는 정확하게 주변 맛집을 검색해준다.

 

"종각역에서 강남까지 가는 가장 빠른 방법을 알려줘."

길 찾기를 시도해봤다. "원하시면 인터넷에서 '종각역에서 강남까지 가는 가장 빠른 방법을 알려줘'를 검색해 드릴 수 있습니다"(4S) 과잉 친절이다.

"종각역에서 강남 가는 경로를 검색합니다"(뷰) 뷰는 버스와 지하철로 강남에 가는 방법을 정확하게 알려준다. 갤스와 베가는 그냥 종로 지도만 표시해준다.

 

"요즘 인기있는 영화가 뭐야?"라는 질문을 하자 4S는 미국 영화 순위를 보여준다. 역시 한국을 잘 모른다. 4개 스마트폰 중 뷰만이 정확하게 최신 영화를 검색해 보여준다. 똑똑하다.

 

◆조금은 어설픈 손안의 비서

 

"내일 오후 12시에 김민표와 점심식사 약속 잡아줘."

"김민표아가 누군지 모르겠군요"(4S) 자꾸 '아'를 붙인다. 몇 번 말해도 못 알아듣는다. 갤스는 이름을 빼고 '점심약속'이라고만 캘린더에 약속을 기록해 줬고, 뷰는 정확하게 약속을 기록해 준다. 베가는 약속잡기 기능을 지원하지 않는다.

 

"이번 주 스케줄을 알려줘."

갤스와 뷰가 방금 잡은 점심약속을 확인해 준다. 베가는 약속을 못 잡았으니 확인을 못 해주고, 4S는 본적이 미국임에도 '스케줄'이라는 단어를 이해하지 못한다. 일정을 확인해 달라고 하니 그제야 점심 약속을 보여준다.

계속 똑같은 질문을 던지다 보니 피로감이 몰려온다. 음성 명령으로 "내일 아침 6시에 깨워줘"라고 하니 네 녀석 모두 정확히 알람을 설정해 준다.

 

마지막으로 "잘자"라는 인사를 건네본다.

"안녕히 주무세요. 준"(4S), '안녕히 주무세요"(갤스), "좋은 꿈 꾸시고요"(뷰)

 

 

■ 음성인식 실험해 보니

 

공상과학(SF)영화 '마이너리티 리포트'와 해외 드라마 '전격 Z 작전'에는 인간과 대화를 나누는 컴퓨터와 차가 등장한다. 하지만, 영화는 영화일 뿐 불과 몇 년 전만 해도 현실과는 거리가 멀어 보였다. 스마트폰에 음성인식이 등장하기 전까지는 그랬다.

 

스마트폰에 음성인식 기능이 도입되면서 인간과 기계가 대화를 나눌 수 있게 됐다. 스마트폰은 사람의 말을 알아듣고 농담을 던지기도 한다. 아직 기초적인 수준이지만, 이들 스마트폰에 탑재된 음성기능은 대화를 축적하고 이를 다시 대화에 응용하면서 진화하고 있다. 시간이 지날수록 더 많은 단어를 이해하고 더 정확한 정답을 제시하는 '인공지능'을 갖춘 셈이다.

 

28일부터 이틀간에 걸쳐 갤럭시S3(삼성전자), 베가레이서2(팬택), 옵티머스뷰(LG전자), 아이폰4S(애플) 등 4개의 기기를 이용한 음성인식 테스트는 기능의 한계와 동시에 발전 가능성을 보여줬다.

 

이번 테스트에서 가장 정확하게 문장을 인식한 기종은 가장 늦게 음성인식 기능을 적용한 옵티머스뷰였다. LG전자는 지난달 29일부터 밸류팩 업그레이드를 통해 옵티머스뷰의 음성인식 기능을 지원하고 있다. 옵티머스뷰는 특히 다른 기기들이 '여성'의 목소리만을 지원하는 것과 달리 '남성'의 목소리를 지원한다.

 

테스트의 비교 항목에는 빠졌지만 갤럭시S3는 추가적인 다양하고 뛰어난 음성인식 기능을 갖추고 있다. 갤럭시S3는 음성을 이용해 음악을 재생하거나 소리 크기를 조절할 수 있고 문자 확인, 전화받기 기능을 수행할 수 있다.

 

베가레이서2는 일상 대화 기능이 빠졌지만 국내에서 스마트폰 중 가장 먼저 음성인식 기능을 도입하며 시장을 이끌었다. 팬택 관계자는 "음성 데이터 축적을 통해 기능이 개선될 수 있을 것"이라고 밝혔다.

 

갤럭시S3, 베가레이서2, 옵티머스뷰 3기종 모두 음성인식 기능을 통해 멀리 떨어진 곳에서 셔터를 누르지 않고 사진촬영을 할 수도 있다.

 

아이폰4S는 테스트 기종 중 가장 재치있는 대답을 했고 친근감이 느껴졌다.

 

아이폰의 한글 음성인식 기능은 비공식 버전이라는 것과 1명의 목소리에 의한 테스트라는 한계가 있었다는 점을 밝혀둔다.

 

+ Recent posts