스마트폰의 새로운 기술전쟁이 열렸습니다. 아이폰이 가장 먼저 인간중심의 대화형 음성인식 소프트웨어 시리를 선 보인 후 스마트폰의 핵심기술은 바로 인간의 감성을 위한 음성기술들을 탑재하는 것 이었습니다.
이후 국내 제조사들 역시 빠르게 음성인식 소프트웨어 개발에 박차를 가하였고 비슷한 시기에 LG전자의 옵티머스뷰와 삼성전자의 갤럭시S3가 각각 Q보이스(퀵보이스)와 S보이스라는 음성인식소프트웨어를 선보였는데요.
한국을 대표하면서 언제나 선의의 경쟁자인 두 회사의 음성인식 소프트웨어는 어떤 장단점이 있는지 직접 비교해 보았습니다.
▲ 왼쪽 갤럭시S3 S보이스 vs 오른쪽 옵티머스뷰 Q보이스(퀵보이스)
옵티머스뷰 Q보이스 vs 갤럭시S3 S보이스 음성인식 비교
기능제어편 - 전화걸기
제일 먼저 가장 많이 사용하는 기능인 전화걸기 기능부터 테스트 해보았습니다.
LG전자 옵티머스뷰의 Q보이스는 주소록에 등록된 이름 중 같은 이름을 모두 찾아주어 선택을 할 수 있도록 표시해 주는 반면 삼성전자의 S보이스는 해당 이름과 일치하는 사람에게 바로 전화를 걸어 주었습니다.
정확도 측면에서 보면 S보이스가 음성으로 제시한 사람을 정확히 찾아주는 것 같다는 생각이 처음에 들었는데 문자테스트를 하면서 좀 상반된 결과를 주어 갤럭시S3의 음성 인식 전화걸기가 맞는 것인지 살짝 의문이 들었습니다.
참고로 두 스마트폰에 동일한 주소록을 등록하였지만 두 제품 모두 개통이 되지 않은 상태라 전화걸기까지의 과정만 확인이 가능하였음을 이해해 주세요.
기능제어편 - 문자보내기
전화걸기에 이은 문자전송 테스트 입니다. 옵티머스뷰는 전화걸기 및 문자모두 동일한 이름을 가진 사람을 주소록에서 모두 찾아주어 사용자가 선택하도록 하는 반면 갤럭시S3는 전화걸기시는 매칭되는 사람에게 바로 전화를 걸지만 문자보내기시에는 같은 이름으로 등록된 사람들의 리스트를 보여 주더군요.
개인적으로는 같은 이름의 사람을 모두 찾아 주는 것이 맞는 검색방법이 좀 더 인간중심의 기술구현이라고 생각합니다.
기능제어편 - 웹검색
다음은 음성인식 웹검색을 비교해보았습니다. 가벼운 날씨정보부터 확인해 보았습니다.
두제품 모두 현재 위치의 실시간 날씨는 검색해 표시해 주었는데 S보이스는 날씨 위젯을 표시해 주었고 옵티머스뷰는 웹검색을 통해 날씨정보를 보여주네요. 간단한 날씨 검색시는 내부의 위젯을 활용한 S보이스의 센스가 더 멋지네요.
다음은 좀 어려운 질문은 해보았습니다. 꾸준한 인터넷 인기검색어이기도 한 추천 데이트 코스를 물어보았습니다.
음 두제품 모두 질문의 요지를 이해하지 못하고 답을 내지 못하네요. 음성인식 기술은 이제 걸음마 단계라 사용자의 대화에 제대로 대응하지 못 하는 경우가 많은 듯 합니다.
기능제어편 - 카메라
음성인식기능이 나온 후 가장 좋은 반응을 얻고 있는 음성카메라 기능을 테스트 해보았습니다. 두 제품 모두 아주 정상적으로 카메라 기능을 구현해 주더군요. 음성을 통해 카메라를 구동한 후 갤럭시S3는 "촬영" 또는 "김치"를 외치면 촬영이 가능하지만 옵티머스뷰는 아직까지 김치만을 인식하도록 되어 있어 추후에 다양한 명령어를 인식할 수 있도록 개선되어야 할 것 같습니다.
음성인식을 통한 기능제어는 특정된 작동을 하도록 프로그램된것이라 두 제품 모두 비교적 만족스러운 성능을 제공하여 100점 만점에 80점 이상의 점수를 주고 싶을 정도로 상당히 매력적인 성능을 갖춘듯 하였습니다.
그럼 특정된 음성인식 구현보다 좀 더 감성적인 면을 비교해 볼 수 있는 음성대화를 비교해 보았습니다. 서두에 말씀 드리지만 두 제품 모두 긴 대화를 주고 받을 수 있는 수준의 대화 능력을 갖추진 못 하여 간단한 질문에 대한 두 제품의 답변을 확인하는 방법으로 진행해보았습니다.
일반대화 - 이름 묻기
먼저 두제품의 이름을 각각 물어 보았습니다. 옵티머스 뷰는 같은 질문에 두번 모두 위트 넘치는 대답을 해주었지만 갤럭시S3는 상당히 기계적인 답변을 해주더군요.
일반대화 - 심심해
심심하다고 투정 부리면서 시작한 대화입니다. 전체적으로 옵티머스뷰의 완승입니다. 갤럭시S3는 대부분의 대화를 인지하지 못하더군요.
일반대화 - 사랑고백
옵티머스뷰와 갤럭시S3에 사랑한다고 고백해 보았습니다. 이번엔 갤럭시S3도 비교적 다양한 답변을 준비한듯 보였지만 같은 질문이지만 다양한 변형질문에도 옵티머스뷰가 더 정확하게 답변을 하는군요. 그리고 나이를 묻자 옵티머스뷰는 재치있는 답변을 주는 반면 갤럭시S3는 역시 이해하지 못한다는 답변만 계속 내는군요.
일반대화 - 세상에서 제일 예쁜 사람은 누구?
마지막으로 좀 유치하기도 하지만 고난이도 질문을 해보았습니다. 백설공주에 나오는 "거울아 거울아 세상에서 누가 제일 쁘니?"란 질문을 해보았습니다. 결과는 갤럭시S3는 역시나 답을 주지 못했는데 반면 옵티머스뷰의 센스작렬 답변 덕분에 촬영하다 저도 모르게 큭큭 거렸다는...
동영상으로 촬영하지 못했지만 다른 대화에 대한 응답사진을 몇개 더 비교해 볼 수 있도록 캡쳐사진을 추가해 보았습니다.
아이폰 짱이라고 외치니 갤럭시S3는 묵묵부답 , 옵티머스뷰는 역시 위트 있는 답변을 해주는 군요.
독도 관련 질문에 대한 답변은 갤럭시S3가 많이 보강된 듯 합니다. 초기에는 제대로 답을 못해 언론에도 회자가 되기로 했었는데 말이죠.
끝으로 바보라고 했더니 두 제품 모두 다양한 답을 주긴하는데 갤럭시S3의 답은 좀 딱딱한 느낌이 옵티머스뷰의 답변은 재치가 돋보이더군요.
기능제어 테스트와는 달리 일반 질문형 대화에서는 옵티머스뷰가 갤럭시S3에 비해 더 많은 질문에 대답을 하였고 대답의 수준역시 재치와 센스가 넘치는 답변으로 대응하는 옵티머스뷰의 완승인듯 합니다.
이번 테스트 결과를 정리하자면 특정기능을 제어하는 음성인식은 두 제품 모두 상당히 높은 수준에 이렀다는 생각이 들었지만 인간의 감성에 대응하는 일반 질문형 대화에서는 옵티머스뷰가 갤럭시S3보다 한수 위라는 판단이 들었습니다.
다만 두 제품 모두 아직은 음성인식 소프트웨어 초기 단계로 때로는 말을 이해하지 못하거나 아니면 질문자의 의도를 제대로 파악하지 못해 엉뚱한 답변을 하는 경우도 꽤 많았고 발음하는 음성을 제대로 듣지 못해 음성인식을 사용할 수 없는 상황도 여러번 있었습니다. 하지만 음성인식기술은 이제 시작이라 생각하며 앞으로 두 회사가 선의의 경쟁을 통해 진정한 인간중심의 대화형 음성인식기술로 발전시켜 더욱 편리하고 유용하게 사용할 수 있도록 발전시켜 나가주길 바라며 테스트를 마칩니다.
댓글 영역