인공 지능 음성 인식 비서, 솔직히 아직 부족해

요즘은 좀처럼 볼 수 없는 풍경이지만, 옛날 아버지들은 주말에 주로 집에서 잠을 잤다. 무슨 일이 그리 많으셨는지 늦게까지 주무시다가, 느지막이 일어나 소파에 누워 TV를 보시는 것이 일이었다.

옆에 같이 앉아 TV를 보다 보면, 아버지는 내게 자꾸 무엇인가를 시켰다. TV 채널 좀 바꿔봐라, 담배 좀 사와라, 냉장고에 뭐 먹을 것 없냐- 등등. 살짝 짜증이 날 때도 있었지만, 심부름 끝에는 용돈이 생기니 은근히 좋아했던 것 같다.

그때는 내가, 짜파게티 요리사아버지의 주말 비서였다.

시간은 흐르고 나는 그때 아버지만큼이나 나이가 들었다. 이번 CES 2017에서는 인공지능 비서(A.I assistant) ‘알렉사’가 뜨겁게 떠올랐다고 한다. 살펴보는데, 어릴 적 내 모습이 자꾸 겹쳐 보인다. 어이쿠야. 이래서 사람들이 인공 지능 비서를 원하는 거구나. 뭔가가 순식간에 이해되기 시작했다.

기계에게 말을 거는 시대

‘음성 인식 인공 지능 도우미’는 그렇게, 음성을 통해 가전제품을 제어하거나 사용자 대신 어떤 일을 처리해 줄 수 있는 기기나 서비스다. 때론 ‘지능형 가전’이라고 불리고, 줄여서 ‘인공 지능 비서’나 ‘음성 비서’라고 불리기도 한다.

음성 인식 인공 지능이 각광받는 이유는, 대화가 인간의 가장 자연스러운 커뮤니케이션 방식이기 때문이다. 간단히 말해 말로 하는 것이 편하다. 상대방 기기가 내 말을 제대로 알아들기만 한다면 말이다. 그게 쉽지 않아서 그 오랜 시간 실패를 반복했던 것 아닌가.

▲ 이 말을 알아듣게 하려고 우리는 1960년대부터 숱한 실패를 반복해 왔다

아마존 에코에 탑재됐던 알렉사는 이 ‘말을 알아듣는 것’에 성공했다. 처음엔 멍청했지만 계속 기능이 추가되면서 점점 똑똑해 진다. 아마존에서 물건도 주문할 수 있다. 그랬더니 300만 대 넘게 팔렸다. 지켜보던 사람들이 흥분할 수밖에.

라이벌은 뒤늦게 등장한 구글 어시스턴트다. 알렉사는 더 많이 쓰이고, 구글 어시스턴트는 더 똑똑하다. 다른 인공 지능 비서로 애플 시리, MS 코타나, IBM 왓슨 등이 있긴 하지만 이들은 사업 모델이 다르다. SKT의 ‘누구’나 KT의 ‘기가 지니’는 아직 미숙하다.

▲ 장난감으로 쓰기에는 좋습니다

관심은 OK, 기대는 금물

사실 아직 인공 지능이란 이름을 붙이긴 조금 부끄럽다. 우리가 생각하는 인공 지능과 이 비서들에게 적용된 인공 지능 기술이 달라서 그렇다. 따지고 보면 강아지 수준 정도일까? 정해진 말을 인식해 순서에 따라 정해진 동작을 처리하는 것이 전부니까.

…그러니까 관심은 OK, 기대는 금물이란 이야기.

일단 대화 수준이 낮다. 간단한 질문은 처리해도 대화를 나눌 정도의 수준은 아니다. 긴 문장은 잘 알아듣지 못한다. 다른 가전제품과 연결이 쉽지 않거나, 정해진 명령어만 알아듣는 경우도 있다. 어떤 DB를 이용하는 가에 따라 대답도 달라진다. 솔직히 나는 한국어로 반말을 해야 할지 존댓말을 해야 할지도 잘 모르겠다.

▲ 이상은 이렇지만


▲ 현실은 이렇다

아직 많이 부족하긴 하지만, 가능성은 많다. 인공 지능 비서는 앞으로 인간의 얼굴/목소리를 인식하고, 인간의 감정을 느끼며, 복잡한 질문을 이해하고, 맥락에 맞게 스스로 판단하며 일을 처리하고, 다음 단계를 제안하는 쪽으로 진화할 것이다.

우중충한 하늘을 보면서 ‘오늘 비가 올려나…’하고 중얼거리면 스마트폰에서 인식, ‘현재 서울 강남구의 비올 확률은 70%가 넘습니다. 가급적 우산을 준비하세요’라고 대답하고, 우산 없이 그냥 나가려고 하면 ‘아니 우산 좀 챙기시라니까요’라고 잔소리를 할지도 모르겠다.

가장 중요한 것은 역시, 제대로 된 생태계를 만들어내는 것이겠지만.

About Author


댓글 달기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다