본문 바로가기

● DQ 연구소/주요 구축사례

포항공대 컴퓨터공학과 이근배교수


사용자 삽입 이미지
공상과학 시대의
자연어를 이용한 유비쿼터스 정보검색

요즘
유비쿼터스라는 단어가 최고의 Buzz word로 떠오르는 가운데 언론에서는 연일 유비쿼터스 시대의 도래를 알리는 기사들이 보도된다. 일반인들은 이제 컴퓨터가 다양한 모습으로 자기를 도와줄 것이라는 환상에 좀 더 가까워 진듯하다.

유비쿼터스 컴퓨팅은 컴퓨터가 여러가지 다양한 모습을 가지고 우리의 생활 곳곳에 스며들어 인간을 도와 줄 수 있다는 개념으로 여기에서 컴퓨터는 다양한 모양의 센싱과 컴퓨팅 능력을 가지고 전부 무선 네트워크로 연결된 형태의 다양한 모양의 디바이스들을 말한다. 이것은 가상현실과는 반대되는 개념으로 가상현실처럼 컴퓨터를 이용한 실제 같은 가상의 세계를 만드는 것이 아니고 컴퓨터가 가상세계에서 실제 세계로 물리적으로 나와서 오직 나만을 위해서 보이지 않은 곳에서 다양한 형태의 서비스를 제공함을 말한다. 따라서 이것은 분명 한대의 컴퓨터를 가지고 여러 명이 사용 하는 Main Frame 컴퓨팅 시대와 한대의 컴퓨터를 한 명이 사용하는 Personal Computing 시대를 훌쩍 뛰어넘는 제 3 Computing Paradigm 이며 인터넷 사회의 미래를 예측하게 해 줄 수 있는 새로운 차세대 인터넷 Paradigm임엔 틀림이 없다.

 

그러면 이러한 유비쿼터스 컴퓨팅 시대에 사람은 어떤 방식으로 컴퓨터와 대화를 하고 컴퓨터를 통해 정보를 얻을 것인가? 분명히 현재의 키보드, 마우스, 모니터의 기본 대화방식은 힘들어 질 것이며 아마도 인터페이스도 보이지 않는 곳으로 숨어서 제 역할을 해야 할 것이다. 과연 그것이 어떻게 가능할까? 그것에 대한 해답은 공상과학 영화에서 흔히 보듯 인간의 언어를 가지고 컴퓨터와 자연스럽게 대화하는 것이면 될 것이며 공간제약이 없는 홀로그램 형식의 Visual Interface를 가지면 될 것이다.

 

그렇다 스타워즈의 R2D2를 기억하는가?

 

이미 인간의 언어를 사용한 대화형 인터페이스에 대한 연구는 선진국에서 수십 년의 역사를 가지고 이루어져 왔으며 근래에는 부분적으로 전화망을 통한 상용 시스템들이 등장하기 시작하여 이제 심심치 않게 컴퓨터와 자연어를 이용하여 여러 가지 업무를 보는 일들이 주변에 점점 많아지고 있다. 제한된 음성대화를 통한 비행시간안내, 주식시세, 날씨안내등의 보편화는 물론 SK

 

Telecom Nate Drive 서비스처럼 좀 더 진보된 자연어처리대화를 이용하여 길안내를 받는가하면, 지능로봇과 자연어대화를 이용하여 박물관이나 전시관 안내를 받을 수 있으며 심지어는 가정에서 로봇이나 디지털 티브이와 대화 하면서 영어 학습이나 여러 가지 정보를 얻을 수 있는 응용 솔루션들이 속속들이 개발되고 있다. 앞으로는 여러분이 가진 복합단말기를 이용하여 GPS장치를 통한 길안내 서비스나 맛집 소개, 관광지 안내 등을 자연어 대화를 통하여 정보 안내를 받을 수 있을 것이며 코스트코 같은 대형 쇼핑몰에서 상품을 찾기 위해 점원에게 일일이 물어보는 대신에 복합단말기의 안내를 받을 것이다. 또 해외에 박물관이나 관광지안내를 현지에서 자연어대화를 이용한 정보검색을 통하여 보다 알찬 관람을 할 수 있는 가능성도 열릴 것이다. 여기에 자동통역을 해주는 단말기를 가지고 모르는 나라에서도 불안감 없이 여행을 즐길 수 있다고 생각하면 상상만으로도 기분이 좋아진다.

 

이러한 자연어 대화를 이용한 정보획득은 우리가 당연하게 생각하는 음성만이 아닌 다양한 형태의 텍스트 입력 수단이나 gesture 같은 멀티모달 입력 수단을 통한 대화도 가능해 질 수 있다. 그리고 대화의 내용도 지금 서비스 되고 있는 MS의 심심이 서비스나 SK 1mm 서비스 같은 단순한 채팅을 벗어나 GSeshop의 샤피처럼 초보적 정보획득을 위한 대화서비스로 점차 진화해 갈 것이며 심지어는 모든 가전제품을 대화를 통해 제어하고 필요한 정보를 획득하는 대화형 만능 리모콘 같은 것도 곧 상품화 될 것이다.

 

앞으로의 미래사회는 유비쿼터스, 디지털 컨버젼스와 네트워크가 지배하는 사회로 정의될 것이다.

모든 디바이스가 모양만 가지고는 용도를 알 수 없을 만큼 다양하고 복합적인 기능을 가질 것이며 실제환경 구석구석 박혀있는 여러 컴퓨팅 디바이스와 서로 거미줄처럼 얽혀있는 디바이스 네트워크가 인간을 사회적으로 연결하는 Social Network을 형성 할 것이다. 이러한 환경에서 모든 정보획득은 컴퓨터와의 자연스런 자연어처리 기술을 통해 얻어질 것이며 그것은 굳이 음성뿐만이 아니라 여러 가지 다양한 형태의 입력 수단을 통하여 오감을 다 동원하는 멀티모달 커뮤니케이션의 보편화를 의미한다. 물론 이러한 서비스가 성공적이 되기 위해서는 인간언어가 가지는 복잡성과 애매성을 해소하기 위한 꾸준한 연구가 있어야 할 것이다. 이미 선진국에서는 지난 수십 년간의 연구 결과를 통하여 상당부분 인간언어의 애매성 문제를 해결한 상태이다. 또한 이러한 보편적인 유비쿼터스 대화 인터페이스를 위하여 인간언어 사용을 어느 정도 정형화 (stylized sub-language)하여 기계로 하여금 인식이 쉽게 하고자 하는 USI (universal speech interface)의 개념도 CMU에서 연구되고 있다. 이것은 마치 GUI (graphic user interface)가 약간의 훈련만 가지고 모든 컴퓨터를 사용하는 보편적인 대화 수단으로 자리 잡은 것처럼 인간언어 사용을 조금만 정형화하여 기계가 인식을 쉽게 하도록 하여 앞으로 USI GUI를 대체 할 수 있는 보편적 인터페이스로 사용가능 하도록 하자는 연구이다.

 

컴퓨터를 이용한 인간언어처리에 관한 연구는 지난 50년간 꾸준히 연구되고 선진국을 중심으로 대형 연구지원이 많이 지속적으로 이루어 져 왔다. 50-60년대의 통계적 방법이 70-80년대의 규칙기반 방식으로 바뀌면서 언어의 2차원의 구조적인 연구가 좀 더 가능해졌다. 90년대 이후에는 다시 규칙기반의 구조적 연구 위에 통계기반의 연구를 다시 결합시킴으로써 여러가지 시너지 효과를 내면서 Paradigm Shift가 일어나고 있다. 이러한 기술적 Paradigm Shift는 바로 Innovation

 

과 연결되어 새로운 기술이 만들어지고 새로운 시장이 형성되고 있다. 과거의 기계번역은 모두 언어규칙과 지식기반이었고 개발에 많은 인력과 자금이 들어 갔지만 요즘의 기계변역은 통계적 디코더를 이용하여 음성인식이나 기계번역이나 동일한 구조로 처리함으로서 성능과 안정성을 동시에 얻는 것이 대표적인 Innovation의 예가 된다. 지금 검색신화를 일으키고 있는 google 같은 회사는 기존의 검색이 문서내의 데이터만을 가지고 하는 것이라는 고정관념을 깨고 문서바깥의 링크데이터를 적극 활용하여 검색을 함으로서 새로운 검색 기술의 Innovation를 이루고 검색광고의 Blue ocean market을 열어 오늘의 google이 되었음을 상기할 때 기술적 Innovation은 바로 10 배 이상의 성능보장을 약속하여 새로운 Blue ocean 시장을 곧바로 창출 할 수 있는 열쇠가 되는 것이다.

 

이제 위에서 말한 여러가지 자연어 대화를 이용한 유비쿼터스 정보획득은 앞으로 이러한 Blue ocean market을 열수 있는 대표적인 신기술중의 하나가 될 것 임에는 분명하다. 앞으로 이러한 자연어 대화형 정보검색을 위해 음성인식의 오류수정 및 환경적응, 강인한 언어 의미분석, 자연스러운 대화처리기술 등이 더 연구되고 안정화되고 상용화 될 때 유비쿼터스 자연어대화는 모든 정보서비스의 약방의 감초와 같은 역할을 할 것이며 우리 생활을 송두리째 획기적으로 바꾸어 놓는 새로운 기술적 Innovation이 될 것이다.

 

나는 공상과학 영화를 좋아한다.

 

오늘도 이러한 자연어대화처리에 관한 연구에 푹 빠져서 언젠가는 내 주변의 모든 사물과 자연어 대화로 의사전달이 가능해지는 바로 공상과학과 같은 시대가 오리라는 흐뭇한 생각을 자주 해보며 연구에 피곤한 마음을 수시로 달래보곤 한다. 그리고 다이퀘스트라는 우리가 만든 조그만 회사가 바로 앞으로 수십 년 후에 그런 공상과학의 세계를 이끌어 나가는 선두에 있을 때 나의 즐거움과 기쁨은 배가 될 것이다.