[해외 동향] 생산적인 시맨틱 검색 도구

readwriteweb에 시맨틱 검색 엔진 Noesis에 대한 소개 글이 올라왔군요.
번역하여 올립니다.


생산적인 시맨틱 검색 도구

Written by Sarah Perez / January 14, 2009 8:01 AM


노에시스는 원하는 연구자료를 좀 더 쉽고 빠르게 접근하고 얻을 수 있는 과학자들의 연구 지원 환경이다. 미국 헌츠빌의 University of Alabama에서 개발된 이 엔인은 과학자들과 연구자들이 어디에 있든지 간에 노에시스를 이용한 시맨틱 기술을 이용하여 보다 생산적이면서도 집중적인 검색을 제공한다.



노에시스 소개

노에시스 검색엔진은 기존 검색엔진과 다른데 이는 사용자가 자신의 검색 쿼리를 스스로 만드는데 있어 시맨틱 기법을 도입했기 때문이다. 이러한 방법의 도입은 더 나으면서도 더 정확하고 더 완벽한 검색 결과를 산출하는데 도움을 준다. 이 검색 결과들은 필요한 경우 노에시스를 사용하는 최종 사용자에 의해서 더욱 더 정제될 수도 있다.

노에시스 프로젝트의 최종 목표는 기상학 분야에서 연구하는 과학자들에게 그동안 검색 엔진에서 접근할 수 없었던 웹 상의 숨은 과학적 목록에 대한 접근성과 검색성을 제공하는데 있다. 왜냐하면 이러한 목록들은 대개 일반적인 어휘집에 바탕하고 있으나 실제 검색에 영향을 주는 경우는 특징적인 전문용어를 사용할 때 검색 결과가 매우 정확하게 나타나기 때문이다.

노에시스를 만들기 위해서 연구자들은 단순히 자신들의 특정한 용어들을 온톨로지에서 주석을 달아주기만 하면 된다. 물론 이러한 주석만으로는 시맨틱 검색 엔진이 할 수 있는 것은 아무것도 없다. 이러한 온톨로지는 이를 이용하고 검색할 수 있는 도구와 반드시 연동되어야 한다. 이를 위해서 노에시스는 Ontology Interface Service(OIS)라 불리는 환경을 도입하였다. SOAP 기반의 웹 서비스 인터페이스며 추론 엔진이다. 사용자가 검색을 수행하면, OIS는 이와 관련된 개념을 검색한다. 세분화와 일반화를 통하여 트리 형태의 정보 구조를 도출하며, 사용자는 이를 통하여 검색을 진행할 수 있다. 동의와와 연관 검색어들 또한 보여질 수 있으며, 체크박스를 통하여 본디 검색 결과를 세분화 할 수 있는 방법을제공한다.

비록 이 프로젝트는 과학의 한 분야를 위하여 설계되었지만, 이 프레임워크는 다른 분야로 쉽게 이전될 수가 있다.



시맨틱 웹: 니치 마켓(소규모 시장)에서 더 나은가?

오늘날 시맨틱 웹의 가장 큰 문제점은 앞서 언급한 온톨로지를 누가 어떻게 구축을 할 것이냐 하는 점이다. 사람이 표현하는 짧은 질의어에서 사용자가 내재적으로 의도하는 바를 기계가 빠르고 쉽게 자동적으로 파악하는 아주 명확한 방법이 아직까지는 존재하지 않는다. 현재는 이러한 방법을 자동이든 반자동이든 적어도 이를 구체화 시켜 내어놓은 솔루션은 없는 상태며, 따라서 진정한 의미의 인텔리전트 웹으로 인식될 수 있는 그 어떤 진척도 아직까지는 없는 실정이다.

현재로써 가장 현실적인 것은 다양한 웹 정보에 수작업으로 조금씩의 코드를 삽입하는 것 밖에는 없을 것이다. 분명하게, 이는 현재 인터넷의 크기를 감안한다면 분명 대단한 도전이 될 것이다. 지금 현재 웹 정보의 증가 속도로 볼 때 이러한 것은 완전히 불가능한 것일지도 모른다. 불행하게도, 자동화 방법론 없이는 진정한 시맨틱 웹은 여전히 인식되지 않는 꿈으로 남을 수 밖에 없을 것이다.

그렇지만, 좀 더 작은 커뮤니티에서는 시맨틱 웹은 쉽게 현실이 될 수 있다. 과학 정보 카탈로그들은 웹에서 차지하는 정보의 분량이 크지 않다. 이들의 제한된 크기의 정보는, 그들이 관리할 수 있는 수준의 제한된 정보량을 제공할 것이다. 그리고 그 실례가 바로 노에시스다. 이 시스템은 앞으로 시맨틱 웹이 앞으로 어떤 방향으로 나아가게 될 것인가를 보여주는 좋은 예다. 만약 이 범위가 작은 니치 마켓에 머무른다면 말이다.



출처: http://www.readwriteweb.com/archives/a_productive_application_of_semantic_search.php




원문

A Productive Application of Semantic Search

Written by Sarah Perez / January 14, 2009 8:01 AM /

class=clear>

Noesis is a new semantic web search engine that helps scientists studying the environment access and retrieve the research data they need. Developed at the University of Alabama in Huntsville, the new engine has the potential to enable scientists and researchers everywhere to perform more productive and focused searches thanks to the semantic technology Noesis uses.

About Noesis

The Noesis search engine (PDF) is different than regular search engines because it employs the use of semantics to help its users better shape their search queries. The results of this lead to better, more accurate, and more complete sets of search results. Those results can then be refined even further by Noesis' end users if necessary.

The goal of the Noesis project is to provide scientists working in the field of Atmospheric Science a way to better search through the "hidden web" of scientific catalogs that traditional search engines cannot reach. Because these catalogs are built using a standard vocabulary, the most efficient searches on the catalogs involve using specific terminology.

To create Noesis, researchers simply annotated those specific vocabulary terms with ontologies - the machine-readable definitions for the words that help computers understand the concept of the term and its relationship to other terms. Of course, annotations alone do not make a semantic web search engine. The ontologies must be coupled with a tool that's capable of searching through them. To that end, Noesis employs something they call the Ontology Interface Service (OIS), a SOAP-based web service interface to an inference engine. When a user performs a search, the OIS is also immediately searched for associated concepts. The Specializations and Generalizations discovered are returned in a tree structure which the user can navigate further. Synonyms and related terms are also shown, and, using checkboxes, they can be appended to the original query to refine it further.

Although the project was designed for use in one select area of science, its framework could easily be replicated in other scientific fields of study.

The Semantic Web: Better in Niches?

The main problem with the semantic web today is that the assignment of those above-mentioned ontologies - the pieces of code that allow machines to grasp meanings that humans innately understand - is that there's no solid way to automate their assignment. At the present time, no automatic or semi-automatic processes to do so have been achieved...at least, not to the point that a true vision of a new, intelligent web can be realized.

Most of the time, annotating web resources must be done using manually inserted bits of code placed into various web pages. Obviously, that's a challenge when you consider the size of the internet - it would be impossible to manually annotate this ever-growing resource. Unfortunately, without automated methodologies, a true semantic web will remain an unrealized dream.

However, in smaller communities, the semantic web can easily become a reality. Scientific data catalogs only represent small portions of the web as whole. Because of their limited size, manually annotating the resources they contain is a manageable feat. This is the case with Noesis. It shows there is promise for the semantic web after all - if only in small niches.


-웅차장-
  • Favicon of http://www.gagacoupons.com/cat/footwear-coupons/ugg-boots/ BlogIcon zhiyouwo 2011.04.23 17:20 ADDR 수정/삭제 답글

    시맨틱 검색 엔진 Noesis에 대한 소개 글이 올라왔군요.
    번역하여 올립니다.