Twitter Search Done Right by PostPo.st

현재 가장 많은 사람이 사용하는 소셜 네트워크 서비스라고 하면 페이스북과 트위터라고 할 수 있습니다. 오늘은 이 중 트위터와 관련된 이슈가 있어 소개할까합니다.

 

트위터에서 오래된 트윗을 검색하는 것은 정말 고통스러운 일입니다. 트위터 자체의 검색엔진이나 구글, 빙과 같은 탑 검색 엔진도 오래된 트윗 보다는 리얼 타임에 초점을 맞추고 있기 떄문에 몇일 전 트윗을 찾는 것은 어려운 일임에 틀림없습니다. 특히 트윗의 양이 많은 사람일 경우 본인이 몇 달 전에 한 트윗을 찾기 위해 마우스를 스크롤하는 것 정말 귀찮은 일입니다.

 

오늘 소개하는 PostPo.st 이런 문제에 해답을 제시하는 서비스라고 할 수 있습니다. 사용자가 PostPost 서비스에 가입하면 PostPost는 먼저 해당 사용자가 팔로우한 사람 중 가장 적합한 200명의 팔로워를 선택하고 각 팔로워 별 200개의 트윗에 대한 색인 작업을 수행합니다. 만약 팔로우한 사람 중에 PostPost 유저가 있다면 그 사람의 트윗 역시 색인하게 됩니다. PostPost의 이러한 시도는 분명 트윗터 검색을 좀더 용이하게 할 수 있는 방법임에는 틀림없습니다.

 

사용자 삽입 이미지
 

PostPost 서비스는 또한 단순히 사용자가 입력한 검색어가 포함된 트윗만을 보여주는 것이 아니라 부분적으로 트윗과 연결된 웹페이지를 색인하고 검색 결과로 제공합니다. , 사용자가 입력한 검색어가 트윗내용에는 포함되지 않더라도 검색어가 포함된 웹페이지 링크가 있는 트윗 또한 검색 결과로 제공하는 방식입니다. 트윗의 경우 단순하고 짧은 트윗이 많기 때문에 연결된 링크까지 색인해서 제공하는 방식은 분명 유용한 검색 방식입니다.

 

앞선 단락에서 이야기 했다시피 PostPost 서비스는 해당 사용자가 팔로우 하는 200명의 사람을 대상으로 색인을 합니다. 여기서 200명은 바로 Dunbar's Number를 의미합니다. Dunbar's Number는 이론적으로 한명의 사람이 사회적 관계(인관관계)를 유지할 수 있는 사람의 수라고 합니다. PostPost 200명이라는 제한을 둠으로써 가장 적합한 검색 결과를 제공할 수 있음은 물론 검색엔진이나 사용자의 로드를 줄일 수 있습니다. 그외 PostPost은 검색 결과에서 사진(사진 파일을 포함한 트윗일 경우)을 함께 보여준다는 특징도 있습니다.

 

출처: http://www.readwriteweb.com/archives/twitter_search_done_right_by_postpost.php

Armed With Social Signals, Google Moves Back Towards Real-Time Search

오늘은 구글의 소셜 커뮤니티와 실시간 검색(Real-Time Search)과 관련된 포스트가 있어 이를 소개 합니다. 요약하면 구글은 소셜 커뮤니티에서 발생하는 구성원들의 실시간적인 커뮤니케이션을 반영하여 시기적절한 정보를 제공한다는 내용이라고 할 수 있겠내요. 그럼 본격적으로 포스트 내용을 소개 하겠습니다.

 

아시다시피 구글의 검색 알고리즘을 쉽게 이야기하면 링크가 많이 걸린 웹페이지를 상단에 뿌려주는 페이지 랭크 알고리즘으로 널리 알려져 있습니다. 얼마 전 구글은 이 알고리즘에 상당한 변화가 있을 거라고 발표를 했는데요(약 검색의 35%정도가 영향을 받을 것이라고 합니다). 이는 더 신선한(fresher)’ 검색 결과를 사용자에게 제공하기 위함이라고 합니다. 예를 들어 사용자가 올림픽이라고 검색을 했을 경우 오래된 올림픽에 대한 일반적인 정보보다는 대부분의 사용자가 다가오는 2012년 올림픽에 대한 정보를 원하기 때문에 이에 대한 정보를 상단에 제공하는 것을 의미합니다. 좀 더 대략적으로 말하면 구글은 서비스 중인 소셜 네트워크 서비스 구글 플러스로부터 발생하는 신호(social signal)를 캐치하여 현재의 웹에서 어떤 일이 일어나고 있는 지를 파악 및 반영하여 검색 결과를 제공(timeliness and relevance한 정보)하는 방식으로의 변화입니다.

 

이는 기본적으로 2009년에 발표했던 구글의 새로운 검색 인프라인 카페인(Caffeine)’ 기반으로 하고 있으며 세가지 주요한 카테고리를 따라서 신선함(freshness)’에 대한 측면을 고려해 미세한 조정 함으로써 가능하게 됩니다(카페인은 2009년 발표한 비디오 파일이나 이미지 파일 등의 멀티미디어를 포함하고 있는 구글의 파일 시스템입니다. 카페인이 처음 등장했을 시기에는 검색 성능 향상에 대한 의견이 분분했으나 2010 6월에 들어서는 효과를 보고 있다고 합니다).  이 세가지 카테고리란 다음과 같습니다.

 

1.     최근의 이벤트나 핫 토픽

2.     정기적으로 발생하는 이벤트

3.     빈번하게 업데이트 되는 정보

 

Google Going Real-Time

최근 구글은 단순하고 지루한 페이지 랭킹에 따라 검색 결과를 보여주는 것에서 검색 쿼리에 어떤 종류의 검색 결과가 더 적합한지를 스마트하게 결정하기는 원하고 있습니다. 이 때문에 기본적으로 구글은 실시간으로 색인하는 것을 요구하게 되었고 카페인은 이를 위해 크롤링 측면에서 주요한 역할을 합니다. 이후 구글의 퍼블리싱 시스템과 네트워킹 프로토콜을 통해 새로운 콘텐츠에 대한 검색 색인을 더 빨리 추가할 수 있게 되는 거지요.  소셜 네트워크에서는 이와 같은 과정이 조금 더 쉽습니다. 소셜 네트워크에서의 사용자들은 직접 실시간으로 콘텐츠를 작성하고 이를 스스로 실시간으로 다른 사람들에게 알리기 때문입니다.

 

사용자 삽입 이미지


Google+ And Real-Time Search

 2009년 실시간 검색을 위해 구글이 트위터와 제휴한 것도 이러한 소셜 네트워크의 특징 때문입니다. 비록 올해 여름 구글과 트위터의 이러한 제휴가 끝나긴 했어도 이는 소셜 네트워크를 활용한 실시간 검색을 하지 않겠다는 이야기가 아니라 더 이상 서로의 이해관계가 맞지 않아 제휴가 끝난거지요(트위터는 검색 회사를 인수했고 구글도 소셜 네트워크 서비스를 직접 서비스하기 시작했습니다). 현재 구글은 직접 서비스하는 소셜 네트워크 서비스인 구글 플러스에서 실시간 검색을 수행하고 있으며 또 구글 플러스에서의 social signal를 수집을 통해 검색 결과의 신선도를 더 개선할 수 있을 것이라고 합니다.  

 

출처: http://www.readwriteweb.com/archives/armed_with_social_signals_google_moves_back_toward.php

다이퀘스트 검색개발팀장 DT발언대

[DT발언대] 조금 천천히 스마트해졌으면…
이용환 다이퀘스트 검색개발팀장

사용자 삽입 이미지
트위터, 페이스북, 미투데이 등 소셜 네트워크 서비스(SNS)가 이제 일상화되다시피 하고, 소셜 커머스, 모바일 웹과 앱, 카카오톡 등을 모르면 시대에 뒤쳐지고 있는 게 아닌가 걱정이 들기도 한다. IT와 서비스에 대해 고민할 수밖에 없는 개발자의 한 사람으로서 역시 많은 노력을 하고 있지만, 종종 변화를 따라가는 것만도 벅차다고 느낄 때가 있다.

검색만 국한해 보자면, `식당'이라고 입력하지 않아도 점심시간이 돼서 스마트폰을 켜면, 가까운 맛집을 검색해주는 서비스, 내 PC가 오동작을 일으켰을 때 SNS를 통해 원인이 무엇인지 네트워크상의 전문가 의견을 바로 제공하는 서비스, 각종 포털 사이트들이 제공하는 SNS 실시간 검색, 감성추론에 의한 검색 서비스, 스마트 TV 검색까지…. 이전에 상상했던 것들이 미래가 아닌 현재 진행형으로 조금씩 구현되고 있다.
이렇듯 과거에는 검색 키워드에 매칭되는 문서만 제공했지만, 이제는 단어와 단어 사이의 관계, 문서와 문서 사이의 관계, 검색어 속에 숨겨진 의도, 검색하는 사람의 개인 네트워크, 취향, 성향까지 고려하지 않으면 안되는 상황이다.

소셜 검색, 시멘틱 검색, 개인화 검색 모두 아직은 모호한 개념이지만, 명확한 결과를 제공해야하만 하고, 검색이 단순히 찾아주는 것이 아닌, 추천을 포함해 내가 지금 어디서 무엇을 해야하는지를 알려주는 차원으로 넘어가고 있기 때문에 모든 검색포털 및 솔루션 회사들은 이런 서비스와 솔루션을 개발하기 위해 고민하고 있다.

 

이러다 보니 검색 솔루션 개발자는 (완벽하진 않더라도) 인공지능에 근접한 서비스가 곁들여지면서 소셜 네트워크를 지향하고, 거기에 최적의 모바일 인터페이스까지 갖춘 검색 솔루션을 개발해야 한다는 범회사적(?) 압박을 받게 된다.

비록 개발자들이 지새워야 할 밤은 늘어나겠지만, 검색은 점점 더 스마트해질 것이고, 사람들은 보다 편리해질 것이다. 그러나 역설적으로 사람들은 점점 더 게을러지고 개인주의가 될지 모른다. 지금도 커피숍에 마주앉은 두 사람이 서로가 아닌, 자신의 스마트폰과 대화하는 모습은 흔히 볼 수 있다.

더 스마트한 세상이 되도록 온종일 정신 없는 회의와 개발에 몰두하지만, 내심 사람들은 조금 천천히 스마트해졌으면 좋겠다는 바람이다.
  • 검색개발팀원 2011.04.28 10:39 ADDR 수정/삭제 답글

    여긱 팀장님은 미남이시네요.

구글에서 이야기하는 2010년 검색 트렌드

오늘은 구글의 Matt Cutts 이야기하는 2010년 검색 트랜드가 있어 전해드립니다. 크게 다섯 가지로 이야기 하고 있으며 클라우드 컴퓨팅 검색 같은 경우는 아직 국내 검색 엔진 업체에서 크게 고려하지 않고 있는 부분 같아 보입니다.

 
1. New Types of Data Searches.
첫번째 이야기하는 트랜드는 데이터의 종류에 따른 검색의 세분화입니다. 일반적인 웹 검색 엔진 같은 경우 현재 웹 데이터가 기하급수적으로 많아짐에 따라 데이터 오버로드가 심한 상황이라고 하는대요. 이를 위해 구글에서는 현재
Google Book Search, Google Patent, Google Government Search, Google Blog Search 등으로 정보의 타입 별로 검색을 나누고 카테고리화 하는 중이라고 이야기 하고 있습니다.

 

2. Semantic Web Search. 요즈음 네이트 시맨틱 검색으로 인해 국내에서도 이슈가 되는 시맨틱과 관련된 이야기입니다(사실 시맨틱과 관련된 이야기는 2000년대 초반부터 이야기 되고 있었지만 국내에서 시맨틱이라는 단어가 관련 연구자가 아닌 일반 사용자들에게까지 이야기 되는 최근이지요). 어쨌건 구글의 검색엔진은 점점 정교해 지고 있으며 사용자가 검색어를 입력했을 구글의 검색 엔진은 사용자가 입력한 검색어에 대한 동의어, 자연어 분석, 사용자의 의도까지 모두 고려한 검색결과를 사용자에게 리턴하고 있습니다.

 

3. Cloud Computing Search. 요즘 클라우드 컴퓨팅에 대한 이야기가 많이 나오고 있습니다. 클라우드 컴퓨팅를 이용하는 국외 사례도 늘고 있으며 이러한 추세를 국내에서도 조금씩 활성화되지 않을까 조심스럽게 이야기 해봅니다. 어찌되었건 클라우드 컴퓨팅이 활성화됨에 따라 클라우드 컴퓨팅 환경에서의 검색 역시 중요한 이슈로 떠오를 것이라고 구글은 전망하고 있습니다.

 

4. Real Time Search Engines. 실시간 검색과 관련된 이야기입니다. 새롭게 등록되거나 수정된 정보를 검색에 빠르게 반영해야 한다는 당연한 소리이지요. 지정된 DB 대한 실시간 검색이 아니라 환경에서의 실시간 검색에 대해서는 연구가 필요한 부분이지요.

 

5. Mobile Web Search. 마지막으로 모바일 검색입니다. 국내에서도 아이폰 도입으로 인해 스마트폰 사용자가 점점 늘어나는 추세이고 이들을 위한 모바일 웹의 특징을 고려한 검색 서비스를 지원해야 합니다.



원문  http://www.skipease.com/blog/google-news-tips/google-search-engine-trends-2010/