2008-08-05

向大家推荐一个有趣的搜索引擎:人立方关系搜索

Posted in 随笔, Web Data Management at 9:41 Author:仲远

标签:

微软亚洲研究院终于正式推出对象级别的搜索引擎了!

这就是人立方关系搜索:http://renlifang.msra.cn/

之前我曾经写过一篇文章叫做《昨天聆听了微软亚洲研究院聂再清博士《Object-Level Vertical Search》的演讲》,就介绍了微软亚洲研究院正在进行的对象级别搜索引擎的研究。当时聂再清博士已经给我们演示过“关系搜索”,不过那时“关系搜索”还处于微软内测阶段,并没有对外开放。其实,这个“关系搜索”早在今年一月份听过聂博士的一个报告时,他就已经秀过了。看来从一个研究型系统到产品转变还是需要一个蛮长的过程的。

目前,微软将“关系搜索”命名为“人立方关系搜索”,显然是借水立方来宣传自己。这个搜索引擎最重要的特征是:
1、以人物为中心(这一点,与C-DBLP类似),从超过十亿的中文网页中自动的抽取出人名、地名、机构名以及中文短语,并且通过算法自动的计算出它们之间存在关系的可能性;
2、超炫的展示方式,以flash做成的结果展示页面,让人们可以直观地感受到各个人物之间的紧密关系。例如,我搜索了一个“唐僧”,它给我返回了如下结果:
人立方搜索
可以看到,唐僧与孙悟空的关系还是最紧密的。此外,还有一些挺有意思的结果,大家可以把鼠标放在两个任务的关系线上,单击即可知道为什么他们之间会有联系。

其实,在“人立方关系搜索”发布之前,微软还为www2008发布了一个学术界研究者之间的关系搜索:http://libra.msra.cn/www2008/。也是基于同一技术,挺有意思的。

不过,很明显,由于重名问题的存在,即使再精妙的算法,也不能完全解决,这样有时便会产生一些啼笑皆非的结果。所以大家对于用自己名字搜索出来的结果,一笑而过即可,不必太过认真。而要解决这些问题,人立方搜索引擎本身,也有许多值得继续研究与改进的地方。

本文可以自由转载,转载时请保留全文并注明出处:
转载自仲子说 [ http://www.wangzhongyuan.com/ ]
原文链接:

Leave a Comment

*
To prove you're a person (not a spam script), type the security text shown in the picture. Click here to regenerate some new text.
Click to hear an audio file of the anti-spam word