2008年7月17日 20:52
Data Integration是近些年来国际上的一个研究热点,目前已经有许许多多的相关paper发表了。在这个领域上的牛人自然很多,今天就说说其中两个牛人的去向吧。
一个是Alon Y. Halevy,他是最早提出Data Integration框架的人,他在VLDB1996上的那篇《Querying Heterogeneous Information Sources Using Source Descriptions》文章获得VLDB2006年颁发的十年最佳paper,并由此提出了Dataspace的概念,在全世界上...
1 Comment »
2008年6月6日 11:10
上一次的断电,使得我们用来做实验的网站被Google完全删除,到目前也没有恢复。于是我们采用了备用域名重新开始实验。正当实验重新步入正轨时,又看到通知说下周因为检修线路,又要有两次停电,很有可能又会导致新的实验域名再被Google删除。看来我们的实验室是没有什么希望啦,刚建立起的沙土城堡又要倒塌了。。。
...
No Comments »
2008年5月31日 23:59
虽然大家每日使用Google,看起来没有什么不同,使用起来也没有什么不同。但是其实Google是经常调整她的算法的,据称Google去年一年就调整过450次搜索算法。通过算法一次次的调整,Google不断改进用户体验,同时提供搜索结果的质量。
其中,这个算法的调整,可能伴着Google Dance现象的发生。所谓的Google Dance,就是Google每个月固定调整她的索引库(当然是指她的BigTable),...
No Comments »
2008年5月28日 22:14
最近在针对搜索引擎做一项实验,于是利用实验室的废弃电脑搭建起来一个测试网站:AntiIndexTest,刚开始数天,实验十分顺利,各个搜索引擎也非常快速的进行收录。正当期望实验取得进一步进展时,学校停电了,实验室也不能幸免。
经过一个晚上的停电,刚开始还未发现任何异常,但是到下午时,突然发现Google不再来爬取网站页面,而整个网站在Google中搜不到任何...
No Comments »
2008年5月27日 20:34
当时投NDBC年会文章的时候,只顾着把东西往上写,周围师兄师姐也说"先写上去再说呗,以后删还不容易吗"。于是一不小心就写了7页满满的。这几天接到论文录取通知,要求提交正式论文,并且不能超过7千字,看以往的文章,似乎年会论文一般在5页,于是不得不“操刀自残”,却发现总也下不去手。看看这里也觉得必不可少,看看那里也觉得删掉后语义不连贯。于...
4 Comments »
2008年5月18日 0:02
最近需要针对搜索引擎做一些实验,于是查看了一下全球十大搜索引擎,发现居然还有两家中国搜索引擎公司。呵呵,估计是因为中国网民众多的缘故吧。以下就是comScore在2007年12月发布的2007年全球十大搜索引擎:
名次 公司名称 市场占有率
1 Google 62% (Google在全球范围内的影响力自然不用多说)
2 雅虎 12.8% (老牌门户网站以及搜索引擎公司)
...
No Comments »
2008年5月16日 21:05
昨天的《智能信息检索》课程请的是微软亚洲研究院的聂再清博士来向我们介绍《Object-Level Vertical Search》,这已经是我第二次听聂博士的介绍了。上一次是在参加Yocsef举办的《垂直搜索》时听过他演讲,主题也是“对象级别的垂直搜索”。
目前微软亚洲研究院正在进行的几项研究,包括Libra, Guanxi, Product Search等,都是很有意思的对象级别的垂直搜索。其实对象这个词,...
1 Comment »
2008年4月8日 14:33
云计算的历史、发展与未来
作者:王仲远
中国人民大学网络与移动数据管理(WAMDM)实验室
核心提示:云计算(Cloud Computing)是一项正在兴起中的技术。它的出现,有可能完全改变用户现有的以桌面为核心的使用习惯,而转移到以Web为核心,使用Web上的存储与服务。人类有可能因此迎来一个新的信息化时代……
“云计算”越来越成为人们所关注...
8 Comments »
2008年4月1日 23:29
这是我上周在实验室大组会议上报告的《云计算:Cloud Computing》的摘要和ppt。云计算是为了一项革命性的技术,有可能使用户使用电脑的习惯从桌面转移到Web,彻底抛弃现有的各种软件。因此大家有兴趣的话可以关注一下:)
云计算介绍 [ppt]
Abstract:
在这个报告中,我们介绍了一个正在到来的颠覆性的技术革命——云计算。同时,我们讨论了云计算与Web2.0以及网格...
1 Comment »
2008年3月25日 13:12
本周我打算在实验室内汇报关于云计算的相关内容,这是目前Google和IBM等大公司主推的一个东西。为了介绍云计算,我认为必须先了解什么是网格计算,因为有些人称“云计算是网格计算2.0”,我认为这个提法蛮有意思的。以下是关于网格计算的基础知识,转自IBM:
由于网格计算是一种新兴的技术,对于不同的人来说可能会有不同的定义,但是网格计算有一个非...
6 Comments »