查询的标签:


今天到移动研究院访问

标签: , and

今天,我们实验室的几名同学和孟老师一起去移动研究院访问,与他们进行了一次讨论,主要介绍了我们实验室这边的工作以及了解了一下他们的需求。我介绍了一下Deep Web数据集成方面的一个技术以及垂直搜索的搭建方法。如果合适,或许会有进一步的合作。
之前实验室曾计划组织人员到微软亚洲研究院进行一次交流访问,因故没有成行。现在负责联系的师姐去了香...

2 Comments »

Windows下编译Apache与Unix下编译Apache的不同感受

标签: , , , and

虽然Unix有着许许多多的很不好使的地方,但是起码在一点——“Apache的编译”问题上,Unix展现着Windows无法比拟的优势与便捷。
之前使用Unix下的源码安装过apache,几行命令就完全搞定Apache的编译与安装,没有遇到任何错误与问题。而在Unix下编写一个新的Module,也只要几行命令就能够成功编译。但是在Windows下编译Apache就没那么容易了。使用Visual C++ 2005进行编译,还需要...

No Comments »

我所观察到的一次Google Dance现象

标签: , , , , and

虽然大家每日使用Google,看起来没有什么不同,使用起来也没有什么不同。但是其实Google是经常调整她的算法的,据称Google去年一年就调整过450次搜索算法。通过算法一次次的调整,Google不断改进用户体验,同时提供搜索结果的质量。
其中,这个算法的调整,可能伴着Google Dance现象的发生。所谓的Google Dance,就是Google每个月固定调整她的索引库(当然是指她的BigTable),...

No Comments »

一场断电引起的“血案”?

标签: , , , , , and

最近在针对搜索引擎做一项实验,于是利用实验室的废弃电脑搭建起来一个测试网站:AntiIndexTest,刚开始数天,实验十分顺利,各个搜索引擎也非常快速的进行收录。正当期望实验取得进一步进展时,学校停电了,实验室也不能幸免。
经过一个晚上的停电,刚开始还未发现任何异常,但是到下午时,突然发现Google不再来爬取网站页面,而整个网站在Google中搜不到任何...

No Comments »

原来压缩论文也是很痛苦的~

标签: , and

当时投NDBC年会文章的时候,只顾着把东西往上写,周围师兄师姐也说"先写上去再说呗,以后删还不容易吗"。于是一不小心就写了7页满满的。这几天接到论文录取通知,要求提交正式论文,并且不能超过7千字,看以往的文章,似乎年会论文一般在5页,于是不得不“操刀自残”,却发现总也下不去手。看看这里也觉得必不可少,看看那里也觉得删掉后语义不连贯。于...

4 Comments »

恭喜实验室刘博毕业答辩顺利通过~

标签: , , and

我们组的头刘博今天进行博士论文答辩,题目是《Deep Web数据集成中关键技术研究》。他在这次报告中主要介绍了他博士期间做的几个题目,包括基于视觉的数据抽取以及实体识别等。刘博今天也第一次打上领带,很精神:)
刘博是个好人啊~想当初刚到实验室,多亏他的帮助与指点,才一步步进入正轨。现在他要走了,他真的要走了。。。那就祝他一路走好吧!
...

2 Comments »

实验室为四川大地震中遇难者默哀...

标签: and

5月19日14点28分,实验室老师和同学在一层会议室默哀3分钟,向死难同胞致哀,为生者祈福。回首上个礼拜第一次听到四川地震的消息时,那种惊诧沉痛之情犹在心中。在一个礼拜的救援中,有许多人被救了出来,也有许多人从此长眠于地下。为了纪念这些遇难者,国务院将5月19~21日定为全国哀悼日,同时在19日下午2点28分起,全国默哀3分钟。我们实验室也在一楼,为这些...

No Comments »

全世界占有率最高的十大搜索引擎

标签: , , , , , , and

最近需要针对搜索引擎做一些实验,于是查看了一下全球十大搜索引擎,发现居然还有两家中国搜索引擎公司。呵呵,估计是因为中国网民众多的缘故吧。以下就是comScore在2007年12月发布的2007年全球十大搜索引擎: 
名次 公司名称 市场占有率
  1 Google 62% (Google在全球范围内的影响力自然不用多说)
  2 雅虎 12.8% (老牌门户网站以及搜索引擎公司)
...

No Comments »

昨天聆听了微软亚洲研究院聂再清博士《Object-Level Vertical Search》的演讲

标签: , , , , , , , and

昨天的《智能信息检索》课程请的是微软亚洲研究院的聂再清博士来向我们介绍《Object-Level Vertical Search》,这已经是我第二次听聂博士的介绍了。上一次是在参加Yocsef举办的《垂直搜索》时听过他演讲,主题也是“对象级别的垂直搜索”。
目前微软亚洲研究院正在进行的几项研究,包括Libra, Guanxi, Product Search等,都是很有意思的对象级别的垂直搜索。其实对象这个词,...

1 Comment »

搜索引擎爬虫列表

标签: , , , , , and

搜索引擎是人们再熟悉不过的工具,它将Internet上的信息索引起来,方便人们在海量数据中迅速查找有用的信息。而搜索引擎公司,国外以Google为代表,国内以百度为代表,成为互联网上举足轻重的公司,其访问量也远远超过传统门户网站,成为网民最离不开的网络服务。而遇到问题“Google一下”或者“百度一下”也成为人们日常生活中的习惯。
而对于网站建设者而言...

1 Comment »