2009年2月20日 22:02
谷歌大中华区总裁李开复今日召开媒体见面会,探讨谷歌2009年的发展重点和方向。李开复认为谷歌中国在2008年的发展是巨大的,市场份额也比2007年有了巨大的提高。同时,他认为在未来1、2年内,地图与移动搜索将迅速成长、爆发。针对《百度研发“阿拉丁平台”,欲覆盖“暗网”信息检索》,李开复认为Google早已经覆盖了暗网(Deep Web)中的内容,并将其整合到了Google的...
2 Comments »
2008年12月30日 13:45
云计算与数据管理专题导言
王仲远
云计算(Cloud Computing)是一项正在兴起中的技术。它是当前业界最火的词汇之一,它与很多或时髦或老牌的技术词汇联系到一起,比如虚拟化、网格、SaaS。
云计算是在分布式系统、网格计算等基础上提出的一个新概念,它面对的是超大规模的分布式环境,其核心是提供数据存储以及网络计算,由此衍生出一系列的服务。它的出...
No Comments »
2008年12月20日 15:21
虽然之前央视曝光了百度的竞价排名模式可能带来的危害(感兴趣的朋友可以点击关键字百度进行查看),但是百度CEO李彦宏坚称竞价排名的商业模式本身没问题,百度不会放弃该业务模式。并且李彦宏提到“百度离破产只有30天。大家之所以看好搜索市场,就是因为它的成长速度非常高。成长也是变化的一种,如果不能及时把握市场需求的变化,就会被淘汰”。这其实是...
2 Comments »
2008年12月12日 15:14
垂直搜索自前几年兴起以后,这些年有许许多多人以此为契机,进行创业。比较出名的有酷讯、去哪儿等网站,Google也开发了“生活搜索”:
此外,还有许许多多的人已经创建了或者正在创建垂直搜索网站(也有的称为生活搜索)。
我们实验室,利用数据集成技术,也开发了一些网站,例如Jobtong(工作通),政务通等网站。当然,由于是在实验室,这些网...
No Comments »
2008年11月1日 21:28
任何一种新技术的产生,必然都是为了解决原有技术无法解决的问题。就如当初数据库取代文件系统,解决了文件系统的冗余性、数据存取困难、不一致性等问题。而在Web应用环境下,Web规模的文件系统又解决了数据库难以处理的超大数据量、响应速度较低等问题。
云计算也是如此,它的产生不是一蹴而就,而是在Web发展过程中以及Web数据管理研究的演化中产生的。因...
1 Comment »
2008年10月31日 17:21
随着Web(网络)的兴起,如何有效的管理Web数据,一直是一个热门的研究课题。而云计算,自其诞生之日起,就离不开Web,以及Web上的数据管理。
在Web发展的初期,大量页面以HTML页面(即静态页面)的形式存在,杂乱无章,无法进行有效管理。之后,搜索引擎的产生,在一定程度上将这些海量页面进行了重新组织,建立索引,提供给用户进行搜索。但是,Web经过一段...
No Comments »
2008年7月17日 20:52
Data Integration是近些年来国际上的一个研究热点,目前已经有许许多多的相关paper发表了。在这个领域上的牛人自然很多,今天就说说其中两个牛人的去向吧。
一个是Alon Y. Halevy,他是最早提出Data Integration框架的人,他在VLDB1996上的那篇《Querying Heterogeneous Information Sources Using Source Descriptions》文章获得VLDB2006年颁发的十年最佳paper,并由此提出了Dataspace的概念,在全世界上...
3 Comments »
2008年5月23日 18:43
我们组的头刘博今天进行博士论文答辩,题目是《Deep Web数据集成中关键技术研究》。他在这次报告中主要介绍了他博士期间做的几个题目,包括基于视觉的数据抽取以及实体识别等。刘博今天也第一次打上领带,很精神:)
刘博是个好人啊~想当初刚到实验室,多亏他的帮助与指点,才一步步进入正轨。现在他要走了,他真的要走了。。。那就祝他一路走好吧!
...
2 Comments »
2008年5月16日 21:05
昨天的《智能信息检索》课程请的是微软亚洲研究院的聂再清博士来向我们介绍《Object-Level Vertical Search》,这已经是我第二次听聂博士的介绍了。上一次是在参加Yocsef举办的《垂直搜索》时听过他演讲,主题也是“对象级别的垂直搜索”。
目前微软亚洲研究院正在进行的几项研究,包括Libra, Guanxi, Product Search等,都是很有意思的对象级别的垂直搜索。其实对象这个词,...
1 Comment »
2008年3月23日 13:32
图书价格比较网:http://books.wangzhongyuan.com
仲子说的图书价格比较网由于是采用实时采集数据,因此用户输入一本书的名字后,需要等待这个查询实时提交到当当网和卓越网,然后取回结果进行比较。因此用户在查询的时候,很有可能等待很久查询结果网页才能够打开。
在考虑如何增加用户体验上,我最后打算使用Ajax来实现对数据的采集与比较。所以这次图书价格...
No Comments »