欢迎您光临我的个人网站!


2008-12-12

垂直搜索何去何从?

Posted in Web Data Management, JobTong at 15:14 by 仲远

标签:
Zhongyuan Wang

97100fe403b8
垂直搜索何去何从?

垂直搜索自前几年兴起以后,这些年有许许多多人以此为契机,进行创业。比较出名的有酷讯、去哪儿等网站,Google也开发了“生活搜索”:
 
此外,还有许许多多的人已经创建了或者正在创建垂直搜索网站(也有的称为生活搜索)。
我们实验室,利用数据集成技术,也开发了一些网站,例如Jobtong(工作通),政务通等网站。当然,由于是在实验室,这些网...查看全文

2008-12-10

最近发现淘宝数据仓库团队也在研究Hadoop

Posted in 实验室, Web Data Management at 20:22 by 仲远

标签:
最近发现淘宝数据仓库团队也在研究Hadoop

最近,在网上查找资料的时候,发现淘宝数据仓库团队有一个Blog:http://rdc.taobao.com/blog/dw/,这个Blog上有许多淘宝数据仓库团队的技术文章。我仔细看了看,还是很不错的。因此推荐一下。

发现他们最近也在研究Hadoop,而且还写了一些Hadoop的配置及使用细节,如《hadoop使用中的几个小细节》还是相当实用的。
我也已经关注云计算有相当长的一段时间了,我的网站...查看全文

2008-11-28

与微软亚洲研究的交流讨论

Posted in 实验室, Web Data Management at 14:20 by 仲远

标签:

昨天上午,微软亚洲研究院的Xie Xing, Zheng Yu, Chen Wen到我们实验室交流访问。Zheng Yu博士我见过,之前他参加过今年的MDM会议。Xie Xing和Zheng Yu虽然是属于微软亚洲研究院Web Search & Data Mining Group,但是他们一直关注于Mobile and Location方面的一些研究。Chen Wen是微软高校关系部的。
这次的讨论,更多的是偏向Mobile组的,因此Mobile组的Hao Xin和Pan Xiao师姐介绍了一下她们在Mobile...查看全文

2008-11-17

百度和Google都开始行动了

Posted in Web Data Management at 14:08 by 仲远

标签:
百度和Google都开始行动了

近段时间,关于百度“竞价排名”的弊端突然间被媒体大炒特炒,我在上一篇文章中也提到了《百度正面临空前危机》。

据说百度总部及各分公司上周末召开紧急会议,专门讨论如何应对央视曝光“百度竞价排名中虚假医药网站欺骗消费者”的问题。在这次会议中百度决定,对没有医药许可证的百度竞价排名网站将在18日全部下线,只有竞价排名用户提供正规医药许可...查看全文

2008-11-15

百度正面临空前危机

Posted in Web Data Management, 热门话题 at 23:35 by 仲远

标签:
百度正面临空前危机

百度的竞价排名以及人工干预搜索结果的方式所带来的收入,曾经是并且现在仍然是百度的主要收入之一。

所谓的竞价排名,也就是说如果你付给百度一些钱,向百度购买一些关键字,那么用户在搜索这些关键字的时候,你的网页就能够排在搜索结果中最靠前的位置。那么很显然,对于一些比较热门的关键字,如果你要想取得尽量靠前的位置,就必须出更多的钱。例...查看全文

2008-11-01

“云数据库”是数据库以及Web数据管理发展的未来吗?

Posted in Web Data Management at 21:28 by 仲远

标签:
“云数据库”是数据库以及Web数据管理发展的未来吗?

任何一种新技术的产生,必然都是为了解决原有技术无法解决的问题。就如当初数据库取代文件系统,解决了文件系统的冗余性、数据存取困难、不一致性等问题。而在Web应用环境下,Web规模的文件系统又解决了数据库难以处理的超大数据量、响应速度较低等问题。
云计算也是如此,它的产生不是一蹴而就,而是在Web发展过程中以及Web数据管理研究的演化中产生的。因...查看全文

2008-10-31

云计算与Web数据管理

Posted in Web Data Management at 17:21 by 仲远

标签:
云计算与Web数据管理

随着Web(网络)的兴起,如何有效的管理Web数据,一直是一个热门的研究课题。而云计算,自其诞生之日起,就离不开Web,以及Web上的数据管理。
在Web发展的初期,大量页面以HTML页面(即静态页面)的形式存在,杂乱无章,无法进行有效管理。之后,搜索引擎的产生,在一定程度上将这些海量页面进行了重新组织,建立索引,提供给用户进行搜索。但是,Web经过一段...查看全文

2008-10-13

中文文献集成系统正式发布!

Posted in 实验室, Web Data Management at 23:54 by 仲远

标签:

经过上个月对于数据的进一步集成和整理,目前以作者为中心的中文文献集成系统C-DBLP已经集成超过5万条论文文献,4万名作者。今天C-DBLP正式发布!
研究动机
     计算机科学文献库DBLP Computer Science Bibliography在学术界有很好的声誉,给人们带来了极大的便利,其权威性也得到了研究界的高度认可。遗憾的是,DBLP没有提供对中文文献的收录和检索功能,国内的权...查看全文

2008-08-05

向大家推荐一个有趣的搜索引擎:人立方关系搜索

Posted in 随笔, Web Data Management at 9:41 by 仲远

标签:
向大家推荐一个有趣的搜索引擎:人立方关系搜索

微软亚洲研究院终于正式推出对象级别的搜索引擎了!
这就是人立方关系搜索:http://renlifang.msra.cn/
之前我曾经写过一篇文章叫做《昨天聆听了微软亚洲研究院聂再清博士《Object-Level Vertical Search》的演讲》,就介绍了微软亚洲研究院正在进行的对象级别搜索引擎的研究。当时聂再清博士已经给我们演示过“关系搜索”,不过那时“关系搜索”还处于微软内测阶段,...查看全文

2008-07-31

又一个新型搜索引擎Cuil诞生

Posted in Web Data Management, JobTong at 15:37 by 仲远

标签:
又一个新型搜索引擎Cuil诞生

本周一,又一个新的搜索引擎Cuil (http://www.cuil.com/ )诞生。
这个搜索引擎相信许多站长应该都会注意到,因为早在数月之前,其爬虫Twiceler就经常进行网页爬取。当时,按照爬虫所给出的url可以看到,这个搜索引擎在进行数据积累,但是并没有发布,直到本月的28日,Cuil正式发布。

Cuil是Google公司的前技术工程师开发的一个新型的以内容为核心的搜索引擎。据说...查看全文

Pages (6): « 1 [2] 3 4 5 » ... Last »