欢迎您光临我的个人网站!


2011-03-01

Freebase中Topic互相引用分析

Posted in Web Data Management, 微软, Knowledge Base at 16:22 by 仲远

标签:
Zhongyuan Wang

97100fe403b8
Freebase中Topic互相引用分析

Freebase是一个由社区成员共同努力协作构建的大型知识库。它的许多知识已经被各大搜索引擎,如Google,Bing等,广泛使用以改善搜索结果质量。目前,创建Freebase的公司Metaweb已经被Google收购。
 
Freebase上有许多的Topic(也可以看成是entity或者是instance),这些Topic有许多的attribute以及value(属性&值)。以Microsoft这个topic为例(以下数据直接从Freebase的DataDump中获得,...查看全文

2009-07-11

人立方的六度使得我和奥巴马联系起来了

Posted in Web Data Management at 15:59 by 仲远

标签:
人立方的六度使得我和奥巴马联系起来了

人立方是微软亚洲研究院的一个对象级搜索产品。自推出以来,已经受到广泛关注,其核心思想是将页面中的“对象”(也有称为“实体”的)抽取出来,组建关联,然后提供给用户进行搜索。其后,人立方搜索引擎又推出升级版本,在升级版本中,加入了“六度搜索”功能。

何谓“六度搜索”?
六度空间的概念来源于美国哈佛大学的社会心理学家米尔格兰姆所...查看全文

2009-04-25

云计算系统与P2P网络的不同点

Posted in Web Data Management at 18:44 by 仲远

标签:

云计算系统与P2P网络有一些相似之处,它们之间也有一些技术可以互相借鉴。但是,这两类系统之间也存在一些不同点。
(1)在云计算系统中,服务由服务提供商来管理,云计算中的每一个节点提供的是计算资源以及存储资源,并且这些节点通常由Master来进行管理。而P2P系统中的每一个节点是自治的,他们也提供一定的计算资源,但是他们自己可以决定提供资源的多...查看全文

2009-03-27

和Haixun Wang的一些交流

Posted in 实验室, Web Data Management at 13:47 by 仲远

标签:

Haixun Wang要回国了,他要从IBM美国T. J. Watson Research Center,回到国内的微软亚洲研究院。他认为IBM研究院那边做研究还是不够,Project做得多一些。而微软亚洲研究院则确实是在国内外都相当有影响力的一个研究机构。
Haixun最近也是在关注Cloud Computing方面的一些东西,主要是一致性方面的一些问题。我们知道,在云计算环境下,所有的数据都存在多个备份中。这些备份,...查看全文

2009-02-20

谷歌中国:地图与移动搜索将迅速成长,暗网早已覆盖

Posted in 实验室, Web Data Management at 22:02 by 仲远

标签:
谷歌中国:地图与移动搜索将迅速成长,暗网早已覆盖

谷歌大中华区总裁李开复今日召开媒体见面会,探讨谷歌2009年的发展重点和方向。李开复认为谷歌中国在2008年的发展是巨大的,市场份额也比2007年有了巨大的提高。同时,他认为在未来1、2年内,地图与移动搜索将迅速成长、爆发。针对《百度研发“阿拉丁平台”,欲覆盖“暗网”信息检索》,李开复认为Google早已经覆盖了暗网(Deep Web)中的内容,并将其整合到了Google的...查看全文

2009-01-17

实验室网站发布2008年年报

Posted in 实验室, Web Data Management at 19:42 by 仲远

标签:
实验室网站发布2008年年报

实验室网站每年都会发布一个年报,用以记录实验室这一年来的一些研讨专题以及研究成果。2008年的年报也已经发布了,网址为:http://idke.ruc.edu.cn/reports/report2008_cn.htm。
 
在这次年报上,我参与了多篇文章的写作,包括:
1、《Anti-Index: Against Privacy Mining via Search Engines》
这篇论文介绍的是在搜索引擎环境下的用户隐私问题,我们建立了一个模型,并据此分...查看全文

2008-12-30

云计算与数据管理专题导言

Posted in 实验室, Web Data Management at 13:45 by 仲远

标签:
云计算与数据管理专题导言

云计算与数据管理专题导言
王仲远
云计算(Cloud Computing)是一项正在兴起中的技术。它是当前业界最火的词汇之一,它与很多或时髦或老牌的技术词汇联系到一起,比如虚拟化、网格、SaaS。
云计算是在分布式系统、网格计算等基础上提出的一个新概念,它面对的是超大规模的分布式环境,其核心是提供数据存储以及网络计算,由此衍生出一系列的服务。它的出...查看全文

2008-12-27

云计算将给人们生活带来何种变化?

Posted in 实验室, Web Data Management, 热门话题 at 23:48 by 仲远

标签:
云计算将给人们生活带来何种变化?

现在许多媒体关注云计算,或许更将其看作是一种服务器资源,能够为为企业用户提供低价的但是计算能力确实非常强大的服务。但是其实云计算未来带给人们的远远不止这些。或许我们更需要关注的是它所能够给人们带来的个人数据管理上的方便。

今天实验室的例会,就是邀请了在EMC工作的Jidong和清华大学的体系结构的Cai博士来做云计算的专题报告。
Jidong介绍...查看全文

2008-12-26

C-DBLP系统添加了一个有趣的新功能: 论文数量趋势图

Posted in 实验室, Web Data Management, JobTong at 21:39 by 仲远

标签:
C-DBLP系统添加了一个有趣的新功能: 论文数量趋势图

C-DBLP是一个以作者为中心的中文文献集成系统。系统现在集成了12本中文计算机权威期刊和1个数据库会议,目前有超过5万名的作者信息以及接近6万条的论文记录。
C-DBLP中有很多丰富的数据和关联等待挖掘,我们也已经制定了下一步的开发计划。
今天,我们推出了基于Google Chart API所开发的一个作者文献数量趋势图的小功能,它能够反映出作者在不同年份发表的论...查看全文

2008-12-20

百度研发“阿拉丁平台”,欲覆盖“暗网”信息检索

Posted in 实验室, Web Data Management, JobTong, 新闻点评 at 15:21 by 仲远

标签:
百度研发“阿拉丁平台”,欲覆盖“暗网”信息检索

虽然之前央视曝光了百度的竞价排名模式可能带来的危害(感兴趣的朋友可以点击关键字百度进行查看),但是百度CEO李彦宏坚称竞价排名的商业模式本身没问题,百度不会放弃该业务模式。并且李彦宏提到“百度离破产只有30天。大家之所以看好搜索市场,就是因为它的成长速度非常高。成长也是变化的一种,如果不能及时把握市场需求的变化,就会被淘汰”。这其实是...查看全文

Pages (6): [1] 2 3 4 » ... Last »