查询的标签:


国际上做Data Integration的两个牛人的去向

标签: , , , and

Data Integration是近些年来国际上的一个研究热点,目前已经有许许多多的相关paper发表了。在这个领域上的牛人自然很多,今天就说说其中两个牛人的去向吧。
一个是Alon Y. Halevy,他是最早提出Data Integration框架的人,他在VLDB1996上的那篇《Querying Heterogeneous Information Sources Using Source Descriptions》文章获得VLDB2006年颁发的十年最佳paper,并由此提出了Dataspace的概念,在全世界上...

1 Comment »

恭喜实验室刘博毕业答辩顺利通过~

标签: , , and

我们组的头刘博今天进行博士论文答辩,题目是《Deep Web数据集成中关键技术研究》。他在这次报告中主要介绍了他博士期间做的几个题目,包括基于视觉的数据抽取以及实体识别等。刘博今天也第一次打上领带,很精神:)
刘博是个好人啊~想当初刚到实验室,多亏他的帮助与指点,才一步步进入正轨。现在他要走了,他真的要走了。。。那就祝他一路走好吧!
...

2 Comments »

昨天聆听了微软亚洲研究院聂再清博士《Object-Level Vertical Search》的演讲

标签: , , , , , , , and

昨天的《智能信息检索》课程请的是微软亚洲研究院的聂再清博士来向我们介绍《Object-Level Vertical Search》,这已经是我第二次听聂博士的介绍了。上一次是在参加Yocsef举办的《垂直搜索》时听过他演讲,主题也是“对象级别的垂直搜索”。
目前微软亚洲研究院正在进行的几项研究,包括Libra, Guanxi, Product Search等,都是很有意思的对象级别的垂直搜索。其实对象这个词,...

1 Comment »

图书价格比较网进行重要修改,添加Ajax功能

标签: , , , , , , , , , and

图书价格比较网:http://books.wangzhongyuan.com
仲子说的图书价格比较网由于是采用实时采集数据,因此用户输入一本书的名字后,需要等待这个查询实时提交到当当网和卓越网,然后取回结果进行比较。因此用户在查询的时候,很有可能等待很久查询结果网页才能够打开。
在考虑如何增加用户体验上,我最后打算使用Ajax来实现对数据的采集与比较。所以这次图书价格...

No Comments »

图书价格比较网进行了几项重要修改

标签: , , , , , , , and

图书价格比较网:http://books.wangzhongyuan.com
自图书价格比较网Beta版发布以来,还是有许多同学给我反馈意见。根据这些反馈意见,我进行了一下修改。这次的修改主要包括如下几个特性:
1、这次修改最重要的部分就是增加了对于未匹配上的书目信息的显示。也就是说在当当网和卓越网进行比较后,如果识别出相同记录(也就是同一本书),那就一块显示在上面。而...

No Comments »

仲子说:图书价格比较网Beta版隆重发布!

标签: , , , , , , , and

一直以来,我都非常想用我们的Deep Web数据集成技术做一些有意义的事(好好活就是做有意义的事,做有意义的事就是好好活),因此才有了Jobtong系统的开发以及在此基础上构建的工作信息集成网站:工作通。
但是工作通的应用领域只是工作信息集成与发布,而这个领域是有很强的时间序列性,也就是每年的一个特定时间段,针对一个特定人群(当然,主要是大学毕业生)...

4 Comments »

昨天参加了YOCSEF的“垂直搜索技术”专题报告会

标签: , , , , , , , , and

垂直搜索是相对于通用搜索(如google、百度……)而提出的一种概念,它针对某一特定领域,如房产、旅游、职位、汽车、文献等,涉及结构化以及对象化的搜索技术。垂直搜索比通用搜索更专业、更精确、更及时、更深入。
垂直搜索可以从多个角度入手,例如IR、NLP或者数据库等等。就数据库角度而言,我们通常认为垂直搜索技术是在某一个具体领域上Deep Web数据集...

1 Comment »

Jobtong系统进展与研究方向

标签: , , , , and

上周日做了一次报告,是介绍Jobtong相关的一些东西。对于有志于做Web数据集成,尤其是Deep Web Data Integration的人,可以参考参考:)
Abstract:
This presentation introduced to Jobtong system which was a effective Deep Web Data Integration System. It also showed progress of Jobting in this term and propose plans need to do in future.
摘要:
这个报告介绍了一个Deep Web上进行大规模数据集成的系统:Jobtong系...

2 Comments »

我对Uncertainty in Deep Web Data Integration的理解

标签: , , , , and

随着VLDB2007的召开,Uncertain越来越受到大家都关注,一篇《Data Integration with Uncertainty》更是首次直接在Data Integration中提出Uncertainty的问题。虽然这篇文章是最新的,但是其实Uncertainty这个问题并不是最新的。
Uncertainty问题在Web Data Integration中其实一直是存在的。Web数据的杂乱无章性使得Uncertainty问题与生俱来。只是我们以前并不认为它是一个问题,总是试图在各种solution中...

No Comments »