2008-02-29

仲子说:图书价格比较网Beta版隆重发布!

Posted in 实验室, Web Data Management, mashup, JobTong at 0:51 Author:仲远

标签:

一直以来,我都非常想用我们的Deep Web数据集成技术做一些有意义的事(好好活就是做有意义的事,做有意义的事就是好好活),因此才有了Jobtong系统的开发以及在此基础上构建的工作信息集成网站:工作通

但是工作通的应用领域只是工作信息集成与发布,而这个领域是有很强的时间序列性,也就是每年的一个特定时间段,针对一个特定人群(当然,主要是大学毕业生)。因而不具有很好的连贯性与社会效用。而且,随着Jobtong核心技术的成熟,我也越来越感到:Jobtong绝不仅仅是一个“工作通”,它可以应用在更多的领域(例如图书、二手车等领域)以及更多的应用场合(例如结果集成、接口集成、Meta-Search、Mashup应用等)。

于是,在上个学期末我就萌生了这样一个想法,利用我们的Deep Web数据集成技术做一些有意思的能够真正服务于大众(主要还是指网民)的东西,也就是这个图书价格比较网

当然,由于期末考以及实验室研究的原因,一直未能够腾出时间来做这件事情。于是这个事情就拖到了寒假。在寒假里,我花了两天时间,在Jobtong核心技术上,构建了图书价格比较的应用。之后回到学校,又花了两个晚上,修改程序以及构建网站。终于,这个图书价格比较网在2008年2月29日这个四年才有一次的日子里上线啦!

图书价格比较网网址:http://books.wangzhongyuan.com

目前,这个图书价格比较网具有如下特性:
1、能够对用户搜索的书籍提供卓越网与当当网上的图书价格比较;
2、对于用户感兴趣的书,可以直接点击链接回到卓越网或当当网进行购买;
3、所有结果实时产生,因此价格必然是当当网和卓越网的最新价格,不用担心是过期数据以及错误数据。

以上就是这个网站最重要的特性,虽然看起来很简单,却包含了Deep Web数据集成、实体(对象)数据抽取、实体识别等技术。

不过,目前这个网站还只是测试(Beta)版,界面简单,而且只取当当网以及卓越网第一页返回结果(因此,搜索的书名越具体,效果或许会越好)进行比较。同时,这个网站还具有接口集成所具有的通病:那就是返回给用户结果的速度不是很快。总之,还有许多问题,因此,也欢迎大家给我留言提意见:)

如果有时间,我会不断改进这个网站的。

本文可以自由转载,转载时请保留全文并注明出处:
转载自仲子说 [ http://www.wangzhongyuan.com/ ]
原文链接:

4 Comments »

  1. haopeng said,

    2008年February29日 at 12:44

    up!

  2. 槛外人 said,

    2008年March3日 at 18:53

    牛人

  3. Yuheng Hu said,

    2008年March4日 at 0:32

    integrated好后的ranking怎么做的?有topK吗?

  4. 仲远 said,

    2008年March5日 at 0:06

    没有topK:)
    因为目标定位是在极少的记录中识别出相同的记录~

Leave a Comment

*
To prove you're a person (not a spam script), type the security text shown in the picture. Click here to regenerate some new text.
Click to hear an audio file of the anti-spam word