2008-02-29
仲子说:图书价格比较网Beta版隆重发布!
标签:bookprice, Deep Web Data Integration, JobTong, mashup, Web Data Management, 图书价格比较网, 实验室, 数据集成, 比价网一直以来,我都非常想用我们的Deep Web数据集成技术做一些有意义的事(好好活就是做有意义的事,做有意义的事就是好好活),因此才有了Jobtong系统的开发以及在此基础上构建的工作信息集成网站:工作通。
但是工作通的应用领域只是工作信息集成与发布,而这个领域是有很强的时间序列性,也就是每年的一个特定时间段,针对一个特定人群(当然,主要是大学毕业生)。因而不具有很好的连贯性与社会效用。而且,随着Jobtong核心技术的成熟,我也越来越感到:Jobtong绝不仅仅是一个“工作通”,它可以应用在更多的领域(例如图书、二手车等领域)以及更多的应用场合(例如结果集成、接口集成、Meta-Search、Mashup应用等)。
于是,在上个学期末我就萌生了这样一个想法,利用我们的Deep Web数据集成技术做一些有意思的能够真正服务于大众(主要还是指网民)的东西,也就是这个图书价格比较网。
当然,由于期末考以及实验室研究的原因,一直未能够腾出时间来做这件事情。于是这个事情就拖到了寒假。在寒假里,我花了两天时间,在Jobtong核心技术上,构建了图书价格比较的应用。之后回到学校,又花了两个晚上,修改程序以及构建网站。终于,这个图书价格比较网在2008年2月29日这个四年才有一次的日子里上线啦!
图书价格比较网网址:http://books.wangzhongyuan.com
目前,这个图书价格比较网具有如下特性:
1、能够对用户搜索的书籍提供卓越网与当当网上的图书价格比较;
2、对于用户感兴趣的书,可以直接点击链接回到卓越网或当当网进行购买;
3、所有结果实时产生,因此价格必然是当当网和卓越网的最新价格,不用担心是过期数据以及错误数据。
以上就是这个网站最重要的特性,虽然看起来很简单,却包含了Deep Web数据集成、实体(对象)数据抽取、实体识别等技术。
不过,目前这个网站还只是测试(Beta)版,界面简单,而且只取当当网以及卓越网第一页返回结果(因此,搜索的书名越具体,效果或许会越好)进行比较。同时,这个网站还具有接口集成所具有的通病:那就是返回给用户结果的速度不是很快。总之,还有许多问题,因此,也欢迎大家给我留言提意见:)
如果有时间,我会不断改进这个网站的。
本文可以自由转载,转载时请保留全文并注明出处:
转载自仲子说 [ http://www.wangzhongyuan.com/ ]
原文链接:http://www.wangzhongyuan.com/archives/303.html
haopeng said,
2008年2月29日 at 12:44
up!
槛外人 said,
2008年3月3日 at 18:53
牛人
Yuheng Hu said,
2008年3月4日 at 0:32
integrated好后的ranking怎么做的?有topK吗?
仲远 said,
2008年3月5日 at 0:06
没有topK:)
因为目标定位是在极少的记录中识别出相同的记录~