2008年3月23日 13:32
图书价格比较网:http://books.wangzhongyuan.com
仲子说的图书价格比较网由于是采用实时采集数据,因此用户输入一本书的名字后,需要等待这个查询实时提交到当当网和卓越网,然后取回结果进行比较。因此用户在查询的时候,很有可能等待很久查询结果网页才能够打开。
在考虑如何增加用户体验上,我最后打算使用Ajax来实现对数据的采集与比较。所以这次图书价格...
No Comments »
2008年3月4日 15:49
图书价格比较网:http://books.wangzhongyuan.com
自图书价格比较网Beta版发布以来,还是有许多同学给我反馈意见。根据这些反馈意见,我进行了一下修改。这次的修改主要包括如下几个特性:
1、这次修改最重要的部分就是增加了对于未匹配上的书目信息的显示。也就是说在当当网和卓越网进行比较后,如果识别出相同记录(也就是同一本书),那就一块显示在上面。而...
No Comments »
2008年2月29日 0:51
一直以来,我都非常想用我们的Deep Web数据集成技术做一些有意义的事(好好活就是做有意义的事,做有意义的事就是好好活),因此才有了Jobtong系统的开发以及在此基础上构建的工作信息集成网站:工作通。
但是工作通的应用领域只是工作信息集成与发布,而这个领域是有很强的时间序列性,也就是每年的一个特定时间段,针对一个特定人群(当然,主要是大学毕业生)...
4 Comments »
2008年1月12日 23:56
垂直搜索是相对于通用搜索(如google、百度……)而提出的一种概念,它针对某一特定领域,如房产、旅游、职位、汽车、文献等,涉及结构化以及对象化的搜索技术。垂直搜索比通用搜索更专业、更精确、更及时、更深入。
垂直搜索可以从多个角度入手,例如IR、NLP或者数据库等等。就数据库角度而言,我们通常认为垂直搜索技术是在某一个具体领域上Deep Web数据集...
4 Comments »
2007年12月11日 21:21
上周日做了一次报告,是介绍Jobtong相关的一些东西。对于有志于做Web数据集成,尤其是Deep Web Data Integration的人,可以参考参考:)
Abstract:
This presentation introduced to Jobtong system which was a effective Deep Web Data Integration System. It also showed progress of Jobting in this term and propose plans need to do in future.
摘要:
这个报告介绍了一个Deep Web上进行大规模数据集成的系统:Jobtong系...
2 Comments »
2007年11月4日 17:37
在我10月30日的一篇文章《使用JDBC后记得关闭并释放数据库连接资源噢:)》中,提到JDBC中的Mysql数据库连接Connection和Statement、Resultset使用完毕之后一定要关闭,否则会占用大量内存资源,导致内存溢出。为了验证连接关闭是否确实能够释放资源,我做了一个小实验。一个小的数据库连接、查询、插入的程序,测试记录为8万条。
(1)整个程序创建了一个Connection的对象conn...
2 Comments »
2007年10月30日 13:34
前几天做Jobtong的地点规范化工作,发现运行程序后一段时间居然出现 out of memory ! 这让我惊诧不已,1.5G的内存,跑这样的一个小程序居然就内存溢出了?于是随即check了一下代码,发现是写程序的时候图方便,直接建立了一个conn之后就一直使用,没有任何释放过程,Statement使用完之后也没有释放资源。这样当数据查询一多之后,内存需求不断增加,原来用完的资源又没有释...
2 Comments »