07.31.08
Posted in Web Data Management, JobTong at 15:37 由 仲远
标签:
Cuil,
JobTong,
Web Data Management,
搜索引擎
本周一,又一个新的搜索引擎Cuil (http://www.cuil.com/ )诞生。
这个搜索引擎相信许多站长应该都会注意到,因为早在数月之前,其爬虫Twiceler就经常进行网页爬取。当时,按照爬虫所给出的url可以看到,这个搜索引擎在进行数据积累,但是并没有发布,直到本月的28日,Cuil正式发布。
Cuil是Google公司的前技术工程师开发的一个新型的以内容为核心的搜索引擎。据说...查看全文
Permalink
07.26.08
Posted in 实验室, Web Data Management, JobTong at 22:36 由 仲远
标签:
dblp,
JobTong,
Web Data Management,
实验室
暑期进行系统开发是实验室的一个传统。这个暑期我们又利用Jobtong技术开发了一个集成系统,展现我们的集成技术。这就是C-DBLP,其发布网址如下:
C-DBLP: www.cdblp.cn
C-DBLP顾名思义,是中文版的一个DBLP,其目标是建立一个国内计算机类中文文献的集成数据库系统,从而为用户提供权威的论文数据和方便的查询服务。目前这个系统已经集成了9本国内权威期刊的数据。...查看全文
Permalink
05.27.08
Posted in 实验室, Web Data Management, JobTong at 20:34 由 仲远
标签:
JobTong,
Web Data Management,
实验室
当时投NDBC年会文章的时候,只顾着把东西往上写,周围师兄师姐也说"先写上去再说呗,以后删还不容易吗"。于是一不小心就写了7页满满的。这几天接到论文录取通知,要求提交正式论文,并且不能超过7千字,看以往的文章,似乎年会论文一般在5页,于是不得不“操刀自残”,却发现总也下不去手。看看这里也觉得必不可少,看看那里也觉得删掉后语义不连贯。于...查看全文
Permalink
05.16.08
Posted in 实验室, Web Data Management, JobTong at 21:05 由 仲远
标签:
bookprice,
Deep Web Data Integration,
Guanxi,
JobTong,
Libra,
Web Data Management,
垂直搜索,
实验室,
微软亚洲研究院
昨天的《智能信息检索》课程请的是微软亚洲研究院的聂再清博士来向我们介绍《Object-Level Vertical Search》,这已经是我第二次听聂博士的介绍了。上一次是在参加Yocsef举办的《垂直搜索》时听过他演讲,主题也是“对象级别的垂直搜索”。
目前微软亚洲研究院正在进行的几项研究,包括Libra, Guanxi, Product Search等,都是很有意思的对象级别的垂直搜索。其实对象这个词,...查看全文
Permalink
03.23.08
Posted in 实验室, JavaScript, Web Data Management, mashup, JobTong at 13:32 由 仲远
标签:
Ajax,
bookprice,
Deep Web Data Integration,
JavaScript,
JobTong,
mashup,
Web Data Management,
图书价格比较网,
实验室,
数据集成,
比价网
图书价格比较网:http://books.wangzhongyuan.com
仲子说的图书价格比较网由于是采用实时采集数据,因此用户输入一本书的名字后,需要等待这个查询实时提交到当当网和卓越网,然后取回结果进行比较。因此用户在查询的时候,很有可能等待很久查询结果网页才能够打开。
在考虑如何增加用户体验上,我最后打算使用Ajax来实现对数据的采集与比较。所以这次图书价格...查看全文
Permalink
02.29.08
Posted in 实验室, Web Data Management, mashup, JobTong at 0:51 由 仲远
标签:
bookprice,
Deep Web Data Integration,
JobTong,
mashup,
Web Data Management,
图书价格比较网,
实验室,
数据集成,
比价网
一直以来,我都非常想用我们的Deep Web数据集成技术做一些有意义的事(好好活就是做有意义的事,做有意义的事就是好好活),因此才有了Jobtong系统的开发以及在此基础上构建的工作信息集成网站:工作通。
但是工作通的应用领域只是工作信息集成与发布,而这个领域是有很强的时间序列性,也就是每年的一个特定时间段,针对一个特定人群(当然,主要是大学毕业生)...查看全文
Permalink
01.12.08
Posted in 实验室, Web Data Management, JobTong at 23:56 由 仲远
标签:
Deep Web Data Integration,
Guanxi,
JobTong,
Libra,
Web Data Management,
YOCSEF,
垂直搜索,
天网,
实验室,
酷讯
垂直搜索是相对于通用搜索(如google、百度……)而提出的一种概念,它针对某一特定领域,如房产、旅游、职位、汽车、文献等,涉及结构化以及对象化的搜索技术。垂直搜索比通用搜索更专业、更精确、更及时、更深入。
垂直搜索可以从多个角度入手,例如IR、NLP或者数据库等等。就数据库角度而言,我们通常认为垂直搜索技术是在某一个具体领域上Deep Web数据集...查看全文
Permalink
10.30.07
Posted in Java, JobTong at 13:34 由 仲远
标签:
Java,
JDBC,
JobTong,
内存溢出,
数据库连接,
释放资源
前几天做Jobtong的地点规范化工作,发现运行程序后一段时间居然出现 out of memory ! 这让我惊诧不已,1.5G的内存,跑这样的一个小程序居然就内存溢出了?于是随即check了一下代码,发现是写程序的时候图方便,直接建立了一个conn之后就一直使用,没有任何释放过程,Statement使用完之后也没有释放资源。这样当数据查询一多之后,内存需求不断增加,原来用完的资源又没有...查看全文
Permalink