最近写了一个网页内容的自动抽取器
2009年5月25日 21:39
标签: Deep web数据集成, JobTong, 实验室 and 网页抽取
研究网页抽取的论文很多,但是系统很少。
研究新闻标题和内容的自动抽取的论文也很多,但是实际可用的自动抽取程序也很少。
我们实验室研究Web抽取技术已经很多年,在国内也算处于领先地位。以前虽然也有一些demo系统,但是离实际可用仍然有一些距离。直到后来,我在lincan师兄的带领下,才开始构造网页数据抽取的系统,学名为Deep Web数据集成系统(深层...