2008-05-31
Posted in 随笔, 实验室, Web Data Management at 23:59 由 仲远 浏览量: 2,939
标签:
Dance,
Google,
seo,
Web Data Management,
实验室,
随笔
虽然大家每日使用Google,看起来没有什么不同,使用起来也没有什么不同。但是其实Google是经常调整她的算法的,据称Google去年一年就调整过450次搜索算法。通过算法一次次的调整,Google不断改进用户体验,同时提供搜索结果的质量。
其中,这个算法的调整,可能伴着Google Dance现象的发生。所谓的Google Dance,就是Google每个月固定调整她的索引库(当然是指她的BigTable),...查看全文
Permalink
2008-05-28
Posted in 实验室, Web Data Management at 22:14 由 仲远 浏览量: 2,539
标签:
Google,
seo,
Web Data Management,
实验室,
搜索引擎,
新网站,
消失
最近在针对搜索引擎做一项实验,于是利用实验室的废弃电脑搭建起来一个测试网站:AntiIndexTest,刚开始数天,实验十分顺利,各个搜索引擎也非常快速的进行收录。正当期望实验取得进一步进展时,学校停电了,实验室也不能幸免。
经过一个晚上的停电,刚开始还未发现任何异常,但是到下午时,突然发现Google不再来爬取网站页面,而整个网站在Google中搜不到任何...查看全文
Permalink
2008-05-27
Posted in 实验室, Web Data Management, JobTong at 20:34 由 仲远 浏览量: 6,823
标签:
JobTong,
Web Data Management,
实验室
当时投NDBC年会文章的时候,只顾着把东西往上写,周围师兄师姐也说"先写上去再说呗,以后删还不容易吗"。于是一不小心就写了7页满满的。这几天接到论文录取通知,要求提交正式论文,并且不能超过7千字,看以往的文章,似乎年会论文一般在5页,于是不得不“操刀自残”,却发现总也下不去手。看看这里也觉得必不可少,看看那里也觉得删掉后语义不连贯。于...查看全文
Permalink
2008-05-25
Posted in PHP at 20:52 由 仲远 浏览量: 6,772
标签:
PHP,
the excerpt,
wordpress,
摘要字数
对于英文文章的WordPress
在wp-includes目录下找到formatting.php,里面有这样一个函数:
function wp_trim_excerpt($text) {
global $post;
if ( " == $text ) {
$text = get_the_content(");
$text = apply_filters('the_content', $text);
$text = str_replace(']]>', ']]>', $text);
$text = strip_tags($text);
...查看全文
Permalink
2008-05-23
Posted in 随笔, 实验室 at 18:43 由 仲远 浏览量: 6,625
标签:
Deep Web Data Integration,
Deep web数据集成,
实验室,
随笔
我们组的头刘博今天进行博士论文答辩,题目是《Deep Web数据集成中关键技术研究》。他在这次报告中主要介绍了他博士期间做的几个题目,包括基于视觉的数据抽取以及实体识别等。刘博今天也第一次打上领带,很精神:)
刘博是个好人啊~想当初刚到实验室,多亏他的帮助与指点,才一步步进入正轨。现在他要走了,他真的要走了。。。那就祝他一路走好吧!
...查看全文
Permalink
2008-05-19
Posted in 实验室 at 23:09 由 仲远 浏览量: 2,832
标签:
四川大地震,
实验室
5月19日14点28分,实验室老师和同学在一层会议室默哀3分钟,向死难同胞致哀,为生者祈福。回首上个礼拜第一次听到四川地震的消息时,那种惊诧沉痛之情犹在心中。在一个礼拜的救援中,有许多人被救了出来,也有许多人从此长眠于地下。为了纪念这些遇难者,国务院将5月19~21日定为全国哀悼日,同时在19日下午2点28分起,全国默哀3分钟。我们实验室也在一楼,为这些...查看全文
Permalink
2008-05-18
Posted in 实验室, Web Data Management at 0:02 由 仲远 浏览量: 3,221
标签:
Baidu,
Google,
Live,
Web Data Management,
Yahoo,
十大,
实验室,
搜索引擎
最近需要针对搜索引擎做一些实验,于是查看了一下全球十大搜索引擎,发现居然还有两家中国搜索引擎公司。呵呵,估计是因为中国网民众多的缘故吧。以下就是comScore在2007年12月发布的2007年全球十大搜索引擎:
名次 公司名称 市场占有率
1 Google 62% (Google在全球范围内的影响力自然不用多说)
2 雅虎 12.8% (老牌门户网站以及搜索引擎公司)
...查看全文
Permalink
2008-05-16
Posted in 实验室, Web Data Management, JobTong at 21:05 由 仲远 浏览量: 4,403
标签:
bookprice,
Deep Web Data Integration,
Guanxi,
JobTong,
Libra,
Web Data Management,
垂直搜索,
实验室,
微软亚洲研究院
昨天的《智能信息检索》课程请的是微软亚洲研究院的聂再清博士来向我们介绍《Object-Level Vertical Search》,这已经是我第二次听聂博士的介绍了。上一次是在参加Yocsef举办的《垂直搜索》时听过他演讲,主题也是“对象级别的垂直搜索”。
目前微软亚洲研究院正在进行的几项研究,包括Libra, Guanxi, Product Search等,都是很有意思的对象级别的垂直搜索。其实对象这个词,...查看全文
Permalink
2008-05-15
Posted in 随笔 at 23:56 由 仲远 浏览量: 6,421
标签:
四川大地震,
随笔
虽然我们所能够做到事情微不足道,但是我们也希望能够为灾区尽一份力。因此班上组织了一次募捐。
之后我们打算把这个捐款直接汇给中国红十字总会。尽我们的绵薄之力。
...
查看全文
Permalink
2008-05-14
Posted in Apache, FreeBSD/Unix服务器 at 20:16 由 仲远 浏览量: 4,194
标签:
301,
302,
Apache,
Freebsd/Unix服务器,
URL转发,
同一网站,
多个域名,
重定向
现在许多域名注册商都会为注册后的域名提供一些增值服务,其中很重要的一项就是url转发功能,包括url隐藏转发和url不隐藏转发。这两者的区别在于url隐藏转发能够在浏览器到地址栏保持用户输入的域名,而不隐藏转发则会显示实际跳转后的域名。这一功能使得同一个网站拥有多个域名的用户方便许多。不过在实际使用中,对于一些重视搜索引擎优化的人需要注意,使用...查看全文
Permalink
Pages (3):
[1] 2 3 »