浅析百度分词技术与google词干技术

来源:营销策划 时间:2011-03-30 11:31 字体:[ ] 收藏 我要投稿

  做seo的都知道google的词干技术和百度的分词技术,关于他的细心解释百度一下或google一下可以找到很多,在此也不加赘言,今天主要说一下怎么可以看出google的词干技术和百的分词技术。本人只是按自己的一些小经验,希望大家能更好的理解词干技术和分词技术的区别,在以后针对性优化时有点帮助。相信seoer都用过google管理员工具的,以本人的博客为例,看下图:

google 营销策划之图说百度分词技术与google词干技术

  你会看见google管理员工具后台列出的一些搜索的关键词,你会发现有个“撕”字搜索量比较大,而实际上我的博客上与这个字相关的只有“苹果不撕皮儿”这个词的,而他不是把这个认为成一个词,而是一个句子的组成部分,其实google已经有不少进步了,刚进入中国市场是笑话更多,现在从上图可以看出他可以大概的分清楚词组,但是还是有少量的会分不清楚,比如:苹果不撕皮儿,用的人少,他就糊涂了,相比来说对于英文页面来说google的准确性更高,前几天在挺小小老师讲课事知道一个隐性语义搜索,有时间大家可以琢磨一下。

  下面来看一下百度的分词技术,还是来实验一下,在百度里面搜索:苹果不撕皮儿,点击我的博客的百度快照,如下图:

pg1 营销策划之图说百度分词技术与google词干技术

  他会把这个词当作一个词来匹配,在快照上有标注,然后再在百度里面搜索:苹果撕皮儿,看下图

pg2 营销策划之图说百度分词技术与google词干技术

  百度会把这一个不完整的词自动匹配,而且在快照中以不同颜色标注出来,,他会在整个页面搜索相匹配的词,相关性最高的页面他会给更高的权重,因此具有一定的排名优势。相比可以得出,百度的分词技术更适合中国的搜索习惯,但是google的技术更新比较快,如果隐性语义搜索成熟后,应该更适合人们搜索,但是个人以为需要一个比较大型的搜索习惯的数据库才能完成这样的任务,所以短时间估计不会应用,但愿尽快吧。

  文章作者:苹果不撕皮儿本文地址:http://www.28sem.com/blog/rumen/1281.html版权所有 © 转载时必须以链接形式注明作者和原始出处!

(责任编辑:中文站长) 本文仅代表作者与中文站长无关。
顶一下
(0)
0%
踩一下
(0)
0%
中文站长投稿必读,作为站长的你,也可以成为写手 10秒注册会员 站长杂谈,最火爆信息交流
相关阅读
最新评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
用户名:

热门阅读

图文排行

推荐阅读

论坛热贴