今天这篇文章主要讲一下:百度google分词的技术也叫(关键字分词技术)
首先我们要做的是确定自己的主要关键字!就拿"人才网""人才网络"为关键字比喻吧!如果大家对搜索的分词没有进行研究的话大家也许看不出其中的区别,但是大家如果放到百度里面搜索一下就可以看出里面的问题了,百度对"人才网""人才网络"两个词分词分出来的结果是不一样的,这个是因为百度有自己的书库词库,搜索结果大家也就看到了"人才网"当成了一个整体,没有被拆分 而"人才网络"被拆分为"人才"和"网络"两个不同的词,这样的别人在搜索人才网的时候肯定是找不到"人才网络"的页面了。
今天我首先来说一下百度分词的标准分词规则,这里我们就以"中国成立60周年"这个关键字为例:
首先你的正文中第一个出现的是"中国"这个词的话,那么页面上的关键字"中国成立60周年"就会被分成"中国""成立60周年",如果是这样的话,搜索的人只有输入"中国""成立60周年"其中一个才能找到你的网站,如果输入的是中国成立60年的话是找不到你的网站的!这里要注意的一点就是如果你是做"中国成立60周年"这个关键字,那么你是URL就应该出现与这个关键字相匹配的内容,如果关键字在你的URL里面都有的话,那么你的收录就会比没有关键字匹配更有优势!
我在说一下关键字没有完全匹配的情况下的问题,如"中国成立60周年",这个关键字以分词的形式出现在两个页面里,
页面A只正文中第一次出现的现分词是"中国",这个页面一次也没有出现"成立60周年"这个分词。
页面B则出现"中国""成立60周年"这2个分词,正文中第一次出现的现分词是"成立60周年"。虽然页面B是在关键词完全匹配的情况下的,但是A页面还是会排在B页面的前面,这里我就是要提醒大家关键词前半部分的重要性。