百度中文分詞技術(shù)的一點小猜測

來源:SEO優(yōu)化 2012-06-28

快速提升網(wǎng)站銷量，使用365webcall免費在線客服

大家都知道,百度的中文分詞技術(shù)比GOOGLE做的好,以下引用網(wǎng)絡上找到的一張圖片說明:

從上圖可以推斷出,百度遇到一個關(guān)鍵字,應該是先不進行分詞,而是先檢索百度百科的詞條和百度指數(shù)有指數(shù)的中文詞進行匹配,無法精確匹配的話,再進行分詞,前兩年在百度搜索關(guān)鍵字“利川新聞網(wǎng)”時,被分為利川/新聞/網(wǎng),自從這個關(guān)鍵字有指數(shù)以后,百度會把它當做一個完整的關(guān)鍵詞

當然,百度的分詞技術(shù)肯定比我個人推斷出來的要復雜的多,作為百度旗下的產(chǎn)品,百度不會放棄自己的資源,肯定會參考百度百科的詞條作為分詞算法的一部分,所以同樣做搜索的騰訊搜搜也開發(fā)了自己的百科,但是我們以后在做SEO的時候,遇到比較偏的長尾關(guān)鍵詞不能被正確分詞的情況下,可以在百度百科創(chuàng)建一個詞條,然后在參考資料里加上自己的鏈接,這樣還可以解決百度相關(guān)產(chǎn)品權(quán)重比我們的網(wǎng)站高的問題

本文由利川在線原創(chuàng),A5平臺首發(fā),轉(zhuǎn)載請注明出處,本文來源網(wǎng)址:

文章編輯: 365webcall網(wǎng)頁客服軟件(www.365webcall.com)

我的評論

登錄賬號：

密碼：

快速注冊 | 找回密碼

編輯推薦

使用條款 | 隱私聲明 | 反饋 | 用戶幫助中心

研發(fā)中心地址：浙江省杭州市西湖區(qū)古墩路673號瑞博國際A座6樓浙ICP備2020045446號電話：18757138460

浙公網(wǎng)安備 2020045446號