百度中文分詞技術(shù)的一點小猜測
來源:SEO優(yōu)化 2012-06-28
大家都知道,百度的中文分詞技術(shù)比GOOGLE做的好,以下引用網(wǎng)絡上找到的一張圖片說明:
從上圖可以推斷出,百度遇到一個關(guān)鍵字,應該是先不進行分詞,而是先檢索百度百科的詞條和百度指數(shù)有指數(shù)的中文詞進行匹配,無法精確匹配的話,再進行分詞,前兩年在百度搜索關(guān)鍵字“利川新聞網(wǎng)”時,被分為利川/新聞/網(wǎng),自從這個關(guān)鍵字有指數(shù)以后,百度會把它當做一個完整的關(guān)鍵詞
當然,百度的分詞技術(shù)肯定比我個人推斷出來的要復雜的多,作為百度旗下的產(chǎn)品,百度不會放棄自己的資源,肯定會參考百度百科的詞條作為分詞算法的一部分,所以同樣做搜索的騰訊搜搜也開發(fā)了自己的百科,但是我們以后在做SEO的時候,遇到比較偏的長尾關(guān)鍵詞不能被正確分詞的情況下,可以在百度百科創(chuàng)建一個詞條,然后在參考資料里加上自己的鏈接,這樣還可以解決百度相關(guān)產(chǎn)品權(quán)重比我們的網(wǎng)站高的問題
本文由利川在線原創(chuàng),A5平臺首發(fā),轉(zhuǎn)載請注明出處,本文來源網(wǎng)址:
文章編輯: 365webcall網(wǎng)頁客服軟件(www.365webcall.com)
我的評論
登錄賬號: | 密碼: | 快速注冊 | 找回密碼 |