中國(guó)企業(yè)做網(wǎng)站SEO主要看重百度排名,而網(wǎng)站關(guān)鍵詞質(zhì)量的好壞是影響百度排名的重要因素,如果你對(duì)百度搜索引擎分詞技術(shù)有一定理解,那么對(duì)你做有關(guān)提升關(guān)鍵詞排名的工作將會(huì)變得簡(jiǎn)單得多。作者:高輝,seo網(wǎng)站優(yōu)化師,網(wǎng)站建設(shè)高手,sem運(yùn)營(yíng)高手,電話13518219792【同微信】http://m.rwnh.cn
專注于為中小企業(yè)提供網(wǎng)站制作、做網(wǎng)站服務(wù),電腦端+手機(jī)端+微信端的三站合一,更高效的管理,為中小企業(yè)懷仁免費(fèi)做網(wǎng)站提供優(yōu)質(zhì)的服務(wù)。我們立足成都,凝聚了一批互聯(lián)網(wǎng)行業(yè)人才,有力地推動(dòng)了近1000家企業(yè)的穩(wěn)健成長(zhǎng),幫助中小企業(yè)通過(guò)網(wǎng)站建設(shè)實(shí)現(xiàn)規(guī)模擴(kuò)充和轉(zhuǎn)變。
分詞技術(shù):什么是分詞, 如何分詞搜索引擎會(huì)承認(rèn),這是一位朋友提的問(wèn)題,想必大家也聽(tīng)說(shuō)過(guò),很好奇,什么是分詞技術(shù),什么又是百度分詞呢?分詞大家容易理解。就是一段詞用字符分開(kāi),比如標(biāo)點(diǎn)符號(hào),空格等。
那什么叫分詞技術(shù)呢?分詞技術(shù)就是SEO針對(duì)用戶提交查詢的關(guān)鍵串進(jìn)行的查詢處理后根據(jù)用戶的關(guān)鍵詞串用各種匹配方法進(jìn)行的一種技術(shù)。大家好好理解。那么我們要理解分詞技術(shù)先要理解一個(gè)概念。那就是查詢處理,當(dāng)用戶向搜索引擎提交查詢后,搜索引擎接收到用戶的信息要做一系列的處理。
首先是到數(shù)據(jù)庫(kù)里面索引相關(guān)的信息,這就是查詢處理,那么查詢處理又是如何工作的呢?很簡(jiǎn)單,把用戶提交的字符串沒(méi)有超過(guò)3個(gè)的中文字,就會(huì)直接到數(shù)據(jù)庫(kù)索引詞匯。超過(guò)4個(gè)中文字的,首先用分隔符比如空格,標(biāo)點(diǎn)符號(hào),將查詢串分割成若干子查詢串。舉個(gè)例子。“什么是百度分詞技術(shù)” 我們就會(huì)把這個(gè)詞分割成“ 什么是,百度,分詞技術(shù)。”這種分詞方法叫做反向匹配法。
然后再看用戶提供的這個(gè)詞有沒(méi)有重復(fù)詞匯。如果有的話,會(huì)丟棄掉,默認(rèn)為一個(gè)詞匯。接下來(lái)檢查用戶提交的字符串,有沒(méi)有字母和數(shù)字。如果有的話,就把字母和數(shù)字認(rèn)為一個(gè)詞。好了,這就是SEO的查詢處理。
講了查詢處理后,大家對(duì)分詞技術(shù),尤其是中文分詞技術(shù)有了一個(gè)基本的了解。其實(shí)我講的都是搜索引擎的原理。好了,我接下來(lái)講分詞的原理。我們用百度來(lái)舉例,百度是如何來(lái)分詞的呢?分詞技術(shù)現(xiàn)今非常成熟了。他分為3種技術(shù)。
1.字符串匹配的分詞方法
2.詞義分詞法。
3.統(tǒng)計(jì)分詞法。
一、字符串匹配的分詞方法(分三種)
1.正向最大匹配法
什么意思呢?就是把一個(gè)詞從左至右來(lái)分詞。舉個(gè)例子,“不知道你在說(shuō)什么”這句話采用正向最大匹配法是如何分的呢?“不知道,你,在,說(shuō)什么”與正向最大匹配法相對(duì)應(yīng)的是反向最大匹配發(fā)。這是第二種分詞方法。
2. 反向最大匹配法
上面我舉的例子是如何分的呢 "不知道你在說(shuō)什么"。反向最大匹配法來(lái)分上面這段是如何分的。“不,知道,你在,說(shuō),什么”,這個(gè)就分的比較多了,反向最大匹配法就是從右至左。
3.就是最短路徑分詞法
這個(gè)怎么理解呢 ,就是說(shuō)我一段話里面要求切出的詞數(shù)是最少的。還是上面那句話“不知道你在說(shuō)什么”最短路徑分詞法網(wǎng)站開(kāi)發(fā)就是指,我把上面那句話分成的詞要是最少的。不知道,你在,說(shuō)什么,這就是最短路徑分詞法,分出來(lái)就只有3個(gè)詞了 。好了,當(dāng)然還有上面三種可以相互結(jié)合組成一些分詞方法。比如正向最大匹配法和反向最大匹配法組合起來(lái)就可以叫做雙向最大匹配法。
二、詞義分詞法
這種其實(shí)就是一種機(jī)器語(yǔ)音判斷的分詞方法。很簡(jiǎn)單,進(jìn)行句法、語(yǔ)義分析,利用網(wǎng)站優(yōu)化句法信息和語(yǔ)義信息來(lái)處理歧義現(xiàn)象來(lái)分詞,這種分詞方法,現(xiàn)在還不成熟。處在測(cè)試階段。
三、統(tǒng)計(jì)的分詞方法
這個(gè)很簡(jiǎn)單,就是根據(jù)詞組的統(tǒng)計(jì),就會(huì)發(fā)現(xiàn)兩個(gè)相鄰的字出現(xiàn)的頻率最多,那么這個(gè)詞就很重要。就可以作為用戶提供字符串中的分隔符。這樣來(lái)分詞。比如,“我的,你的,許多的,這里,哪里,那里”。等等,這些詞出現(xiàn)的比較多,就從這些詞里面分開(kāi)來(lái)。
文章標(biāo)題:SEO網(wǎng)站優(yōu)化:了解百度分詞技術(shù),提升網(wǎng)站排名!
標(biāo)題網(wǎng)址:http://m.rwnh.cn/article43/dghidhs.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站建設(shè)、外貿(mào)網(wǎng)站建設(shè)、關(guān)鍵詞優(yōu)化、網(wǎng)站導(dǎo)航、Google、小程序開(kāi)發(fā)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容