中文字幕日韩精品一区二区免费_精品一区二区三区国产精品无卡在_国精品无码专区一区二区三区_国产αv三级中文在线

搜索引擎抓取的邏輯

2013-10-26    分類: 網(wǎng)站建設(shè)

  做網(wǎng)站SEO優(yōu)化,網(wǎng)頁內(nèi)容要想被搜索引擎收錄,這個(gè)過程就需要通過搜索引擎蜘蛛來爬取來實(shí)現(xiàn),你的內(nèi)容首先要被搜索引擎發(fā)現(xiàn),才能夠判斷質(zhì)量是否優(yōu)質(zhì)達(dá)到收錄要求。

搜索引擎抓取的邏輯

  什么是搜索引擎蜘蛛抓取份額?

  顧名思義,抓取份額是搜索引擎蜘蛛花在一個(gè)網(wǎng)站上的抓取頁面的總的時(shí)間上限。對于特定網(wǎng)站,搜索引擎蜘蛛花在這個(gè)網(wǎng)站上的總時(shí)間是相對固定的,不會無限制地抓取網(wǎng)站所有頁面。

  抓取份額的英文Google用的是crawl budget,直譯是爬行預(yù)算,我覺得不太能說明是什么意思,所以用抓取份額表達(dá)這個(gè)概念。

  抓取份額是由什么決定的呢?這牽扯到抓取需求和抓取速度限制。

  抓取需求:

  抓取需求,crawl demand,指的是搜索引擎“想”抓取特定網(wǎng)站多少頁面。

  決定抓取需求的主要有兩個(gè)因素。一是頁面權(quán)重,網(wǎng)站上有多少頁面達(dá)到了基本頁面權(quán)重,搜索引擎就想抓取多少頁面。二是索引庫里頁面是否太久沒更新了。說到底還是頁面權(quán)重,權(quán)重高的頁面就不會太久不更新。

  頁面權(quán)重和網(wǎng)站權(quán)重又是息息相關(guān)的,提高網(wǎng)站權(quán)重,就能使搜索引擎愿意多抓取頁面。

  抓取速度限制:

  搜索引擎蜘蛛不會為了抓取更多頁面,把人家網(wǎng)站服務(wù)器拖垮,所以對某個(gè)網(wǎng)站都會設(shè)定一個(gè)抓取速度的上限,crawl rate limit,也就是服務(wù)器能承受的上限,在這個(gè)速度限制內(nèi),蜘蛛抓取不會拖慢服務(wù)器、影響用戶訪問。

  服務(wù)器反應(yīng)速度夠快,這個(gè)速度限制就上調(diào)一點(diǎn),抓取加快,服務(wù)器反應(yīng)速度下降,速度限制跟著下降,抓取減慢,甚至停止抓取。

  所以,抓取速度限制是搜索引擎“能”抓取的頁面數(shù)。

  那么,抓取份額是由什么決定的?

  抓取份額是考慮抓取需求和抓取速度限制兩者之后的結(jié)果,也就是搜索引擎“想”抓,同時(shí)又“能”抓的頁面數(shù)。

  網(wǎng)站權(quán)重高,頁面內(nèi)容質(zhì)量高,頁面夠多,服務(wù)器速度夠快,抓取份額就大。

  小網(wǎng)站沒必要擔(dān)心抓取份額

  小網(wǎng)站頁面數(shù)少,即使網(wǎng)站權(quán)重再低,服務(wù)器再慢,每天搜索引擎蜘蛛抓取的再少,通常至少也能抓個(gè)幾百頁,十幾天怎么也全站抓取一遍了,所以幾千個(gè)頁面的網(wǎng)站根本不用擔(dān)心抓取份額的事。數(shù)萬個(gè)頁面的網(wǎng)站一般也不是什么大事。每天幾百個(gè)訪問要是能拖慢服務(wù)器,SEO就不是主要需要考慮的事了。

  大中型網(wǎng)站可能需要考慮抓取份額

  幾十萬頁以上的大中型網(wǎng)站,可能要考慮抓取份額夠不夠的問題。

  抓取份額不夠,比如網(wǎng)站有1千萬頁面,搜索引擎每天只能抓幾萬個(gè)頁面,那么把網(wǎng)站抓一遍可能需要幾個(gè)月,甚至一年,也可能意味著一些重要頁面沒辦法被抓取,所以也就沒排名,或者重要頁面不能及時(shí)被更新。

  要想網(wǎng)站頁面被及時(shí)、充分抓取,首先要保證服務(wù)器夠快,頁面夠小。如果網(wǎng)站有海量高質(zhì)量數(shù)據(jù),抓取份額將受限于抓取速度,提高頁面速度直接提高抓取速度限制,因而提高抓取份額。

  SEO優(yōu)化人員可以通過設(shè)置robots文件來禁止不允許抓取的地方,節(jié)省抓取份額。

網(wǎng)頁名稱:搜索引擎抓取的邏輯
文章分享:http://m.rwnh.cn/news/4087.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供企業(yè)網(wǎng)站制作企業(yè)建站、手機(jī)網(wǎng)站建設(shè)、小程序開發(fā)、建站公司全網(wǎng)營銷推廣

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

商城網(wǎng)站建設(shè)
东平县| 昂仁县| 古田县| 嵊州市| 万州区| 张家界市| 嵊泗县| 玉林市| 会东县| 宁乡县| 白沙| 六枝特区| 德州市| 尼玛县| 谢通门县| 乌鲁木齐县| 唐山市| 同心县| 兖州市| 都江堰市| 固始县| 沁水县| 富顺县| 许昌市| 内丘县| 广元市| 衡南县| 商洛市| 乌鲁木齐市| 大兴区| 获嘉县| 湖口县| 廊坊市| 达拉特旗| 商洛市| 慈溪市| 蒙城县| 毕节市| 抚宁县| 尖扎县| 咸丰县|