2023-03-07 分類: 網(wǎng)站建設(shè)
問題:修改網(wǎng)站的robots.txt是否會(huì)影響蜘蛛爬?。?/p>
回答:通常情況下搜索引擎會(huì)遵守robots文件,如果我們在robots.txt文件里面對某些頁面做了限制,那么搜索引擎蜘蛛是不會(huì)去抓取的,也就是說robots.txt文件會(huì)影響到蜘蛛抓取。對于robots.txt和蜘蛛爬取,有以下兩個(gè)方面的問題大家需要注意。
很多朋友提到明明自己的網(wǎng)站,在robots.txt文件里限制了所有搜索引擎蜘蛛抓取,但是百度還是收錄了首頁。這種情況是正常的,但是大家要注意的是,雖然蜘蛛抓取了頁面,也收錄了,但是百度快照里面是沒有內(nèi)容的,如果我們?nèi)c(diǎn)擊百度快照,會(huì)跳轉(zhuǎn)至百度搜索資源平臺(tái)。也就是說,雖然蜘蛛抓取了,但是并沒有保存頁面文件。
我們在正式開放蜘蛛抓取之前,通常會(huì)設(shè)置robots.txt文件,限制所有搜索引擎蜘蛛抓取。但是有朋友反映,在放開了robots.txt文件限制以后,蜘蛛還是不過來抓取,這其實(shí)就是搜索引擎蜘蛛對robots.txt文件的反應(yīng)需要時(shí)間,這個(gè)時(shí)間通常是一個(gè)星期以內(nèi)。
我們再回到robots.txt和蜘蛛爬取上面來,總體上搜索引擎蜘蛛會(huì)嚴(yán)格遵守robots.txt文件協(xié)議,對于robots.txt文件限制的頁面,蜘蛛不糊去抓取。所有對于那些沒有搜索需求的頁面,我們可以在robots.txt文件里面進(jìn)行設(shè)置,這樣就可以集中抓取頻次和防止權(quán)重分散。當(dāng)然,我們可以把robots.txt文件和nofollow標(biāo)簽結(jié)合起來使用。
另外大家要注意蜘蛛對robots.txt文件的反映時(shí)間,不要因?yàn)閹滋熘┲霙]有來抓取,就懷疑是網(wǎng)站其他地方出現(xiàn)了問題,應(yīng)該耐心等待。
關(guān)于robots.txt和蜘蛛爬取的問題,筆者在本文簡要的給大家做了說明??傊畞碚f,修改網(wǎng)站的robots.txt會(huì)影響蜘蛛爬取,至于是減少抓取量還是增加抓取量,這需要具體分析對robots.txt做了怎樣的修改。另外robots.txt里面還可以設(shè)置網(wǎng)站地圖,這對于網(wǎng)站頁面收錄有幫助。
網(wǎng)頁標(biāo)題:修改網(wǎng)站的ROBOTS.txt是否會(huì)影響蜘蛛爬取
網(wǎng)頁地址:http://m.rwnh.cn/news41/242341.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站建設(shè)、關(guān)鍵詞優(yōu)化、網(wǎng)站制作、網(wǎng)站排名、移動(dòng)網(wǎng)站建設(shè)、企業(yè)網(wǎng)站制作
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容