最近在網(wǎng)上看了篇有關百度蜘蛛的爬行代碼的解釋,發(fā)現(xiàn)和現(xiàn)在的爬行有些改變,已至于開始時看我的www.jianzhanzhe.com這個站的日志看不懂是什么意思,經(jīng)過多次研究終于明白其中,所以今重新整理解釋如下:
做seo的朋友都知道,研究se爬行規(guī)律對于網(wǎng)站優(yōu)化意義重大,特別是對百度蜘蛛Baiduspider的研究。本文解釋一下百度蜘蛛爬行后返回代碼代表的具體含義:
2xx 成功
200 正常;請求已完成。
201 正常;緊接 POST 命令。
202 正常;已接受用于處理,但處理尚未完成。
203 正常;部分信息 — 返回的信息只是一部分。
204 正常;無響應 — 已接收請求,但不存在要回送的信息。
3xx 重定向
301 已移動 — 請求的數(shù)據(jù)具有新的位置且更改是永久的。
302 已找到 — 請求的數(shù)據(jù)臨時具有不同 URI。
303 請參閱其它 — 可在另一 URI 下找到對請求的響應,且應使用 GET 方法檢索此響應。
304 未修改 — 未按預期修改文檔。
305 使用代理 — 必須通過位置字段中提供的代理來訪問請求的資源。
306 未使用 — 不再使用;保留此代碼以便將來使用。
4xx 客戶機中出現(xiàn)的錯誤
400 錯誤請求 — 請求中有語法問題,或不能滿足請求。
401 未授權 — 未授權客戶機訪問數(shù)據(jù)。
402 需要付款 — 表示計費系統(tǒng)已有效。
403 禁止 — 即使有授權也不需要訪問。
404 找不到 — 服務器找不到給定的資源;文檔不存在。
407 代理認證請求 — 客戶機首先必須使用代理認證自身。
410 請求的網(wǎng)頁不存在(永久);
415 介質(zhì)類型不受支持 — 服務器拒絕服務請求,因為不支持請求實體的格式。
5xx 服務器中出現(xiàn)的錯誤
500 內(nèi)部錯誤 — 因為意外情況,服務器不能完成請求。
501 未執(zhí)行 — 服務器不支持請求的工具。
502 錯誤網(wǎng)關 — 服務器接收到來自上游服務器的無效響應。
503 無法獲得服務 — 由于臨時過載或維護,服務器無法處理請求。
比如說:
2008-05-10 00:28:03 W3SVC818374 222.214.218.36 GET /flash/1622.html - 80 - 221.10.254.26 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 0 21089
如果你的域名是www.jianzhanzhe.com,這就意味著百度蜘蛛在2008-05-10 00:28:03 爬過http://www.jianzhanzhe.com/flash/1622.html 這一頁,200 0 0 21089中的200協(xié)議代碼代表了請求已完成也就是它發(fā)現(xiàn)這頁并以入庫了。根據(jù)這個我們可以多查看iis日志,研究蜘蛛爬行的路徑,找出自己網(wǎng)站存在的問題,進而改正。
做seo的朋友都知道,研究se爬行規(guī)律對于網(wǎng)站優(yōu)化意義重大,特別是對百度蜘蛛Baiduspider的研究。本文解釋一下百度蜘蛛爬行后返回代碼代表的具體含義:
2xx 成功
200 正常;請求已完成。
201 正常;緊接 POST 命令。
202 正常;已接受用于處理,但處理尚未完成。
203 正常;部分信息 — 返回的信息只是一部分。
204 正常;無響應 — 已接收請求,但不存在要回送的信息。
3xx 重定向
301 已移動 — 請求的數(shù)據(jù)具有新的位置且更改是永久的。
302 已找到 — 請求的數(shù)據(jù)臨時具有不同 URI。
303 請參閱其它 — 可在另一 URI 下找到對請求的響應,且應使用 GET 方法檢索此響應。
304 未修改 — 未按預期修改文檔。
305 使用代理 — 必須通過位置字段中提供的代理來訪問請求的資源。
306 未使用 — 不再使用;保留此代碼以便將來使用。
4xx 客戶機中出現(xiàn)的錯誤
400 錯誤請求 — 請求中有語法問題,或不能滿足請求。
401 未授權 — 未授權客戶機訪問數(shù)據(jù)。
402 需要付款 — 表示計費系統(tǒng)已有效。
403 禁止 — 即使有授權也不需要訪問。
404 找不到 — 服務器找不到給定的資源;文檔不存在。
407 代理認證請求 — 客戶機首先必須使用代理認證自身。
410 請求的網(wǎng)頁不存在(永久);
415 介質(zhì)類型不受支持 — 服務器拒絕服務請求,因為不支持請求實體的格式。
5xx 服務器中出現(xiàn)的錯誤
500 內(nèi)部錯誤 — 因為意外情況,服務器不能完成請求。
501 未執(zhí)行 — 服務器不支持請求的工具。
502 錯誤網(wǎng)關 — 服務器接收到來自上游服務器的無效響應。
503 無法獲得服務 — 由于臨時過載或維護,服務器無法處理請求。
比如說:
2008-05-10 00:28:03 W3SVC818374 222.214.218.36 GET /flash/1622.html - 80 - 221.10.254.26 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 0 21089
如果你的域名是www.jianzhanzhe.com,這就意味著百度蜘蛛在2008-05-10 00:28:03 爬過http://www.jianzhanzhe.com/flash/1622.html 這一頁,200 0 0 21089中的200協(xié)議代碼代表了請求已完成也就是它發(fā)現(xiàn)這頁并以入庫了。根據(jù)這個我們可以多查看iis日志,研究蜘蛛爬行的路徑,找出自己網(wǎng)站存在的問題,進而改正。
標簽 :
本站內(nèi)容部分摘錄于互聯(lián)網(wǎng)(注明原創(chuàng)稿件除外),供訪客免費學習需要。如文章或圖像侵犯到您的權益,請及時告知,我們第一時間處理,謝謝!
相關新聞
猜您喜歡
熱門推薦
更多新聞-
2025年01月23日
放假通知:2025年靈蛇之珠耀新年 歲月傳承譜新篇!
閱讀 625查看詳情 -
簽約
2025年08月01日
簽約杭州科技公司2025年網(wǎng)站建設項目
閱讀 241查看詳情 -
新華網(wǎng)
2025年08月20日
簽約新華網(wǎng)2025數(shù)字賦能網(wǎng)站建設項目
閱讀 292查看詳情 -
2024年07月12日
原創(chuàng)設計網(wǎng)站和模板型網(wǎng)站有什么不同
閱讀 1122查看詳情 -
軟文
2025年04月22日
軟文營銷和新聞發(fā)稿全網(wǎng)曝光 ,快速提升品牌推廣效果
閱讀 413查看詳情 -
2024年07月11日
網(wǎng)站域名SSL是什么意思?有必要申請嗎?
閱讀 1011查看詳情 -
2024年07月10日
穩(wěn)定的美國服務器和虛擬主機推薦
閱讀 1097查看詳情 -
2024年01月01日
2024年龍年元旦,祝福新老客戶財源廣進
閱讀 33264查看詳情