看了很多文章,都是關于服務器日志的,似乎沒有定論。經過我對服務器日志的分析和了解,做一下結論:
1、服務器返回200 0 0 ,代表著baiduspider對服務器進行了請求,得到了回應,抓取了新的數據。此種情況下,搜索引擎的處理流程是,如果是新發布的文章內容,百度抓取并放出的可能性大于70%。如果是很早之前發布的文章,一般不會抓取以后馬上就釋放,一般到大更新,或者是進行數據對比,確定不是垃圾內容以后,再進行釋放。
2、服務器返回200 0 64 ,很多人認為這是被百度K掉的前兆。也有不少SEOer站出來解釋,這種情況未必是K站,一般有三種解釋。
目前,對于 200 0 64 的觀點大致分為以下幾種:
會話故障,請求不可到達,并非百度封站征兆
百度封站、“撥毛”或放入沙盒
64位操作系統
樂思蜀參考了大量相關文章,雖未得出最終結論,但覺得第一種觀點最合理,現分析如下。
首先來看 200 0 64 狀態碼的構成
200 0 64:sc-status(協議狀態) sc-substatus(協議子狀態) sc-win32-status(Win32狀態碼)
sc-status(協議狀態):200 連接成功
sc-win32-status(Win32狀態碼):64 指定的網絡名不再可用
以上內容摘自樂思蜀博客空間
以上三種解釋都有合理之處,不過經過我對服務器日志的分析,研究如下:
出現200 0 64代碼,一般情況下,代表著baiduspider曾經在此路徑下抓取過內容。通過對比,搜索引擎認為該網頁沒有必要再重新進行抓取。這路徑下的頁面,有可能之前已經抓取過,但是未釋放,也有可能是抓取過,已經釋放。
通常情況下,我們可以通過服務器日志的分析,列出200 0 64的頁面,對此類頁面,進行簡單的改動或者是處理,這樣的話,應該可以引起搜索引擎的觸發,重新對頁面進行收錄,可能會當時釋放。
已經被收錄的頁面產生64代碼,應該是百度記錄此頁面被用戶頻繁訪問或者是通過搜索引擎得到搜索結果后點擊網站,造成baiduspider跟蹤用戶行為,對頁面進行重新訪問。
所以,我們可以針對服務器日志,開發一個適合seo的服務器日志分析工具,通過此工具,可以真實記錄蜘蛛或機器人的訪問,并對訪問返回的結果進行分析??梢酝ㄟ^分析,得到如何讓更多的頁面讓蜘蛛抓取并獲得良好排名的方案。
另外通過日志分析工具,從引申的角度講,可以制作一個蜘蛛誘餌,主動引導baiduspider進行爬行和抓取,并獲得良好的排名。我說的可不只是網站地圖。
原文連接:
申請創業報道,分享創業好點子。點擊此處,共同探討創業新機遇!