網站改版、換域名在互聯網飛速發展的狀況下是不可避免的,但處理不妥,會造成嚴重的流量丟失。改版、換域名需要考慮的第一要點就是怎么確保老用戶不丟失,當用戶拜訪舊內容時,能引導用戶到新網站上對應的內容,避免呈現用戶拜訪不到以前收藏的網頁的狀況。
咱們主張在改版或者換域名時,將舊網頁301永久重定向到內容對應的新網頁,這樣百度更容易發現這個轉變,并迅速的將舊網頁積累的權值傳遞給對應的新網頁。
其他主張:
• 如非必要,不要做整站內容的徹底替換
網站改版或者網站內重要頁面鏈接發作變化時,應該將改版前的頁面301永久重定向到改版后的對應的頁面
• 網站替換域名,應該將舊域名的一切頁面301永久重定向到新域名上對應的頁面
網站替換域名后,保持舊域名能安穩拜訪盡可能長的時刻,給用戶多一些時刻回憶新域名
• 網站改版/替換域名后,請把新的URL/新域名下的URL,經過sitemap提交給百度,協助百度更快發現和作出調整。
合理的回來碼
百度爬蟲在進行抓取和處理時,是依據http協議標準來設置相應的邏輯的,所以請站長們也盡量參閱http協議中關于回來碼的意義的界說來進行設置。
百度spider對常用的http回來碼的處理邏輯是這樣的:
• 404
404回來碼的意義是“NOT FOUND”,百度會以為網頁現已失效,那么一般會從查找成果中刪除,并且短期內spider再次發現這條url也不會抓取。
• 503
503回來碼的意義是“Service Unavailable”,百度會以為該網頁臨時不可拜訪,一般網站臨時封閉,帶寬有限等會產生這種狀況。關于網頁回來503,百度spider不會把這條url直接刪除,短期內會再拜訪。屆時假如網頁已恢復,則正常抓取;假如繼續回來503,短期內還會反復拜訪幾回。可是假如網頁長時刻回來503,那么這個url仍會被百度以為是失效鏈接,從查找成果中刪除。
• 403
403回來碼的意義是“Forbidden”,百度會以為網頁當時禁止拜訪。關于這種狀況,假如是新發現的url,百度spider暫不會抓取,短期內會再次查看;假如是百度已收錄url,當時也不會直接刪除,短期內相同會再拜訪。屆時假如網頁答應拜訪,則正常抓取;假如仍不答應拜訪,短期內還會反復拜訪幾回。可是假如網頁長時刻回來403,百度也會以為是失效鏈接,從查找成果中刪除。
• 301
301回來碼的意義是“Moved Permanently”,百度會以為網頁當時跳轉至新url。當遇到站點遷移,域名替換、站點改版的狀況時,引薦運用301回來碼,盡量削減改版帶來的流量丟失。盡管百度spider現在對301跳轉的響應周期較長,但咱們仍是引薦咱們這么做。
咱們主張:
• 假如站點臨時封閉,當網頁不能打開時,不要立即回來404,主張運用503狀態。503能夠奉告百度spider該頁面臨時不可拜訪,請過段時刻再重試。
• 假如百度spider對您的站點抓取壓力過大,請盡量不要運用404,相同主張回來503。這樣百度spider會過段時刻再來測驗抓取這個鏈接,假如那個時刻站點閑暇,那它就會被成功抓取了。
• 有一些網站希望百度只收錄部分內容,例如審閱后的內容,累積一段時刻的新用戶頁等等。在這種狀況,主張新發內容暫時回來403,等審閱或做好處理之后,再回來正常狀態的回來碼。
• 站點遷移,或域名替換時,請運用301回來。
良好排序
涵蓋網頁上首要內容的title
網頁的title用于告訴用戶和查找引擎這個網頁的首要內容是什么,查找引擎在判斷一個網頁內容權重時,title是首要參閱信息之一。網頁title是網頁上首要內容的概括,查找引擎能夠經過網頁標題迅速的判斷網頁的主題。每個網頁的內容都是不同的,每個網頁都應該有絕無僅有的title。
咱們主張網頁標題能夠這樣描繪:
• 首頁:網站稱號 或者 網站稱號_供給服務介紹or產品介紹
• 頻道頁:頻道稱號_網站稱號
• 文章頁:文章title_頻道稱號_網站稱號
title指html文檔中的標簽,而非文章的標題,以下面的形式放在html文檔的標簽中
引薦做法
• 每個網頁應該有一個絕無僅有的標題,切忌一切的頁面都運用默認標題
• 標題要主題明確,包含這個網頁中最重要的內容
• 簡明精練,不羅列與網頁內容不相關的信息
• 用戶閱讀一般是從左到右的,重要的內容應該放到title的靠前的位置
• 運用用戶所熟知的言語描繪。假如你有中、英文兩種網站稱號,盡量運用用戶熟知的那一種做為標題描繪
良好的內容建設