百度工程師:用生態項目解決原創內容的排名問題
來源:SEO優化 2012-11-08
站長之家(chinaz.com)10月30日整理:日前,由百度站長平臺和MADcon聯合舉辦的百度站長平臺高端SEO俱樂部沙龍活動圓滿落幕
編輯摘錄了本次沙龍交流的一些熱門問答,內容如下:
一.頁面收錄問題
1、404頁面問題:
Q:當我們由于變更產生404之后,百度會間隔多長時間識別出來?并且需要識別幾次才會將其刪除?對有些尚未做好的專題頁面,可能會臨時設置為404頁面,之后很快將頁面恢復,但這些專題頁面中有一部分很快就能夠恢復,還有一部分就需要很長時間才可被收錄,因此有重大新聞時,會緊張重大專題被及時收錄的情況
lee(百度網頁搜索團隊工程師):不會有固定的時間,會根據網頁的和所在頻道的更新頻率,去確定刪除的時間,未做好或者非作為死鏈的頁面,盡量不要用404的返回碼,希望盡可能用503的返回碼,這樣spider能夠比較好的去識別
2、時效性問題
Q:目前百度收錄上的時效性對百度和站長來說是雙贏,但對每年定期舉行的重大事件(例金鐘節),在固定時間能否將這種事件的權重或算法進行優化?
lee:這方面如果目前沒有做到的話,搜索團隊會盡可能的去完善這方面的體驗,也會去通過一些工具的形式、協議等簡單的方式,提高這種體驗,去實現頁面的及時更新
Q:對一些新聞,編輯可能后期需要對新聞的標題進行修改,但百度網頁收錄的更新很慢,較長時間無法將頁面進行更新
lee:像網頁換title 理論上應該是要及時去更新,但目前做的還不太到位
3、301跳轉問題的解決情況
lee:百度站長平臺會盡快上線關于301跳轉的工具,并會推出網站改版工具
4、圖片、flash較多,文字內容較少的的頁面的收錄問題:
Q:目前很多頁面可能會沒有很多的文字,比較多圖片和flash,對沒有很多文字的頁面,搜索引擎能很好的將這個頁面中的資源識別出來嗎?
lee:目前在推一個工具,將spider抓取日志展示出,去看下是否符合站長的抓取意愿,且對某些js較多的網站,假設目前收錄不好,可先盡量減少js的使用
5、對一個網站數量較多的同一類型的頁面收錄量達到一定值之后,收錄量就會增加的很緩慢
Q:比如:人人日志,上千萬的數據,用了一年多的時間目前收錄了幾百萬,且大部分內容都是很高質量的,但收錄量到一個值之后,就沒有增加,這個是什么原因?
lee:人人之前有一些頁面比較封閉,這兩年才開始開放,但是spider根據之前的日志分析,對人人網的改動反應偏慢,所以推出了sitemap,希望大家通過sitemap將大家想進行索引的數據進行主動推送
Q:姓名類的產品,通過sitemap提交之后,上千萬的數據還是收錄了700w+,會不會被認為這些頁面是相似的頁面
lee:互聯網資源很多,相似的產品很多,由于資源有限,會盡可能優先選取有價值的頁面去抓取一次提交的頁面量很大,搜索引擎需要一定的時間去收錄,搜索引擎可能會每天設置一定的壓力上線去抓取,避免對站長產生太大的壓力,可以嘗試使用百度站長平臺的抓取壓力調節工具調試自己網站的抓取壓力,增加壓力,我們這邊可以適當提高自己的壓力加快抓取
二、排名和權重問題
Q:nofllow是否會浪費權重
lee:不會
Q:404頁面不去處理的時候,會對網站權重產生影響嗎?
lee:搜索中出現的無結果頁面,是對用戶最大的傷害,這種可能就會被認為該網站內容管理不好
三、站長平臺工具-死鏈工具使用問題
Q:404頁面是不是必須要提交,才可以很好的被刪除目錄下很多垃圾的標簽,做了404設置,但是不清楚被收錄的有多少,能不能把垃圾標簽頁面都導出來
lee:檢測死鏈-spider一條條去訪問,確定是否是死鏈建議大家主動去提交死鏈,站長了解自身網站的情況,可以比較好的進行提交,這個工具是為了彌補系統的問題目前我們也在探討能不能推出比較簡單的工具,幫助站長解決這種問題
注:相關網站建設技巧閱讀請移步到建站教程頻道
1
2
下一頁
收藏本文
文章編輯: 365webcall網頁客服工具(www.365webcall.com)
我的評論
登錄賬號: | 密碼: | 快速注冊 | 找回密碼 | ![]() |