實(shí)戰(zhàn)人網(wǎng)(shizhanren.com) 前方高能——本篇文章是攻城獅們根據(jù)日常收到的case整理而來,親自編寫,希望站長親們給個(gè)好評哦!
平臺攻城獅近日接到了百度內(nèi)部用戶的反饋,說lvshi.baidu.com站點(diǎn)的收錄情況比較差,希望協(xié)助追查原因。
攻城獅追查的過程如下:
首先通過site語法檢索,發(fā)現(xiàn)收錄量確實(shí)比較少,只有11條,而且還發(fā)現(xiàn)一部分是死鏈數(shù)據(jù)。
![]()
然后根據(jù)用戶反饋的部分url,檢測發(fā)現(xiàn)這批鏈接在2016年12月26日當(dāng)天已經(jīng)就已經(jīng)抓取回來了,首次抓取上是沒有問題;
緊接著發(fā)現(xiàn)這批網(wǎng)頁都被百度爬蟲判定為空短頁面,從網(wǎng)頁庫中獲取當(dāng)時(shí)的抓取頁面,檢查發(fā)現(xiàn)這些頁面抓取回來的內(nèi)容是一樣的,都是提示讓輸入邀請碼。
![]()
被百度爬蟲判斷為空短頁面,肯定是不能被百度搜索收錄的。
有站長可能會問,那等網(wǎng)站全部開放后,是不是就可以收錄了呢?對于百度爬蟲來說,當(dāng)對一個(gè)網(wǎng)站抓取后發(fā)現(xiàn)大面積都是低值的空短頁面時(shí),爬蟲會認(rèn)為這個(gè)站點(diǎn)的整體價(jià)值比較低,那么在后面的抓取流量分布上會降低,導(dǎo)致針對該站點(diǎn)的頁面更新會比較慢,進(jìn)而收錄也會比較慢。這里學(xué)院君再次強(qiáng)調(diào)一下,不要讓爬蟲給站點(diǎn)畫上不優(yōu)質(zhì)的標(biāo)簽哦,后果很嚴(yán)重!
那么該如何避免呢?方法其實(shí)比較簡單,網(wǎng)站在邀請測試階段使用robots封禁就可以。
|
- 07-19[網(wǎng)站運(yùn)營] 網(wǎng)站運(yùn)營,如何做好網(wǎng)站體驗(yàn)優(yōu)化
- 05-22[網(wǎng)站運(yùn)營] 網(wǎng)站分析如何做?
- 03-21[網(wǎng)站運(yùn)營] [媒體人的一天]新華網(wǎng)李洪雷:網(wǎng)站
- 03-16[人物訪談] 訪談李勇:SEO博客兩個(gè)多月快速提
- 02-06[人物訪談] SEO訪談:初入SEO的苦與樂!seo有沒有
- 02-04[自媒體] 內(nèi)容創(chuàng)業(yè)時(shí)代來臨:機(jī)會、趨勢、
- 01-13[網(wǎng)站運(yùn)營] 網(wǎng)站運(yùn)營推廣成功的三大核心問題
- 01-10[自媒體] 內(nèi)容創(chuàng)業(yè):前景光明還是黑暗?
- 03-16[網(wǎng)站運(yùn)營] 網(wǎng)站運(yùn)營之變局-內(nèi)容為王的時(shí)代已