17+年服務(wù)經(jīng)驗 · 服務(wù)企業(yè)6000+
1對1品牌專家服務(wù) + 出品定稿率高達96% + 客戶服務(wù)滿意度99%
All the services you need are here, Get It.
當(dāng)前位置: 首頁 > 設(shè)計知識 > 企業(yè)官網(wǎng)設(shè)計 > 新站為什么總是收錄過少
我將wordpress 由博客主題換成CMS主題后,發(fā)現(xiàn)文章收錄數(shù)量明顯增加,并由此得出一個結(jié)論:百度不愛搜錄具有博客特征的網(wǎng)頁。由于當(dāng)時考慮不周到,發(fā)表之后,受廣州網(wǎng)站設(shè)計到個別網(wǎng)友批評指正。事實上,博客特征的網(wǎng)頁容易產(chǎn)生重復(fù)內(nèi)容,高度重復(fù)才是引起百度不收錄wordpress的真正原因。經(jīng)過深思熟慮,以及對蜘蛛訪問日志的觀察和分析,我對百度收錄wordpress博客異常的原因得出新的結(jié)論。
1.安裝SEO插件后,百度不收錄頁面。
很多采用wordpress建站的朋友都接觸過All in One SEO這個插件。這個插件可以讓新手一鍵搞定wordpress的站內(nèi)優(yōu)化。事實證明,這款插件對google優(yōu)化非常的完美,但百度卻總?cè)菀壮霈F(xiàn)不收錄的情況。我曾經(jīng)一度懷疑百度會認為All in One SEO 插件存在優(yōu)化過度的問題,從而導(dǎo)致網(wǎng)站降權(quán),不收錄。實際上,All in One SEO 的網(wǎng)頁并沒有被百度降權(quán),導(dǎo)致百度不收錄的罪魁禍首是它的noindex設(shè)置。
noindex標簽的作用是向搜索引擎申明該網(wǎng)頁禁止被搜錄和索引,谷歌蜘蛛爬行到這樣標簽的頁面,會自動丟棄掉該頁并繼續(xù)爬行其他頁面,從而減小文章重復(fù)度,利于站內(nèi)目標文章頁權(quán)重的集中。百度蜘蛛遇到noindex標簽的頁面后,同樣會丟棄掉該頁。與谷歌不同的是,百度蜘蛛一般不再爬行該頁面包含的文章鏈接,直接返回上一級目錄。由于包含在該頁中的文章無法被百度蜘蛛爬行到,所以頁目錄之下的文章將不會被索引。
解決辦法:
取消All in One SEO 中 noindex設(shè)置。
2.wordpress模板導(dǎo)致的原因。
wordpress之所以流行,與其強大的插件擴展能力和數(shù)量豐富的主題模板密不可分。我曾經(jīng)說過,使用wordpress建站的人,百分之99%都直接采用現(xiàn)成的主題來建站。同樣的模板必然導(dǎo)致網(wǎng)絡(luò)中出現(xiàn)大量高度重復(fù)網(wǎng)站結(jié)構(gòu)和內(nèi)容。百度不喜歡重復(fù)的內(nèi)容,這些重復(fù)內(nèi)容當(dāng)然也包含網(wǎng)站模板的HTML代碼。
SEOer通常會選擇一些使用人數(shù)較少的模板來做SEO博客,同時還會對代碼部分做一些更改,如ID部分名稱,title 描述,CSS名稱等等。這些操作的目的,是使得網(wǎng)頁模板代碼盡量避免與其他網(wǎng)站重復(fù),從而更有利于文章的搜錄。當(dāng)博客正文內(nèi)容字數(shù)越少時,模板重復(fù)對收錄的影響就會變得越大。
解決辦法:
1).增加文章字數(shù)。
2).選擇非熱門wordpress主題。
3).對現(xiàn)有主題進行修改。
3.wordpress摘要設(shè)置不當(dāng)造成站內(nèi)文章重復(fù)。
百度也好,谷歌也罷,沒有哪一家搜索引擎喜歡重復(fù)的文章。當(dāng)一篇文章出現(xiàn)在同一網(wǎng)站內(nèi)多個不同的頁面中,搜索引擎將花費更多的處理時間來判斷哪一篇文章才是正文。當(dāng)搜索引擎從程序上難以無法判斷主次時,會降權(quán)收錄文章第一次被索引的頁面,或者直接K掉這些重復(fù)的頁面。于是很多wordpress站長在百度里site自己的網(wǎng)址,然后驚訝的發(fā)現(xiàn):出現(xiàn)在結(jié)果前面的,竟然全都是日歷頁,歸檔頁或分類目錄,而文章正文內(nèi)容卻被百度隱藏而作為補充內(nèi)容而存在,甚至壓根就不被索引。
導(dǎo)致這樣的原因是因為你在錄入文章數(shù)據(jù)的時候,既沒有采用more標簽對文章進行截斷,也沒有手動添加摘要。wordpress默認情況下,會將more標簽之前的內(nèi)容作為摘要輸出到首頁,標簽?zāi)夸?,分類目錄,歸檔目錄,日歷目錄下。如果沒有用more標簽進行截斷,也沒有手動輸入摘要,那么文章正文會同時出現(xiàn)在首頁,幾個目錄頁,以及文章頁中。由于首頁比目錄頁權(quán)重高,目錄頁比文章頁權(quán)重高,百度以為文章頁權(quán)重最低,便優(yōu)先舍棄掉了。google的真正從技術(shù)上實現(xiàn)了文章的篩選機制,能保文章頁被正常的收錄,而百度這方面的技術(shù)尚需進一步完善。
解決辦法:
1).每個文章前一兩段后添加more標簽。
2).手動添加文章摘要,不能與more標簽之前相同。
3).精簡標簽數(shù)量。
4.URL設(shè)置不合理,不利于收錄。
在很多SEO教程里,都提出過目錄不宜過深。受到這一思想影響,許多站長就將目錄頁,文章頁都控制在二級目錄以內(nèi),以為這樣可以讓網(wǎng)頁更好的被收錄。殊不知,這樣的URL方式其實并不利于SEO。搜索引擎蜘蛛爬行算法不光包含URL深度,同時還包括URL的重復(fù)度。當(dāng)蜘蛛需要爬行一個網(wǎng)站時,首先需要根據(jù)網(wǎng)站的權(quán)重算出索引的深度和重復(fù)數(shù),當(dāng)網(wǎng)站權(quán)重越高時,蜘蛛爬行的深度就越深,允許的重復(fù)數(shù)就越大。蜘蛛在索引某一網(wǎng)站的時候,當(dāng)深度操過一定層次后就會終止爬行其子目錄。在爬行某個層次鏈接的過程中,URL重復(fù)數(shù)度超過一定數(shù)量,就會結(jié)束對該層目錄的爬行。
如果你的站內(nèi)除了根目錄就是2級頁面,文章數(shù)量少時還好,如果文章數(shù)量一多,便會加大搜索引擎引擎服務(wù)器的負荷,從而引起蜘蛛反感。
解決辦法:
一般而言,搜索引擎對于新站爬行層次都在三層左右。最佳的目錄設(shè)置方案應(yīng)當(dāng)是目錄/時段/正文。雖然這樣的分類方式在建站初期收錄處在劣勢,但對網(wǎng)站(尤其是對靠長尾關(guān)鍵詞取勝的站點)的長期發(fā)展百利而無一害。我個人認為,這種目錄結(jié)構(gòu)是對搜索引擎最友好的,最容易被收錄的結(jié)構(gòu)。
廣州最專業(yè)的網(wǎng)站建設(shè)公司,為你提供最好的營銷方案,幫助你獲得更多的訂單。
全國統(tǒng)一服務(wù)電話:4000-882-993
掃一掃關(guān)注古柏
GOOBAI AD.
Brand Whole Case Design
4000-882-993
www.sdzlsb.com
微信加好友咨詢
廣州古柏廣告策劃有限公司
地址:廣州市天河區(qū)東圃長盛商務(wù)大廈B213-215
Copyright?2004-2020 GOOBAI Inc.All rights reserved
粵公網(wǎng)安備: 44010602001481號
備案號:粵ICP備09222445號
與古柏對話
關(guān)注古柏