對於搜尋引擎排名、SEO 有興趣的人,多半都在很多文章提看過過重複內容對 SEO 來說是很不利的。可是到底有何不利呢?簡單說明如下:
1. 從搜尋引擎的角度來看,它不希望列出來的許多搜尋結果都是同樣的內容。因此,同內容的網頁搜尋引擎只會列出一份。也就是說,即使好幾個網頁有同樣的內容,搜尋引擎也只會列出其中一頁而已。
2. 搜尋引擎的蜘蛛在爬行時,是要花費系統資源的。因此,搜尋引擎不會希望看到它讀取的網頁內容是一樣的,因為那等於是浪費系統資源。所以,若一個網站有許多內容重複的網頁,搜尋引擎可能會決定只去爬少數的網頁,甚至有可能決定完全不去爬該網站。
3. 在好幾個網頁有同樣內容的情況下,哪一個網頁會被搜尋引擎放在結果中就完全是靠搜尋引擎決定。雖然理論上搜尋引擎應該會選擇排名會最高的網頁,可是實際上搜尋引擎會怎麼選是很難講的。
4. 一個錯誤的 SEO 想法是,如果將一個網頁或網站拷貝成數份放在不同的網址上,那就可以增加該網頁的排名。這個做法在十多年前或許會有用,可是現在卻已經被搜尋引擎認為是一種 spam。當搜尋引擎抓到這類的情況時,那整個網站就有被踢出搜尋引擎目錄的危險。
但是,事實上,就算你並沒有去故意製造重覆內容,但是如果你網站是部落格的形式,難免會有不同網址下,卻有相同內容的情況。畢竟,對於部落格來說,文章的內容是必然和不可避免地存在於其它的分類頁面中。這是最正常不過的功能要求,否則,沒有了文章的存檔頁面,這還能叫一個部落格嗎?
但是,Google 能很清楚的辯認此情況,也允許對於單一的部落格在這種情況下中的合理正常內容重複。所以,倒不用擔心被 Google 懲罰。
可是,Yahoo 就沒有那麼聰明了。如果你的部落格是架在有名的BSP上,那倒還好。如果是自架的部落格,很容易被 Yahoo 誤認為在刻意做重覆頁面。如果您的客戶層大都習慣使用 Yahoo ,你就要用心去處理這個問題。以下是幾個簡單有效的方法:
1. 在首頁和各個存檔頁中,以摘要(excerpts)形式出現,全文內容只出現在單篇文章頁面中;
2. 在引用或轉載其它網站或部落格文章時,儘量地不要全文轉載,同時也可以在轉載內容的前後適當添加一些自己的語句(如適當的評論,建議等);
3. 最好不要使用那些通過獲取其它網站的feed種子的內容進行文章發表的外掛程式,這樣勢必造成不同網站間內容重複。如果不得不使用那些外掛程式,建議對它進行修改,讓它只輸出該feed內容的一部份或只顯示摘要。
4.可以考慮編寫robots.txt,如果是 WordPress 可以考慮如下寫法:(請視情況調整)
User-agent: *
Disallow: /wp-
Disallow: /feed
Disallow: /*/feed
Disallow: /trackback
Disallow: /*/trackback
Disallow: /*.css$
Disallow: /date/
Disallow: /page/
當然,如果只是一般的網站型式,從頭到尾就不該去設計會產生重覆內容的網站結構,更不該刻意製造重覆內容。
留言列表