這篇為 Google Search Console 教學指南中的一部分,用以說明『提交的網址發生轉址式 404 錯誤』情境。
不知道大家有沒有看過有個詞,叫『soft 404』,中文翻譯成『轉址式 404』。
一般而言,當你訪問網頁時,瀏覽器會發送請求到伺服器,然後伺服器把你頁面的內容傳送給你。
並且會附上一個響應代碼,這個響應代碼是瀏覽器跟伺服器之間的對話,用來告訴瀏覽器有沒有問題。
如果說沒問題,網頁代碼就會出現 200;如果有要跳轉到別頁,可能會出現 301 或 302 代碼;如果說出現錯誤,就會有 404 錯誤代碼。
那今天要提到的就是跟 404 狀態碼有相關的『轉址式 404』。
當我們網頁內容被刪掉時、該頁面錯誤、網址輸入錯誤時,正常來說會看見『該頁面不存在』,並且頁面響應碼會出現『404』的狀況。不過響應碼不能直接在頁面中看到,可以透過 Chrome 的外掛『Redirect Path』查看。

那一般來說,具備『該頁面不存在訊息』及『404 狀態碼』,這樣一個頁面是正確的 404 頁面。
什麼是轉址式404(Soft 404)
轉址式404(Soft 404)就是頁面看起來是錯誤頁面,但是響應碼卻是200之頁面
從圖中可以看到,當你的內容有出現類似『此頁面不存在』的情況,或是頁面內容過於單薄的情況,Google 便有可能將其便是判斷為丟失頁面內容。
會有所謂 soft 404 的狀況出現,就是為了讓 Google 的爬蟲能夠更有效的爬取網站資源,並且節省爬取預算,這樣子 Google 就能夠自動將這些原本要爬取錯誤頁面的資源,用來爬取更多網站重要頁面。
我們不知道 Google 判斷的依據為何,但可以知道的是,此判斷依據會類似於熊貓演算法想處理的頁面,也就是那些頁面品質低且重複性非常高的頁面,也因此解決這些問題將能同時解決 soft 404 以及熊貓演算法相關問題。

解決 404 錯誤
除了soft 404 外,一般的 404 頁面也需要解決,可能的出現 404 錯誤的原因主要有兩點:
1. 錯誤連結
有時候有可能只是你連結網址寫錯了,將你網站中的錯誤連結找出並且將其修正,以防 Google 浪費資源爬取錯誤頁面。
內部連結對 Google 來說是傳遞權重的一個方式,所以當你內部連結出現錯誤的話也會導致權重傳遞失敗喔。
2. 頁面下架或遭刪除
有時候有可能因為某些原因,網頁內容被下架或是刪除,這時候也很有可能出現這種頁面錯誤的狀況。
如果可以,將下架頁面 301 轉址至相似頁面,切記一定要相似頁面,否則此轉址就沒有傳遞權重的效果在,Google 將會把不相關的 301/302 轉址視作 soft 404喔,並將錯誤連結改成正確的連結。
如何檢查 404 錯誤及轉址式 404
透過工具爬取
這邊以 Screaming Frog 為工具,要找到網站中錯誤頁面其實並不容易,如果網站不大的話推薦使用 Screaming Frog,這邊用 transbiz 為例,將他們網站丟到 Screaming frog 裡面爬取後。
- 找到 Response Code > Client Error
- 點選左上方任意網址(都是錯誤網址)
- 點擊下方的 inlink,你就能看到哪些頁面中放置著錯誤連結
- 到這些頁面尋找錯誤連結並修正(原始碼找 Url、錨文字搜尋等)

Google Search Console 查看
在 Google Search Console 中,涵蓋範圍是個相當好用的功能,他能看到大多數索引所遇到的問題,圖中就是我們要關注的重點。
早期我以為轉址式 404 是錯誤頁面會轉址到 404 頁面,不過從剛剛的說明中,你應該要能知道轉址式 404 可能發生的原因,點擊進去看看不同頁面是什麼問題並且逐一解決,這邊簡單提幾個轉址式 404 常見案例。

1. 錯誤頁面無正確 404 響應碼:
這就要從響應碼去設定了,這邊記得找自家網頁工程師請他設定伺服器能夠在頁面錯誤時顯示 404 狀態碼即可解決。
2. 網頁內容過少或是無內容:
因為 Google 爬蟲有搭配 AI 機器學習演算法,對於低品質內容及無內容頁面判斷的越來越準確,所以今天如果你的內容被表示轉址式 404,經你查看後發現原來只是內容過少,且該頁是重要頁面的話,記得多補上一些相關內容,並透過相關的主題頁面增加內部連結連至該頁面。
3. 重複內容:
當你的頁面有大量重複性內容時也有可能被判斷是轉址式404,所以找出幾乎相同的頁面,然後找到權重較高之頁面(可能是排名較好、外部連結較多、PA 分數較高等等),然後合併內容進行 301 轉址。
4. 不相關頁面之 301/302 轉址
這點比較少人知道,這也是 John Muller 在某一次的 Webmaster Central office-hours hangout 中所提到的,很多 SEO 人員其實會以為網站搬遷時,只要 301 轉址權重都能轉移過去,有些則是全部轉址到新網域首頁,但其實這樣對網站權重轉移是沒有幫助的!這點可以參見 Ahrefs 的文章 『301 vs. 302 Redirects for SEO』有詳細說明,所以這篇文章才提到了 3 次,只有相似頁面能夠轉址相似頁面。
總結
404 錯誤跟 soft 404(轉址式 404),對於 Google 而言都在『檢索』及『索引』的階段,對於排名的影響相對小,所以在網站規模不大時可能感覺不出問題。
可是因為檢索預算的關係,當網站越來越大時,影響到 Google 對網頁檢索及索引的狀態時,對於排名就很有可能造成影響了。
特定頁面重要性很可能被降低,因為這牽涉到重複頁面問題、內部連結權重傳遞、內容質量不足等問題,必須去逐步抽絲剝繭比對才能找到問題。
執行 SEO 時,的每個環節其實都有都自的重要性,像是索引、排名等,執行的每個動作也對各自環節有不同程度的影響性,我們必須透過不停的實驗、思考、釐清,才不會在優化排名的過程中迷路了。
- 404 狀態碼存在的目的:頁面出現錯誤時,Google 能第一時間知道,並且不影響索引
- soft 404 存在的目的:方便 Google 判定低品質及可能是錯誤的頁面,以利 Google 索引正確且重要的頁面
- 哪些 404 頁面需要修正:網頁中錯誤的網址;變動頁面造成的網址改變;遭到刪除的頁面
- 哪些可能造成 soft 404:錯誤頁面未設定 404 狀態碼;頁面內容過少甚至沒有內容;重複內容比例太高;不相關頁面進行 301/302 轉址
Reference:
- 404 vs. Soft 404 Errors: What’s the Difference & How to Fix Both
- How to Fix Crawl Errors in Google Search Console
- 301 vs. 302 Redirects for SEO: Which Should You Use?
- English Google Webmaster Central office-hours hangout
- 轉址式 404 錯誤
感謝分享。