Google Search Console (下簡稱為 GSC)是 SEOer 最常用的工具,其中的網址檢查工具 (URL Inspection Tool)由於具有讀取網址在 Google 索引狀態、手動提交網址、模擬渲染等效果而被廣泛地應用。
小編接下來將分享兩個與 GSC 標準網址有關的不直觀呈現,有可能會讓使用者誤判單個 URL 的索引狀況,或對使用網頁索引狀態報表有所誤解:
場境 1:回應 301 狀態碼的網址在網址審查工具顯示 200
檢查網址是否設定轉址的常見做法
一般來說,網站因各種原因設定轉址後,我們都會在瀏覽器點擊實際擊網址測試轉址是否正確設定,例如使用 Chrome 的轉址偵測外掛「Redirect Path」:
又或是在透過「開發者工具>Network 」頁籤檢視伺服器回應的狀態碼:
以示意圖的網址「https://www.seo-tea.com/category/technical-seo/」為例,均可以看到此網址被 301 轉址至「https://www.seo-tea.com/technical-seo/」。
另一方面,原網址在網頁索引狀態報表中也是被記錄在「未索引>頁面會重新導向」狀態下,將網址鍵送網址檢查工具作測試,也是能得出「網址不在 Google 服務中」的回饋,代表 Google 已發現並接受此 301 轉址:
GSC 「即時測試」的結果不反映轉址?
然而,若這時點擊「測試線上網址」作即時測試,「Bug」便不期而遇了:
對比上文,可以看到在檢測網址(https://www.seo-tea.com/category/technical-seo/)不變的情況下,GSC 在「上次檢索(圖中的「Google 索引」)」、「即時測試」提供了相反的索引狀態:
- 上次檢索(=Google 索引):意指網址目前在 Google 索引庫中的狀態
- 即時測試:意指網址目前 Live 測試實時狀況
接著,點擊「查看已測試的網頁」,還可以看到網址回傳 200 狀態碼,頁面內容也能被成功讀取:
⚙️這樣的測試結果有什麼問題?
根據小編近年在 SEO 顧問商服務的經驗來說,客戶(或建置商)調整網站後大多都「不會」與乙方聯絡、說明,因此常常發生網站重要頁面變換網址後未作妥善操作一類的情況:
- 誤以為「測試網址」在近期另作調整(以本文情況為例,即取消原先的 301 轉址,讓舊網址能訪問);
- 誤以為「測試網址」是否在某種條件下能被搜尋引擎的爬蟲訪問,即使用者和爬蟲在同一網址下看到的內容不同(以本文情況為例,即測試網址在某些條件下未能觸發轉址,讓舊網址能訪問)。
這到底是怎麼一回事?讓小編以自身的經驗娓娓道來!
SEO 小實驗:被 301 的網址在 GSC 即時測試回應 200 狀態碼
小編當初是在檢查使用 Shopline 架站的網站的 Blog 文章頁時首次遭遇此問題,以生活倉庫(非當事網站,僅從 Shopline 成功案例隨便撈一個網站)的部落格文章頁為例說明:
可以看到,這篇文章出現在部落格頻道頁時網址為「https://www.lifewarehouse.net/blog/posts/83」,但實際點擊網址會觸發 301 轉址,轉址至「https://www.lifewarehouse.net/blog/posts/5solutionforhome」:
當時小編正在一口氣檢測好幾個新上線文章頁的檢索引狀況,重複以下流程:
- 於部落格頻道複製文章網址(簡稱「原網址」);
- 將「原網址」送至 GSC 網址檢查工具作檢查;
- 點擊「測試線上網址」,發現「原網址」在即時測試下回傳 200 狀態碼,網址能被正常訪問。
接著,由於小編不認為 Shopline 平台存在這麼複雜的問題,便接著點擊「查看已測試的網頁」觀察狀態碼 200 下回饋的頁面內容,發現頁面的 og:url 和 rel=”canonical” 標籤均使用新網址(以上圖為例即「https://www.lifewarehouse.net/blog/posts/5solutionforhome」),而非以數字編號命名的原網址「https://www.lifewarehouse.net/blog/posts/83」。
自此,答案下落石出,因為 Shopline 後台並不存在自行調整 Open Graph 和 rel=”Canonical” 標籤的功能,所以可以推斷 GSC 實際檢測的頁面應該是新網址「https://www.lifewarehouse.net/blog/posts/5solutionforhome」,而非原網址「https://www.lifewarehouse.net/blog/posts/83」,新網址回傳狀態碼 200 合情合理。
🖋️ 小結
其實, GSC 網址檢查工具的說明文件實有針對此狀況作說明,只是我過去未曾留意過這段:
簡單來說:
- 造成網址的上次索引狀態為「網址不在 Google 服務中」,但即時測試結果的狀態碼 200,並能檢索頁面,其實是假象;
- Google 網址審查工具會沿著轉址跑,因此實際檢測的是最終網址,也即是說檢查欄位寫的是舊網址,但實際檢查結果列的是新網址的結果。
就此,Glenn Gabe 過去曾就此問題有深入的介紹,還討論了幾種延伸情況,他認為 GSC 這樣的呈現方式對使用者頗不直觀,也會讓網頁索引狀態報表記錄到錯誤的狀態,有興趣的朋友可以參考。
另外,重新回到分解茶「https://www.seo-tea.com/category/technical-seo/」網址的例子,檢測結果下方的「使用者宣告的標準網址」為「https://www.seo-tea.com/technical-seo/」己露端倪,詳參下文說明。
💡 SEO 操作小撇步
使用 GSC 網址檢查工具測試網址時,應一併在瀏覽器打開該網址,以確定網址並沒有設定轉址。
場境 2:301 轉址的到達網址被視作「使用者宣告的標準網址」
什麼是 rel=”canonical” 語法、標準網址(Canonical URL) ?
SEOer 在處理重複內容時,常常會應用到 rel=”canonical” 標籤,通過在「重複版本」頁面的 <head> 區塊內加入相應語法,向搜尋引擎宣告它們皆有另外的標準網址。
(圖片來源:Ahrefs)
臺灣繁體中文的使用者,常常會將 rel=”canonical” 指定的網址簡單稱作「標準網址」,以下是臺灣某 SEO 顧問公司的情況:
原則上,這樣的翻譯上其實是沒有問題的,但小編近期發現不少新手會將 rel=”canonical” 的「標準網址」與 GSC 網址檢查工具中的「使用者宣告的標準網址」劃上等號,但其實這是不對的,Canonical 標籤宣告的「標準網址」只是「使用者宣告的標準網址」的其中一種來源。
「使用者宣告的標準網址」的真正含義
「使用者宣告的標準網址」的英文是「User-declared Canonical」,不等於 rel=”canonical” 語法:
- 因此,此欄有可能不是顯示頁面所設定的 rel=”canonical” 指定的網址;
- 此欄的真正意義是「Google 選擇的標準網址」,rel=”canonical” 本身是宣告標準網址的一種方法而已。
這在官方文件都有明確說明:
就小編的個人經驗來說,轉址的到達網址也常常會出現在「使用者宣告的標準網址」欄位中,當原網址被設定了 301 轉址、JavaScript 轉址,GSC 通常都會顯示:
標準化的運作原理:Google 是怎樣選定標準網址的?
簡單來說,Google 在網站檢索網址時,會時刻注意不同網址間的主要內容是否存在相同、相近,若偵測到一些網址間存在重複內容的可能性時,會將這些網址建立一個「URL Cluster」,再透過 rel=”canonical”、Sitemap.xml、內部連結、轉址等標準化訊號,決定哪個網址才是該段主要內容的標準網址。
這邊,延伸向各位介紹「標準化(Canonicalization)」的幾個基本概念:
- 標準化訊號不止 rel=”canonical” 語法一種;
- 在 Google 眼裡,無論是表永久性轉址的 301 轉址或表示暫時性轉址的 302 轉址,及至 JavaScript 轉址、Meta Refash,其實都是一種標準化訊號;
- Sitemap.xml、內/外部連結(PageRank)、網址長度,https 等也都是標準化訊號的一種,只是強度較轉址和 rel=”canonical” 語法來得輕;
- 「標準化」是Google 判斷、選檡標準網址的過程。
(圖片來源:Ahrefs)
對 Google 處理標準化訊號流程有興趣的朋友,可以閱讀以下幾篇文章:
- Canonicalization: What It Is & How It Works
- Google Goes Deep On Dupe Detection & Canonicalization
- Google: Redirected URLs Are Put Into A Cluster For Canonicalization
🖋️ 小結
這個美麗的誤會源於受日常叫法影響,而對工具的真正意涵有所誤解,誤以為 Google 只根據 Canonical 標籤的宣告來參考和選定標準網址。
其次,也跟許多 SEO 新手不曉得轉址本質上也是一種「標準化」的過程,割裂地認識 rel=”canonical”、轉址、PageRank 等概念。實際上 Google 也是從標準化、標準網址的角度來處理轉址前的 PageRank 流通、傳遞(參:SEJ)。
結論
- SEOer 應熟讀官方文件,並理解箇中專有名詞的定義,對中文使用者來說,注意英中翻譯後的字詞落差;
- 工具難免會有 Bug 或難以理解之處,唯有正確使用工具,了解工具的短板,就能恰如其分地應用;
- 各式轉址、Canonical 語法都應從標準化、標準網址的角度理解。