什麼是網址審查工具(Inspection Tool)?
Google Search Console(以下簡稱GSC )是網站管理者、SEOer 操作 SEO 時的必備工具,也是我們與 Google 溝通最直接的工具,其中提供的第一手數據是我們衡量網站 SEO 表現最主要的資料來源。其中, GSC 裡有關檢索、索引狀態的分析報告,更是無其他第三方工具可取代的、不可或缺的重要要存在。
有關 GSC 的操作和使用,分解茶過去已經有撰寫過一篇很完整的 Google Search Console操作教學指南,本文在此基礎上,單獨就 GSC 的「網址審查工具」作介紹,希望能為各位幫上忙。
進入網址審查工具的方法:
- 在頁面頂部「檢查 YourDomain 中的任何網址」貼上想檢查的網址後按 Enter
- 點擊側邊欄「網址審查」,畫面會自動跳轉至網址審查欄,同樣輸入網址並按 Enter 即可
- 點擊不同報表(Ex. 網頁體驗報表)網址欄位的放大鏡圖示進入
用法1:手動提交網址
通過於 GSC 網址審查欄位鍵入網址,可以以手動的方式「提醒」Google把該網址「插隊」至爬蟲的檢索佇列。
操作方法如下:
- 進入網址檢查工具後,點擊「要求建立索引」按鈕
- 等待GSC作業
點擊「要求建立索引」按鈕後,GSC會先測試網址是否為可索引的狀態,如果可以索引,就會出現「已要求建立索引」的通知。但要注意的是,此做法是向Google表示此網址應優先被檢索,而不等於點擊後Google就會直接將網址編入索引。
假如網址因一些原因處於不能檢索或索引的狀態,例如被robots.txt阻擋爬取、頁面設有noindex的話,GSC會顯示如下畫面:
就小編實際經驗來說,此方法作用不大,對加快網址索引沒太大幫助。
用法2:檢查網址的檢索、索引狀況
首先是網址檢查結果,可快速知道網頁有沒有被索引,此檢測結果位於頁面上方,使用者可以馬上知道該網址是否已編入索引:
- 網址檢查結果
常見有以下 5 種狀況:
- 網址在Google服務中
- 網址不在Google服務中
- 網址在 Google 服務中,但出現問題
- 這個網址是替代版本
另外,還有【網址不在 Google 服務中:編入索引時發生錯誤】,較少遇到。
雖分作5種情況,看似複雜,但其實都是從「網址在 Google 服務中」、「網址不在 Google 服務中」兩種情況延伸出來:
- 「在Google服務中」:表示該網址已被Google索引,等於可以出現在搜尋結果;
- 「不在 Google 服務中」:代表網址未被索引,等於不會出現在搜尋結果。
下方的「網頁索引狀態」中會列出更詳細的資料,以下按列出順序一一說明:
- 索引狀態
此區列出該網址在「索引>網頁」(原「涵蓋範圍」報表)中屬於哪些狀況。
- 發現方式
記錄Google發現該網址的方式,又分為「Sitemap」和「參照網頁」兩個來源。
Sitemap:顧名思義就是 Google 有沒有從 Sitemap.xml 檔中檢索到這個網址,如有會列出Sitemap的來源,如無則顯示「不適用」。
例如,本網站並無將分類頁網址加入至 Sitemap.xml 中。下圖為導覽列的「最新資訊」頁的檢測情況,可看到 Sitemap.xml 欄位記錄為「不適用」。換一個角度,本欄位方便網站管理者,判斷Sitemap.xml檔有無把重要頁面都包含其中。
參照網頁:列出Google發現受檢測網址的連結來源,最多列出4個來源網址,記錄 Google 在最先在哪些網頁(址)發現受檢測的網址,像是從哪個內部、外部連結指向過來,或是從哪些網址轉址而來。如無,則顯示「未偵測到任何參照網頁」。
然而,根據實務經驗,GSC在這裡的記錄僅作參考用,不全然「正確」。例如,以下是分解茶網站首頁的檢測結果,首頁的連結出現在站內各頁左上角的 Logo 處,等於全站所有頁面都含有這個連結,但 GSC 此處卻記錄為「未偵測到任何參照網頁」,不過這並不代表首頁處於連結失聯的狀況,有可能只是 Google 先從 Sitemap.xml 檔發現到首頁,因此參照網頁欄位才沒有數據。
換言之,假若看到檢測網址顯示「未偵測到任何參照網頁」,先不用太擔心站內連結是否布局不佳,或該頁面失聯為 Orphan Page 。如想檢查部連結的情況,應使用 GSC 的「連結」報表,
換個角度,假如無法在參照網頁列出的網址上找到檢測網址,其實也不用太在意,有可能只是Google還在記錄較早期的情況罷了。以小編的經驗,這種狀況較常見在檢測重複版本網址時用到,像是我們想要確認這個重複內容網址(Ex.奇怪的參數網址)是從哪裡來的,哪些頁面在指向這個怪網址。但有可能在網站已作修正後,網址審查工具仍然列出。
同理,假如你遇到「參照網頁」一直在列出舊網域、已修正的重複版本網址,若已確定已執行過301轉址,其實就不用擔心是不是沒有轉址乾淨,不必過於在意。
小編的個人經驗推測「參照網頁」的更新速度可能不高,故未即時反映Google最近的檢索情況,而且 Google 也有保留「最先發現檢測對象」網址的傾向。話雖如此,有時候也能從「參照網頁」上有一些意外收獲,例如小編就曾經透過此欄位,發現客戶還有一個沒好好作301轉址處理的舊網站。
因此,從可信程度來說,可以較相信「 Sitemap 」來源的記錄,而「參照網頁」則需配合一些如 Screaming Frog 或 Ahrefs – Internal Backlink 等第三方工具作複查。
- 檢索
本區塊較重要的欄位是「上次檢索時間」,記錄的是Google最近一次檢索網址的時間,頁面當前顯示的資料都是該時間點檢索而來。
實務上,當重要頁面的檢索時間離測試當日距離太遠,則需要留意頁面是否內部連結不足,或網站近期的檢索次數是否有下降,即 Google 近期是不是有降低檢索我們網站的次數。
比較可惜的是,此處的時間無法與上欄的參照網頁作結合分析,我們無法得知哪筆網址是剛被檢索過的(但就上文的分析而言,說不定也沒記錄在上面)。
- 產生索引
使用者宣告的標準網址:如有在頁面埋設 Canonical 標籤, Canonical 指定的網址將顯示於此。如無設定,則顯示「無」。
Google 所選的標準網址: Google 判斷標準版本的依據包括:內容重複程度、內外部連結、 Canonical 標籤、301轉址。我們知道, Canonical 不是強制元素,設置後 Google 有選擇買不買單的權力。此欄是 Google 用來告訴我們它選定哪個網址為標準版本。換句話說,Google 判斷受檢測網址是否為標準網址時,有三種狀況:
- 與使用者宣告網址一致:表示 Google 選定的標準網址與 Canonical 埋設的一致
- 受檢測網址:表示 Google 選定的網址與我們丟工具測試的網址一致,但可能與 Canonial 設定有所不同
- 列出另一網址:表示 Google 選擇了一條檢測網址、 Canonical 標籤以外的網址
用法3:檢查頁面渲染狀況
我們都知道Google搜尋運作的機制是:檢索器(爬蟲)發現>檢索>索引網站頁面後,再根據關鍵字查詢列出排名結果。然而,爬蟲檢索頁面時「看到」的內容,不一定與使用者在瀏覽器看到的相同,例如瀑布流、一些使用JS渲染的元素,這些構建頁面的技術,有可能基於各種情況無法渲染成功。
面對這種情況,其中一個重要的判斷依據,便是網址審查工具的「查看已檢索頁面」功能,我們可以使用本工具來檢視、確定頁面重要文字、區塊是否能被Google「看到」,亦即有沒有被正確地渲染出來。
延伸閱讀:JavaScript SEO 終極指南(SEOer必看)
操作方法如下:
- 點擊示意圖右上方「測試線上網址」,讓工具線上立即模擬爬蟲渲染頁面,結果出來之後可以看到右上方多出「即時測試」的頁籤,點擊「查看已測試的網頁」。
*如不先經過「測試線上網址」的步驟,看到的會是Google上一次檢索頁面時的渲染結果,不一定與現時狀況一致,因此保險起見均建議先「測試線上網址」。
- 測試結果分「HTML」、「螢幕截圖」、「更多資訊」三類。
- HTML:此處列出的HTML便是 Google 檢索頁面實際渲染出來的結果,在搜尋框鍵入重要資訊的元素(Ex.文字、連結,元素),搜尋成功代表該元素能被正確「看到」。
- 螢幕截圖:與「HTML」類似,只是此處會以視覺化形式呈現。美中不足的是並不會把整頁的渲染結果呈現出來,只能顯示其中一部分。
更多資訊:此處較重要的是「網頁資訊」子項目,這裡工具會告訴我們渲染過程中成功和失敗的資源數,也會把失敗原因大致列出(Ex.遭到 robots.txt 封鎖)。就小編的實際經驗來說,此處的測試有時間限制,Time-out也會導致資源載入不完整(失敗條件歸類為「其他錯誤」),因此如遇某些元素一直無法渲染出來,摸不著頭腦的時候,建議可以多使用其他模擬工具綜合比較渲染結果,或是多測試幾個版型相同,或使用懷疑存在渲染問題的頁面,多方比較測試較為保險。
此處提供一個可以彌補「螢幕截圖」視覺化渲染結果不全面的小撇步。
將渲染結果中的 HTML 原始碼 CTRL+A(MAC:Command+A )複製全部,在瀏覽器另開一個新的頁面,然後Ctrl+Shirft+I(MAC:Command+Shirft+I)打開開發者工具,用複製過來的原始碼取代該頁籤的原始碼後敲一下 Enter ,這時你看到的內容便是 Google 渲染後看到的,可補充工具內部「螢幕截圖」不完整的缺點。
線上也有一些第三方工具,例如 Sereaming Frog、Merkle – Fetch & Render 等工具,可以模擬爬蟲的渲染結果,下圖為 Mekle 的渲染結果:
不過,相比之下畢竟網址審查工具是 Google 官方工具,因此在正確性上較值得信賴,有其不可替代的地方。
用法4:檢查強化項目
強化項目由「行動裝置可用性」、「AMP」、「結構化資料」三類項目組成,顯示受檢測網址這三類項目的設定情況。
- 行動裝置可用性:檢查頁面是否適合在行動裝置上使用。
- AMP:檢查頁面的AMP版本是否能正確索引(如有)
- 結構化資料:檢測埋設的結構化資料標記是否正確。
如果您的網站剛剛上線,Google或因資料搜集不足,強化項目欄位可能會沒有資料。
網址審查工具跟「 site: 」哪個準?差異是?
對 SEO 有一定認識的朋友,應該都有聽過或用過 site: 指令, 它是 Google 的搜尋指令之一,常用於檢測網站、頁面的索引狀況。用法如下:
- site:[example.com] :找出特定網域 [exampl.com] 的搜尋結果
- site:[example.com/blog/] :找出特定網域 [exampl.com] blog 子目錄下的搜尋結果
- site:[example.com] {關鍵字}:找出特定網域 [exampl.com] 中與{關鍵字}有關的結果
習慣上,也常常使用 site:yoururl 檢測頁面有沒有被 Google 索引,例如:
將檢測網址搭配 site: 指令拿去搜尋,如果 Google 能返回檢測網址,代表這筆網址已被索引。一般情況而言是正確的,這也是 Google 官方建議的檢測方式。不過,site: 的檢測方式,與網址審查工具提出結果是一致的嗎?
然而,就小編的經驗來說,site: 指令不時出現一些令人疑惑的狀態,多少令人疑懷其準確性。接下來,補充幾個使用 site: 指令檢查索引況時需要注意的地方。畢竟,唯有恰如其分地使用工具,才能正確使用,並最大化其功效。
先說結論:
- 單筆網址的索引檢查可以使用 site: 作輔助,但若是想用在檢查網站、子目錄的索引總數,數字或跟實際量體有很大落差,尤以大型網站為甚;
- 網址審查工具、site: 指令的結果可能會有不一致。
狀況1:site:example.com 會列出一些有設置301轉址的網址
有執行301轉址的網址按理會移出索引( John 表示 Google 不會索引已轉址的網址),但很常看到一些已經有做301轉址的網域,使用 site:old-domain.com 仍能搜出東西,例如 Moz 的舊網域https://www.seomoz.org/:
在 site:www.seomoz.org/ 的情況下,Google 仍列出約 4920 筆結果, Moz 搬家到新網域 https://moz.com/ 已有一段時間,實際點擊這些網址也可得知都有設置301轉址,即使是某些網址失誤沒有設置,按常理也不應該有 4000 多筆(不太相信 Moz 人員會放任這個問題不處理)。
因此,當我們使用 site: 指令作單一網址有無被索引的根據時,會不會剛好那條 URL 恰好跟上例相似,讓我們誤以為網址有被索引,但實際上並沒有?
狀況2:site: 指令或無法過濾重複內容
根據 Google 官方早年的文件,site: 指令存在以下問題:
Historically, Google has avoided showing pages that appear to be duplicate (for example, pages with the same title and description) in search results.Our goal is to provide useful results to the searcher.However, with a site: command, searchers are likely looking for a full list of results from that site, so we are making a change to do that. In some cases, a site: search doesn’t show a full list of results even when the pages are different, and we are resolving that issue as well.
英轉中翻譯:「從歷史上看,Google 一直避免在搜尋結果中顯示看似重複的頁面(例如具有相同標題和描述的頁面)。我們的目標是向搜尋者提供有用的結果。但是通過site: 指令的搜尋者很可能正在尋找來自該網站的完整結果列表,因此我們正在做出調整以做到這一點。在特定情況下,即使頁面不同,site: 搜索也不會顯示完整的結果列表,我們也正在解決這個問題。」
SEL早年也有撰文討論重複內容然顯示在 site: 指令搜尋結果中的問題,值得留心、注意。
狀況3:網址審查工具、site: 指令不一致
小編最近在檢查某網站新上線頁面有沒有被索引時,就有遇到網址在網址審查工具顯示「網頁已編入索引」,但使用 site:URL 卻沒有結果,而直接搜尋網址又有列出。情況如下:
- 網址審查工具顯示頁面已被索引
- 但使用 site:test-URL 卻顯示沒有結果
- 直接搜尋網址又能吐出結果
如上文所述,Google 官方是以 site: 作為網站或網址有無被成功索引的依據:
接著又說:
其次,Google 官方也表示:
此處語境是:當使用 site:your-URL 未能顯示該頁面,但網址審查工具又顯示網頁已成功索引。
小編初步推測當中存在時間落差,當某網址 Google 確定將其收入索引資料庫,還需一段作業時間才能「正常地」出現在搜尋結果(site:),並非「建立索引」後就會馬上「出現在搜尋結束」中。
按時間順序來說,網址審查工具能較早地知道該網址會不會被索引,故此才存在如此吊詭且矛盾的狀況。以「搭飛機」作例子,搭飛機通過安檢確定可登機後(=已編入索引/建立索引),還需先在候機室等候一段時間,待廣播後才能一一登機(=出現在搜尋結果中)。
其次,小編推測網頁本身的內容品質也是影響因素的原因如下: site: 指令本質上是一種有限制條件的 Google 搜尋,自然也受「權威度」、「相關度」兩大判斷因素影響,並不是站內有相關頁面,Google 就一定會它列在搜尋結果上。
以上文提到的例子來說,有機會是 Google 認為那個頁面目前品質欠佳,故縱使已編入索引也不傾向在搜尋結果中列出。
小結:
- site: 可以用來查詢單一 URL 是否被索引;
- 不建議使用 site: 指令當作檢視某網站、子目錄的索引頁面數量的依據,可能列出不完整或列出實際已不存在的頁面。
可以用 John 在 Twitter 的一個回覆作呼應:
如果對 site: 指令有興趣的話,可以參閱以下文章:
- Google Advanced Search Operators: 50+ Google Search Commands – Spyfu
- Google Search Operators: The Complete List (42 Advanced Operators) – Ahrefs
2個快速批量檢查索引的工具 🚀🚀
網址審查工具雖然功能強大,但每次只能檢測一筆網址,不利於網站管理者檢查頁面的檢索、索引狀況。小編接下來提供兩個可以一口氣檢測複數網址的工具:「 Search Analytics for Sheets 」和「 Screaming Frog 」。
工具1:Search Analytics for Sheets 外掛(免費)
Search Analytics for Sheets 是官方推出應用在 Google Sheets 上,用來串接 GSC 資源後可以匯出相關數據的小外掛。此外掛的優勢是能夠在一張表格中同時查看多維度的數據,而且還不受 GSC 預設只顯示前1000筆資料的限制。目前此工具提供串接網址審查工具的功能,雖然是尚為 Beta 版本,但小編實測下來相關資料都能正常顯示,可以一口氣檢視大量網址的索引狀況。
- 安裝並啟用 Search Analytics for Sheets
在 GSC 所在資源的 Google Drive 中,建立一個新的 Google Sheets ,在工具列依次點擊「擴充功能>取得外掛程式」,在跳出的視窗中搜尋「 Search Analytics for Sheets 」並進行安裝。
外掛工具安裝成功後,現在你已經能在工具列「外掛程式」中找到它,點擊「 Open Sidebar 」啟用。
- 資料匯出設定
以下為外掛控制面皮的選項說明:
- Verified:選擇欲匯出的資源
- Date Range:選擇資料的匯出日期範圍
- Search Type:選擇 Default(Web) ,因為目前的需求是檢測網址的索引狀況
- Filiter By:保持預設
- Aggregation Typs:保持預設
- Rows returend:匯出資料的筆數,建議根據網站量體選擇相應的數量,預設有1000、5000,everything(全部)三個選項
- Results Sheet:資料新增位置,視個人需求、習慣選擇
- Include Fresh Data:即 GSC 目前還在處理中,為最近幾天的不完整資料
- URL Inspection(beta):務必勾選,以匯出相關數據
選擇相關條件後,點擊 Request Data 匯出數據。
- 匯出數據範本
上圖為匯出報表的截圖,以表格的方式列出上文提及的種種資料,例如「URL Inspection Result」、「Coverage」、「Google Cananical」、「User Canonical」等,也包括 AMP 、結構化資料等強化項目。不過,此報表未列出「參照網頁」和「行動裝置可用性」,但考慮到強化項目本身在 GSC 另有報表可以檢查其狀況,因此此報表就實用性而言還是很高。
可以看到,這外掛程式可以在一張表格裡一口氣列出大量網址的檢索、索引資料,執行時間比 GSC 更快、更有效率,非常適合大量查看頁面檢索及索引狀況。況且,表格還包含成效報表的點擊、曝光等基礎數據,上圖【步驟2】的「Group By」如把 Query 也納入匯出範圍的話,還可以作更完整的進站關鍵字分析,可說是 GSC 的一大輔助工具。
由於本文的主題是網址審查工具,因為省略介紹很多 Search Analytics for Sheets 的強大功能,對這個官方外掛有興趣的朋友可以參考 Harris 先生的教學文章。
工具2:Screaming Frog 串接 GSC 帳戶(免費版有數量限制)
我們也可以使用 SEO 界最強大工具之一的 Screaming Frog ,通過串接 GSC 所在的 Google 帳號,也可以匯入網址審查工具相關的資料。
- 開啟設定頁面
工具列依序點擊「Confriguration>API Acess>Google Search Console」,
- 串接 GSC 、網址審查工具
在跳出視窗點擊「Connect to NEW Account」,這時會跳出瀏器頁面,請選擇資源所屬的 Google 帳號並作授權。接著切換至「URL Inspection」頁籤,勾選「Enable Inspection Tool」、「Use Multiple Property 」,串接網址審查工具。
- 串接成功
現在在 Screaming Frog 會多出一個「API」的狀態欄,接著再按 Start 開始爬取網站。由於串接 API ,因此工具運行的時間會比平常稍久一點,需要一點點耐性。
- 搜爬完畢後,可以看到會多出與 GSC 相關的欄位
為便於使用數據,可點擊 Export 將表格資料匯出為 csv 檔或上傳至 Google Drvie 中,方便進一步分析。
重點整理 Summary
- 網址審查工具反映 Google 官方對資源內不同網址檢索、索引的處理方法,以這些資料為基礎可檢討網站的相關問題,如:網站架構安排、內部連結布局、重複內容處理等;
- 使用「測試線上網址」功能,可模擬爬蟲頁面的渲染結果,了解網站應用的技術在 Google 眼中是否具備「可見性」、「符合收錄標準」、「可否被爬取」;
- 要注意「 site:url 」搜尋指令與網址審查工具兩者的結果存在落差;
- 網址審查工具、site: 用途不同,可互補不足,但均無法取代對方;
- 可以使用 Search Analytics for Sheets 或 Screaming Frog 一口氣匯出整站的資料,方便分析相關情況。
參考資料
- 網址檢查工具 – Search Console說明
- 為什麼 Google 搜尋找不到我的網頁? – Google 官方文件
- 如何確認網頁被 Google 索引(index)了?三個確認方法及強化作法,搞定索引問題! – Frank Chiu
- 學習使用Site指令,診斷《 Google索引 》狀況 – Harris 先生
- Google Search Console URL Inspection Tool: Ultimate Guide – ContentKing
- How to use the URL Inspection Tool – JC Chouinard
- How To Check the Indexing Status of a Large Website – Onely
- My Ultimate Guide to Indexing SEO Isn’t Indexed – Onely
- SEO Test: Site Command – Dejan Marketing