GA4 報表識別資訊 Reporting Identity Google Signal 信號 資料閾值 data threshold
Google Analytics 數位行銷

[GA4] Google Signal 將從報表識別資訊 (Reporting Identity) 中移除,以改善資料閾值

商業,創業,業務,職涯,美食,葡萄酒,閱讀,網路科技。

從 Larry 創業以及商業的經驗,希望以白話的口吻,介紹給大家這個商業的世界。

FB粉專會頻繁地更新 Larry 對於商業、社會、人生的觀察與心得,歡迎大家追蹤互動~

前幾天接到一封 GA 的通知信,內容是 2024/02/12 開始,Google Signal 將會從「報表識別資訊」中移除。

這裡我想先討論一下,什麼是「報表識別資訊」(Reporting Identity)?

首先,傳統 GA 是發 cookie 到使用者的瀏覽器,如果下次使用者打開同一網站,相同 cookie 會傳回 GA,這樣 GA 就認得是同一使用者,基本上是這個概念。

讀者有興趣可以稍微看一下本站之前的文章,會對傳統 GA 使用者的判定,比較有感覺。
工作階段與使用者
從 Google Ads 的 gclid 來看 Analytics 工作階段、流量來源、新訪客與回訪者

當然,上述講的是傳統 GA 的方式,第三方 cookie 停用後,GA 會用其他方式判斷使用者。我們先複習了一下傳統 GA 的方式,再來討論這次的公告,會比較有前後脈絡。

因為傳統 GA 是用使用者的瀏覽器 (裡面的cookie) 來判斷是否為同一使用者。如果使用者是跨裝置,例如分別用電腦和手機瀏覽同一網站,該網站的 GA 會認為是兩個使用者。

https://support.google.com/analytics/answer/10976610
要解決這個問題,GA 提供了 4 種方式

  1. User-ID
  2. Google Signal
  3. Device ID
  4. Modeling

上面每一個方法都稱為 Identity Space。GA 報表使用的 Identity Space,就稱為報表識別資訊 (Reporting Identity)。以下簡介一下這四種方法。

User-ID 是網站端自行爲使用者建立一串ID。當使用者登入網站時,GA 追蹤碼啟動時,再將這串ID 傳回給GA。同一使用者皆為同樣一串ID,ID的產生,追蹤碼的修改,都由網站主來執行。

Google Signal 則是將網站收集到的 GA 資料,與已登入 Google 帳戶並開啟「廣告個人化」功能的使用者建立關聯,去猜測每一個 GA 收集到的用戶,他是哪一個 Google 帳戶的使用者。

這樣同一人,在不同的裝置瀏覽網站 (有不同的cookie),傳統 GA 是判定為不同使用者。如果原本 GA 認定的不同使用者 (多個),發現與某一個 Google 帳戶有關聯了,GA 可以推測這些使用者是不是同一人。

Google Signal 不是新東西了,早在 2019 年本站就有一篇文章提到 Google Signal
連結 Analytics 和 Ads 帳戶

下一個 Device ID,就是傳統 GA 所謂的 cookie。如果使用者拒絕使用 cookie,那 GA 只能藉由其他接受 cookie 的使用者,去模擬並猜測沒有 cookie 的使用者,這就是 Modeling (模擬)。

以上就是四種 Identity Spaces。

報表識別資訊在 GA 後台的位置

到你的 GA 後台,左側 menu 齒輪符號「管理」→ 資料顯示 → 報表識別資訊。可以選「混合」或「已列為觀察項目」,點開灰色的全部顯示小字,還可以選「依據裝置」,所以總共有三個選項。

選「混合」,GA 就會從上面 4 種 Identity Space,依序往下找。例如,沒有 User-ID 就用 Google Signal,以此類推。「已列為觀察項目」則是只使用前 3 種 Identity Space,不包含 Modeling (模擬)。

「依據裝置」則是只使用 Device ID,其他都不看。

不管你選擇的是「混合」,還是「已列為觀察項目」,一般網站沒有特別建立 User-ID,所以依序往下就是 Google Signal。所以目前 (2023年底) 我們看到的 GA 報表大多數是 Google Signal 產生的。

https://support.google.com/analytics/answer/9164320#100223
GA 在 2023/10/2 公告:到你的 GA 後台,左側 menu 齒輪符號「管理」→ 資料收集與修改 → 資料收集,裡面有一個「在報表識別資訊中加入 Google 信號」。這份公告是建議將其關閉,會有助於降低資料閾值

那什麼是資料閾值 (data thresholds)?

https://support.google.com/analytics/answer/9383630
資料閾值就是在 GA 報表中,太少的數值 GA 有可能不顯示或隱蓋資訊。此舉是防止網站主從 GA 資料的客層、興趣等資訊,反推出個別使用者是誰 (具體的人)。

資料閾值會造成一些問題。例如,當你有某個廣告活動的轉換不多,或是某個客群的轉換不多,因為資料閾值的關係,不顯示,造成轉換率為 0。或是只顯示部分,造成極為低估的轉換率。

另外舉一個例子,當你細分使用者客層時,使用者會少很多。因為細分使用者客層時,每個細分指標裡的值很少,GA 可能會不顯示或只顯示部分。

所以如何降低資料閾值變成是一個問題

相信很多讀者在看 GA 後台的報表,例如流量或使用者報表時,報表右上角會有一個接近紅色的小警示符號。這就是說明該報表受資料閾值所影響。

https://support.google.com/analytics/answer/9383630
上面提到,關閉「在報表識別資訊中加入 Google 信號」有助於降低資料閾值。當你關閉後,如這份 9383630 文件中接近紅色的警示符號,就會變成綠色符號。你可以關閉這個選項後,再看一下你 GA 後台報表的右上角,應該會變成綠色。

https://support.google.com/analytics/answer/9164320#100223
Google 2023/10/2 的公告也提到,關閉這個選項後,GA 仍然會收集 Google Signal 作為應用。但在某些圖表忽略某些使用者資料,以降低資料閾值。

忽略某些使用者資料,當數據少時,網站主就不容易反推具體的人是誰,所以報表就不用設限一個資料閾值 (data threshold)。

還記得上方「報表識別資訊」的 4 種方法。一般網站不會有 User-ID,如果你又將「在報表識別資訊中加入 Google 信號」關閉,那依順序就是使用 Device ID (裝置ID)。

在 2023/10/2 公告「在報表識別資訊中加入 Google 信號」上線之前,有人建議齒輪符號「管理」→ 資料顯示 → 報表識別資訊,那裡選「依據裝置」。這樣只使用裝置ID,與上述效果是一樣的。

結論

以上走了一遍「報表識別資訊」的前因後果,與瞭解了「資料閾值」的問題。

目前 (2023年底) 需要手動關閉「在報表識別資訊中加入 Google 信號」。也請讀者注意 2024/02/12 開始,Google Signal 將會從「報表識別資訊」中移除。

屆時應該「在報表識別資訊中加入 Google 信號」這個選項也會被移除了。

商業,創業,業務,職涯,美食,葡萄酒,閱讀,網路科技。

從 Larry 創業以及商業的經驗,希望以白話的口吻,介紹給大家這個商業的世界。

FB粉專會頻繁地更新 Larry 對於商業、社會、人生的觀察與心得,歡迎大家追蹤互動~