BigQuery-打造機器學習

BigQuery教學|BigQuery預測GA4數據

BigQuery除了可以幫GA4數據保存以外,他也提供數據應用的方式,其中包含SQL的深度數據分析,我想最讓人期待的應該是機器學習,利用現有的數據進行未來的預測。本篇文章會透過BigQueryML教你打造數據預測模型。務必看這一篇文章前,GA4已經有做好與BigQuery的串接,且有一定量的數據可進行模型製作。

本篇內容需要對SQL、PYTHON一定的深度,以進行機器學習(ML)模型的打造。

教學前需知

甚麼是機器學習 (Machine Learning)

透過數學公式將目前有的數據 (已清理),進行模型的訓練,以及預測。當未來如果有新的資料時,就可以透過你的模型,將數據置入,並且透過打造好的模型,進行數據預測。題外話,其實這一項功能在GA4內建就有。

開始付款專案

開始bigquery付款專案

開始使用BigQuery時,務必確認開啟專案的付款模式。BigQueryAPI, BigQueryML都需要在已經開啟付款的專案下進行。

BigQuery 機器學習

確立想要預測的數據

本篇透過消費者在網站上的停留、事件行為,進行「是否會購買」的數據預測。如果你有其他的想要進行預測的,都可以透過查詢SQL調閱對應的資料,接著最後在於SQL最上方創立一個VIEW的虛擬表格,以提供下一步驟機器學習的數據導入。

sql-bigquery查詢

創立view

創立view目的是於下一步,需要將數據導入模型供與學習,增加效率、畫面簡潔。VIEW可以提供SQL查詢時的效率、以及安全性,他的概念是產生一張虛擬資料表,view這張表示不存在的,但是裡面的資料卻是可以查詢、進行結構變更。

例如上面的例子。因為有上百行的SQL查詢,我就先創立view,在後續我就只要打上以下,就可以代替上百行程式碼的查詢。

創立好沒問題後,你可以看到左邊選單中的資料叢集下,已經多一個我創立好的VIEW (ga_view)。

SQL創立VIEW

下圖則是將view的資料表進行資料的查詢。可以看到只打上一行,就可以顯示我要的資料。

查詢SQL

建立機器學習模型

透過以下語法,引入我剛剛建立view的數據,可以看到第六行,就是只有一行,而不是上百行很負責的SQL查詢。都輸入好後就直接按下執行,BigQuery就會開始從view導入數據,進行機器學習的模型訓練。

BigQuery提供以下的ML模型,詳情可以直接參考Google BigQuery的官方文件,讓我們可以進行預測數據。

  • 線性迴歸用於預測。 例如,此模型可以預測給定日期的商品銷售額。 標籤為實值,也就是說,標籤不能為正無窮大、負無窮大或 NaN(非數字)。
  • 邏輯迴歸用於對兩個或多個可能值進行分類,例如輸入是 low-value、medium-value 還是 high-value。 標籤最多可包含 50 個唯一值。
  • K-means 聚類用於資料細分。 例如,此模型可識別客戶細分。 K-means 是一種非監督式學習技術,因此模型訓練不需要標籤,也不需要為訓練或評估拆分資料。
  • 矩陣分解用於建立產品推薦系統。 您可以使用歷史客戶行為、交易和產品評分來建立產品推薦,然後使用這些推薦來打造個人化的客戶體驗。
  • 主成分分析 (PCA) 是計算主成分並使用主成分來轉換資料的過程。 它通常用於資料降維,具體方法是將每個資料點僅投影到前幾個主要成分上,從而獲得維度較低的數據,並保留盡可能多的資料差異性。
bigquery模型訓練

下方是BigQuery進行模型訓練的情況。

bigquery模型訓練

完成後,這一個ga4_purchase_model會出現在你的左列選單中,可以供未來使用。請注意,機器學習的範圍會關於統計學很多專有名詞,也需要先判斷這個模型的預測能力好壞,如果預測能力不好,就表示你在第一步選擇特徵時,沒有挑選到核心關鍵,那就務必透過修改最一開始SQL的查詢,找出關鍵的特徵,提高模型訓練的準確度。

建議剛開始接觸機器學習,可以直接以「預測資料vs實際資料」的情形比較,自然就會比較簡單好懂。

bigquery模型訓練
bigquery模型訓練

查看一下模型表現概況,主要看一下模型的預測能力好不好,通常會看一下左邊那一排的指標 。

  1. 查全率(Recall):
    表示真實正類樣本中,被模型正確預測為正的比例。
  2. 查準率(Precision):
    表示模型預測的正樣本中,真正正確的比例。
  3. 準確率(Accuracy):
    表示模型正確預測的總樣本數占總樣本數的比例。
  4. F1 分數(F1 Score):
    精確度和喚回度的調和平均值,用於平衡精確度和喚回度之間的關係。
  5. 對數損失(Log Loss):
    用來評估分類模型預測概率的指標,值越小表示模型預測的概率越準確。另外也可以用cost function/ loss function來衡量預測的準確度,
  6. ROC AUC:
    Receiver Operating Characteristic (ROC) 曲線下的面積,用來評估模型分類預測的能力。ROC 曲線是以假正率(False Positive Rate)為橫軸,真正率(True Positive Rate,即查全率)為縱軸的曲線,ROC AUC 值越接近1,模型性能越好。
bigquery模型的預測能力

BigQueryML預測結果

可以透過呼叫模型,查看模型對於實際數據的預測。基本上準確度超高,可以直接做其他數據的預測。

BigQueryML預測結果

總結

BigQuery雖然常常說可以拿來永久保存數據,但我認為最有價值的還是對於數據應用、深度數據分析,以及本篇文章所教機器學習模型的打造。機器學習的應用,取局於個人數據分析的思維,包括你要預測甚麼資料,如何找出關鍵特徵,並訓練模型等,具有多元玩法,將數據玩出不一樣的可行性。

更多文章

Looker Studio

  1. Looker Studio教學|Looker Studio 公式|電商指標
  2. Looker Studio教學|5個Looker Studio 混和資料功能
  3. Looker Studio 教學|指標維度是甚麼
  4. Looker Studio 教學|數據工程師帶你從0學Looker Studio
  5. Looker Studio教學|導入臉書廣告數據|Adveronix 免費工具

GA4

  1. GA4教學| 數據保留多久? 延長GA4數據保留時間?
  2. GA4教學|Measurment Protocol 實例
  3. GA4教學|GA4 如果有Not Set該怎麼辦
  4. GA4教學|GA4閾值門檻|GA4資料不正確
  5. GA4教學|GA4常見來源判定順序
  6. GA4教學|如何處理GA4重複事件
  7. GA4教學|自訂探索報表使用解說介紹|洞察來源unassigned
  8. GA4教學|GA4報表出現Unassigned如何解決
  9. GA4教學|排除金物流網域|Referrer必備知識
  10. GA4教學| 一定要知道的GA4資料設定

GTM

  1. GTM教學|GTM觸發條件常失敗
  2. GTM教學|設定 Consent Mode 同意聲明模式
  3. GTM教學|GTM問題總整理
  4. GTM教學|設定臉書像素|常見Meta問題總整理
  5. GTM教學|WordPress表單驗證事件|GA4追蹤教學
  6. GTM教學|手動設定GCP SERVER伺服器配置
  7. GTM教學|臉書像素重複事件怎麼解決
  8. GTM教學|GTM常用變數中文解說
  9. GTM教學|伺服器追蹤|自訂網域追蹤
  10. GTM教學|伺服器追蹤教學4|Http解說
  11. GTM教學|追蹤來自部落格轉換成效
  12. GTM教學|伺服器追蹤教學3 | Facebook轉換Capi設定
  13. GTM教學|伺服器追蹤教學2 | GA4事件設定
  14. GTM教學|伺服器追蹤教學 | 伺服器配置設定
  15. GTM教學|Tiktok廣告電子商務埋設大全3|廣告代碼埋設
  16. GTM教學|Tiktok廣告電商埋設2
  17. GTM教學|廣告電商埋設1|電商必要參數抓取
  18. GTM教學|電商埋設5|GA4電商埋設
  19. GTM教學|電子商務埋設大全4|GA4電子商務完整埋設
  20. GTM教學|GTM電商埋設3|抓取ItemName
  21. GTM教學|GTM電商埋設2|抓取ItemID
  22. GTM教學|電商埋設1|抓取Value
  23. GTM教學|提升廣告成效|Adblocker阻擋原理
  24. GTM教學|GTAG部署方式三大整理
  25. GTM教學|Google Ads 強轉換 | 購買金額
  26. GTM教學|自訂網址追蹤|不是只有「UTM」才能做網址追蹤
  27. GTM教學|AutoEvent追蹤使用者點選的圖片
  28. GTM教學|CSS Selector抓取表格的值
  29. GTM教學|了解網站熱門頁面|GTM追蹤點擊事件
  30. GTM教學|埋設事件|確認GA4有無收到事件
  31. GTM教學|自訂網址追蹤|不是只有「UTM」才能做網址追蹤
  32. GTM教學|3分鐘檢查GA4事件重複錯誤
  33. GTM教學|GA4電子商務事件埋設範本
  34. GTM教學|DOM抓取電商中的轉換價值
  35. GTM教學|新的GTM容器一定要做這設定
  36. GTM教學|設定GA4事件大全
  37. GTM教學|推薦GTM範本|全新DataLayer寫入方式
  38. GTM教學|網站計時器埋設|抓出使用者進站停留時間
  39. GTM教學|如何辨別是否網站為SPA站
  40. GTM教學|名單型網站追蹤|Thankyou Page 填寫表單事件
  41. GTM教學|網站通話追蹤|臉書私訊、加LINE
  42. GTM教學|自訂網址追蹤|不是只有「UTM」才能做網址追蹤

BigQuery

  1. BigQuery教學|BigQuery預測GA4數據
  2. BigQuery教學|視覺化報表怎麼製作
  3. BigQuery教學|基礎必備語法|免費BigQuery資料導入
  4. BigQuery教學|串接BIgQuery | BIgQuery費用

其他

  1. 臉書粉絲專頁預覽連結無法顯示|已解決
  2. LINE Notify|Python串接教學|如何使用LINE Notify 自訂通知
  3. 如何查看網站(CMS)用哪個平台

error: