數位行銷與電商資料分析範例

數位行銷與電商資料分析 | RFM模組建立與分析 | 數據分析與推測

數位行銷與電商資料分析(範例)

Step 1. Import 套件

Import 套件

Step 2. 觀察資料 pd.info()  pd.head(), 讀取資料pd.read_csv(),查遺漏值(沒有資料)和異常值

觀察數據

從df.info()資料中我們可以看得出來各欄位名稱、欄位的資料型態、資料筆數和總資料數量541,909筆資料;看得出來類似EXCEL的格式。

一般會把可以把空格內有遺漏的資料直接刪除掉,我這邊就先把遺漏的資料找出來看,是不是真的要刪除掉,因為記錄的資料,可能當時忘記填入或不知道怎麼填資料,所以留下空格變成遺漏的資料。

再從df.describe().T 了解一下有數字的平均值、最大值、最小值

再從df.describe().T 了解一下有數字的平均值、最大值、最小值

我先從客戶ID來找看看是否有遺漏值,發現最後面一筆的資料可能是電商的快遞費,另外一點,單價很高(我個人認為不太對)…所以等一下要再查一下價格的資料。

來找看看是否有遺漏值

再查一下Description的欄位遺漏值”nan”是什麼內容,拿出來後發現這個的內容基本上沒有什麼多大的作用因為價格是0、客戶也沒資料,但我對StockCode是22139有興趣,因為Quantity的值是56,有點不尋常。

查空值nan

就在順手查了一下StockCode 是22139的所以有資料,發現以下紅色框內價格是0可能是在電商網站上客戶有下單,但電商未出貨(這是電商內部的資料,所以我猜是只有放進購物籃,沒有走付款流程,所以記錄”nan”,另一個則是在amazon的記錄也是一樣,也有可能是贈品);另一個Quantity的值是-5,這可能是退貨。

電商網站上客戶下單

數位資產

”數位資產”,雖然不起眼但是很重要,一般人只是把它當作紀錄資料,但是如果認真的去分析這些紀錄的資料,你將會發現很多數據對於提高營業額、生產力和客戶與產品的關係是非常有意義的訊息。

建立數位資產的優點: 

  • 提高營業額:企業可以利用數位資產來分析客戶行為,以了解客戶需求和偏好,從而開發出更符合客戶需求的產品和服務,提高營業額。
  • 提高生產力:企業可以利用數位資產來自動化流程,提高工作效率。
  • 客戶分類:企業可以利用數位資產來分類客戶,提供更適當的客戶服務。

講了很多次數據很重要的事情,那現在就由我來分析範例,這個範例是來自UCI dataset(加州大學爾灣分校的資料庫),這是一個電商平台工作人員記錄的資料,從電商的資料中我們可以知道541,909筆的資料,很難用EXCEL來處理資料裡面的資訊,但是pandas可以協助我們很快整理出資料中的資訊,再用matplotlib 、seaborn來做成圖表,這些資訊在電商平台內可以提供給行政單位、業務單位、生產單位、採購單位,做為日後提高營運計劃的重要依據。

範例: Online Retails Purchase  copy from: https://archive.ics.uci.edu/ml/datasets/Online+Retail

LINE 精準行銷 MarTech行銷技術 LINE 預約系統 業務行銷必看提高業績

Tip:

如果把遺漏值直接drop,可能就無法了解整個資料的狀況因為遺漏值應該是會有原因才會遺漏,我們從遺漏值資料裡,我們又查到其他相關的資訊,例如:快遞費、商品有在亞馬遜販售、也有產品被退回,這些資料整理出來提供經營電商相當重要的訊息。

所以我把所有商品描述內容的資訊全部整理出來,有4224 種內容描述

內容的資訊

再利用差異來分類 如下,出現異常狀況的描述有128種

差異來分類

轉出DataFrame的格式,總共有筆異常資料493筆資料,這資料先排除(如果可以拿這些資料去問原因)

轉出DataFrame的格式

另外;英國和非英國的訂單差異很大超過10倍!也要分開來分析

訂單差異很大

接下來我們清理一些數據空值,包括數據那有負數(Quantity<0應該是退貨)的存在,經過整理和清洗數據後,數據從原本541,909筆資料變成397,924筆資料。

清理一些數據空值

Step 3.找前15大訂單來自那些國家(先排除英國,因為UK下單量最大,可能是這個電商主要的市場客戶是以英國為主,我們先觀察英國以外的地區)

訂單

從這張圖可以看得出來下訂單量的前15大國家

訂單量的前15大國家

把荷蘭的訂單狀況用圖表表示一下,因為我們沒有辦法從EXCEL裡面去查出他的異常數字,發現價格大部分是單價$25以下居多超過超過100以上我們要挑出來看一下,因為是離群體的數字

訂單價格分布

結果我們發現有四個異常的描述都不是和下單有關係

異常的描述都不是和下單有關係

Step 4 進入資料分析, 如下圖: 主要的營收來源,大部分是集中於$6塊錢以下的商品市場;$18塊錢以後的市場基本上是量很少的市場,所以要提高營業額,要對客戶來分析可能比較能夠找到我們要提高營業額的方法(從資料可以看得出來這家電商,主要的目標市場是英國和目標客戶是找低單價消費性產品都已經是相當明確);如下圖: 做了一個熱力圖heatmap讓大家知道各個欄位與營業額的關係,營業額和單價X數量的關係,但是這之前我們已經知道這大部分是屬於低單價的一個電商市場

低單價的一個電商市場

RFM模組建立與分析

Step 5 建立RFM( Recency、Frequency、Monetary)模組

  • Recency(上次消費的日期)

指的是最近一次顧客消費的時間,最好開始培養回購意願,因此持續針對這群人發放折價優惠或最新商品訊息。

  • Frequency(消費頻率)

消費頻率越高的人就越有可能是品牌的忠誠顧客,可以透過累積點數的行銷方式,回饋這群人並提高他們重複購買意願。

  • Monetary(消費金額)

消費金額的高或是利潤高的客戶,對公司營運是最有幫助,如果能培養成忠誠顧客,對公司經營將會有很大的幫助。

結合 Recency、Frequency、Monetary 三大因素,就是一個完整的顧客消費輪廓。有此依據將可利用分眾行銷,深入做精準行銷。

RFM model

最後我們將其分類為六大類,用圖形來表示更清楚

RFM的客戶分布

數據分析與推測

DATA IS POWER

數據分析是指對數據進行收集、整理、分析和視覺化,發現數據中的規律和趨勢。數據推測是指根據數據分析的結果,對未來可能發生的事件進行預測。

數據分析與數據推測的應用範圍非常廣泛:

  • 商業領域:市場分析、產品研發、客戶關係管理、財務分析等
  • 政府領域:社會治理、公共服務、經濟發展等
  • 科學領域:自然科學、社會科學、工程技術等

以下是數據分析與數據推測的方法:

  • 數據描述:對數據進行描述,包括數據的集中趨勢、迴歸程度、分布形態等。
  • 推斷分析:根據樣本數據對總體進行推斷,包括假設檢驗、回歸分析、聚類分析等。
  • 機器學習:利用數據來建立模型,對未來事件進行預測。

在進行數據分析與數據推測時,需要注意以下幾點:

  • 數據的品質:數據的品質是數據分析與數據推測做重要的依據,因此需要對數據進行嚴格的檢查和處理。
  • 模型的選擇:不同的模型適合不同的數據集和應用場景,因此需要選擇合適的模型。
  • 結果的解釋:數據分析與數據推測的結果需要進行合理的解釋,以避免誤導。

隨著大數據時代的到來,數據分析與數據預測將在各行各業得到更加廣泛的應用。