18143453325 在线咨询 在线咨询
18143453325 在线咨询
所在位置: 首页 > 营销资讯 > 电子商务 > 电商平台数据分析——基于淘宝用户行为数据

电商平台数据分析——基于淘宝用户行为数据

时间:2023-03-15 23:54:01 | 来源:电子商务

时间:2023-03-15 23:54:01 来源:电子商务

一、分析背景

在网络购物过程中,用户会产生浏览、收藏、加入购物车、购买这4种行为。它们之间没有明显的顺序,大部分用户只产生“浏览”行为,部分用户可能是通过推荐直达购物车、收藏页面,也有部分刚需用户会直接进入购买页面,从而跳过“浏览”这一步。多数情况下,用户的购物行为都是从“浏览”开始的,为了分析各种行为之间的关系,接下来将围绕阿里巴巴天池的“2017年淘宝用户行为数据(userbehavior.sql)”展开。

二、数据集的采集与清理

2.1 数据来源

数据集(userbehavior.sql)包含了2017年11月25日至2017年12月3日之间,有行为的约为一百万随机用户的所有行为(行为包括点击、购买、加购、喜欢)。

列名称说明
用户ID字符串类型,用户ID
商品ID字符串类型,商品ID
商品类目ID字符串类型,商品所属类目ID
行为类型字符串,枚举类型,包括(‘pv’,‘buy’,‘cart’,‘fav’)
时间戳整型,行为发生的时间戳
行为类型说明
pv商品详情页pv,等价于点击
buy商品购买
cart将商品加入购物车
fav收藏商品
通过navicatl运行SQL文件,查询该数据集的数据量以及用户人数,SQL语句如下:

得出结果:数据量为999856,用户人数为983

2.2 数据清理

2.2.1处理时间戳

新建列‘dates’,以‘年-月-日’格式显示, 新建列‘hours’,以‘时-分-秒’格式显示, 新建列‘datetime’,以‘年-月-日 时-分-秒’格式显示, 新建列‘weekday’,以数字显示星期几。SQL语句如下所示:

2.2.2查找重复值

user_id多数情况下是具有唯一性,但在本项目中user__id会出现多次行为的记录,因此无需进行处理。

2.2.3查找空值

对于空值,如果在数据量很大的情况下,对分析结果的影响可以忽略不计,因此直接删除即可,但在特定的情况下可使用平均值、权重较大的值进行填补。在userbehavior表中的user_id,item_id,category_id,behavior_type,timestamp都不存在空值,不需要进行处理。

2.2.4 剔除所需时间范围外的数据

根据所需的时间删除了44条不符合要求的数据。

三、数据分析

3.1分析目标

AIPL营销模型与漏斗分析法可以很好地将会员行为与相应的运营周期关联起来,其中A - Awareness 认知:浏览,I - Interested 兴趣:收藏、加购,P - Purchase 购买:购买,L - Loyalty 忠诚:复购。再根据用户行为类型(behavior_type),且为了便于分析,需要对表结构进行行列互换,SQL语句如下所示:

得出结果如下:

由于数据结果较少,可通过excel进行可视化,以下图所示:

总结:

根据AIPL漏斗图后,我们便可直观地发现用户运营的情况且获得分析目标:

a.【拉新环节 A→I】转化率为9.14%, 部分做得较差,可能拉新完成率较低,值得注意。将该问题列为优先级:重要紧急 P0

b.【客户首购 I→P 】转化率围殴22.97%,部分效果还可以,可以进一步挖掘用户购买转化路径。将该事项列为优先级:重要不紧急 P1

c.【客户复购 P→L】转化率为64.31%, 部分做得很好好,可以据此总结业务经验或复购规律,进一步推广应用。将该事项列为优先级:不重要不紧急 P2

3.2目标及其分析方法

3.2.1 A-I部分

此部分计划通过‘人货场’分析方法,解决‘A’认知用户到‘I’兴趣用户行为转化率低的问题。

3.2.1.1 人

‘人’的部分主要在于观察用户行为特点,以总结经验。此案例中,因为数据维度有限,会员自身行为相关的数据除了商品外就是时间。各时段AI 转化,SQL语句以及结果如下:

有很多不同的值。根据对比分析方法,我们需要比较基准——平均值,才知道这些转化率哪些高,哪些低。

因每个时段的浏览人数不同,为确保分析的结果有效,故需选择 浏览值大于平均值3735的时段来观察:在这些时段中, 我们认为转化率大于 平均值9.1%的时段,既是浏览人数多,又是转化率高的时段,即11点、15-17点、19点、22-23点。其中,23点为转化率大于10%,为最大值,可作为最佳投放时间。

3.2.1.2 货

此部分需要对人货匹配的情况进行分析,进而可针对性地将货品根据会员行为进行调整。

在分析之前,需要先对AI阶段涉及的总商品情况进行观察:

结果如图,共有60592款商品被有效浏览,用户共对5206款商品产生兴趣。

接下来,通过假设验证分析方法,基于有效浏览机产生兴趣的商品数差异较大的情况,提出假设:用户偏好的商品主要集中在少数商品,而大部分长尾商品则是被错误地推荐到用户。验证思路:

a. 将被浏览最多的前100款商品 以及 用户最感兴趣(即加购、收藏)的前100款商品 进行交叉查询。

b.如果交叉出的商品数较少,则假设成立。反之,则假设不成立。

以下SQL语句进行验证:

结果显示,仅有5款商品既是高浏览量,也是高收藏/加购的,故假设成立:用户偏好的商品主要集中在少数商品,而大部分长尾商品则是被错误地推荐到用户。进而可得出‘人货匹配’效率低的结论。

3.1.2.3 场
‘场’广义来说指的是与用户的触点,例如在线下零售业,则是门店; 在线上电商,则是在线店铺、平台、投放渠道等。从这个角度,分析此段时间淘宝平台的活动情况:

a. 结合业务经验,数据时间段在双十一之后,双十二之前,即是两个大促的中间节点

b. 查询2017年双十二的相关信息如下:

活动:天猫双12年终品牌盛典

预热时间:2017年12月7日00:00:00-2017年12月11日23:59:59;

上线时间:2017年12月12日00:00:00-2017年12月12日23:59:59。

c. 由活动时间可知,分析时间段处于双十二预热时间前夕的低潮期,客观上营销效果整体比较平淡,进而影响AI转化率。

3.1.2.4 小结

人:为提高转化率,可选择在 浏览值大于3735 且 转化率大于 9.1%的时间段加大投放力度;其中,23点为转化率大于10%,为最佳投放时间

货:人货匹配效率低,平台大部分商品为长尾商品,但它们并不能很好地吸引用户兴趣,需要进一步优化商品信息以提升转化率。

场:从平台活动周期角度来说,分析时间段正处于大促活动预热前的低潮期,此客观因素也在一定程度上导致转化率低。

3.2.2 I-P部分

有此前漏斗分析可知,平台用户复购率高达63%,也就是说用户只要突破0到1的消费,接下来就有63%的机会复购,所以此部分重点应放在如何提升I→P。

为了提高AI客户的购买转化率,可以通过高购买率客户与低购买率客户对比,挖掘高购买率客户特征,进而指导业务运营策略。

3.2.2.1 购买率高 vs 购买率低

结合二八原则,认为前20%为高购买率客户,后20%为低购买率客户。

由此前统计可知,分析数据共有386个客户,即20%分位为:

386*0.2 =77,即前77位客户为高购买率客户;

386-77 = 309,即309-386位的客户为低购买率客户

高购物率客户集中度为399。

低购物率客户集中度为96。

经上分析得出,以下结论:

a.高购买率客户浏览商品数36远小于低购买率客户浏览商品数117。
b.高购买率客户平均加购率11% 大于 低购买率客户平均加购率10%。

c.高购买率客户购买品类集中度399 远大于低购买率客户购买品类集中度96。

综上所述可得人群画像:高购买率人群浏览商品数少,但加购率高,大概率为决策型顾客,看对了商品就下手购买;而低购买率人群更多是纠结型顾客,需要反复浏览商品来确认最终想要的。此外,低购买率人群品类集中度高,可列出这些品类,有目的性地优化品类信息,减少用户浏览跳失率。

3.2.2.2 AIPL+RFM分析

为促进用户购买,需进行精细化用户运营,即可通过RFM模型分析方法实现。由于数据限制,并无用户购买金额数据,故此处可与AIPL模型结合,重新定义R、F、M:

R:客户最近一次购买离分析日期的距离,用以判断购买用户活跃状态

F:客户收藏、加购行为次数

M:客户购买行为次数

因此,RFM分群结果及人群特征如下:

a.重要价值用户(R高F高M高):用户处于购买活跃期,感兴趣的商品多,购买次数也多。

b.一般价值用户(R高F高M低):用户处于购买活跃期,感兴趣的商品多,购买次数少。

c.重要发展用户(R高F低M高):用户处于购买活跃期,感兴趣的商品少,购买次数多。

d.一般发展用户(R高F低M低):用户处于购买活跃期,感兴趣的商品少,购买次数少。

e.重要唤回用户(R低F高M高):用户已不活跃,感兴趣的商品多,购买次数也多。

f. 一般唤回用户(R低F高M低):用户已不活跃,感兴趣的商品多,购买次数少。

g.重要挽留用户(R低F低M高):用户已不活跃,感兴趣的商品少,购买次数多。

h.一般挽留用户(R低F低M低):用户已不活跃,感兴趣的商品少,购买次数少。

3.2.2.2.1 按以上定义,计算出每个客户的R、F、M值(图中结果省略其中部分)

3.2.2.2.2 为了划分R、F、M值的高 与低,这里采用常用的平均值法作为阈值

3.2.2.2.3 根据以上RFM阈值,及RFM定义,将每个客户划分到不同的用户价值组中。(图中结果省略其中部分)

3.2.2.2.4 统计各个组的用户数及用户占比,用于对用户运营现状进行分析,并给出运营策略方向。

如上图为RFM模型分组结果,对比分析需要对照组进行比照分析,因数据限制,此处结合业务经验进行判断:

a.“重要”型用户累计占比26.8%(3.1%+3.5%+7.4%+12.8%),符合二八规律。

b.从用户RFM转化路径角度来看:重要价值用户占比较少,而主要由一般价值用户、重要发展用户、重要唤回用户转化而来。

c.一般价值、重要唤回用户基数较多,可优先对两个人群进行“升级”。

d.重要发展用户数量少,需要从基数较多的一般发展用户转化,之后再考虑将重要发展转为重要价值。

3.2.3 P-L阶段

结合具体业务,复购分析的目的是为了优化用户触达策略,即何时何地向哪些已购用户推送什么商品可提升复购率。此案例中,受数据限制及考虑受众,暂不对商品推荐进行建模分析。将通过分析用户复购周期以解决业务中触达时间的问题。

现该部分问题转化为分析用户复购周期问题,对于此,从业务角度主要包括何时触达、触达多久两部分。

3.2.3.1何时触达

可通过计算用户平均回购周期,即可在用户发生购买行为后,在平均回购周期内对其进行营销触达。

a.通过以下语句先计算出每个用户每次消费的回购周期

如图所示,user_id 为100的用户 n_consume=2,回购周期=2天 即为期第二次消费时,与第一次消费间隔了2天,也就是说该用户在2天前进行了第一次消费。

b.基于以上查询结果,可以将每人次的回购周期进行平均,取得最终的 平均回购周期

如图所示,在用户购买行为后的2-3天内对其进行触达

3.2.3.2 触达多久

a.统计每个客户“首次消费日期”、“最后消费日期”后,相减即可算得每个客户的消费周期,命名为“最长消费间隔”。

b.基于上面的查询结果,按日期进行分组统计,计算得每天消费的客户平均最长消费间隔。

结果如图所示,在周六(11-25) 首购的客户,最长消费间隔最长为5.9天。

四、业务建议

4.1 【A→I】业务建议

——从“认知”到“兴趣”阶段的转化率过低

通过【人货场】分析,可得以下业务建议:

a.推广部门:优化投放策略,在A→I转化率高的时间点,尤其是23点加大投放力度,提升AI转化率,进而提升整体转化

b.产品部门:针对【人货匹配】效率低的问题,及时处理低转化率商品,总结高转化产品特性,开发新品

c.运营部门:针对【人货匹配】效率低的问题,参考高转化商品描述,优化产品标题、内容描述; 针对大促前低潮期,提出吸引性促销政策,提高此阶段销售

4.2【I→P】业务建议

——转化效果较为可以,可以进一步挖掘用户购买转化路径

通过分析,可得建议如下:

4.2.1 分析【高购买率用户特征】

用户部门:

针对高购买率客户,即决策型客户,可能更多为‘长尾商品领域’,可配合精准商品推荐模型,触达优质长尾商品,提升购买率。

针对低购买率客户,即纠结型,可能更多为‘热门商品领域’,触达热门商品,提高购买率。

4.2.2 用【AIPL+RFM】分析方法

对于用户部门,根据此前结合用户RFM转化路径分析结论制定提升策略:

a.优先级P0

重要价值用户(R高F高M高)维护:用户处于购买活跃期,感兴趣的商品多,购买次数也多 → 针对兴趣产品,保持一定频率的触达,持续维护。

一般价值用户(R高F高M低):用户处于购买活跃期,感兴趣的商品多,购买次数少 → 针对该部分客户,目的就是要让他们购买,所以可以和运营部门沟通,降低利润,给出有力折扣促进购买,进而转为重要价值用户。

b.优先级P1

一般发展用户(R高F低M低):用户处于购买活跃期,感兴趣的商品少,购买次数少 → 可通过商品组合推荐,即通过连带提升该人群购买频次,进而转为重要发展用户。

重要发展用户(R高F低M高):用户处于购买活跃期,感兴趣的商品少,购买次数多 → 通过关联算法,找出与兴趣商品关联高的商品进行推荐触达,提高用户收藏、加购数,进而转为重要价值用户。

4.3【P→L】业务建议

——从“购买”到“忠诚”阶段的转化率高。

通过【用户复购分析】后,可得以下建议:

用户部门:针对用户复购周期特性,客户消费后2-3天内结合回馈手段及时进行触达; 此外,对于周六首购客户,最长消费周期达6天,在此周期内可对消费客户连续优惠触达。

关键词:数据,用户,平台,分析

74
73
25
news

版权所有© 亿企邦 1997-2025 保留一切法律许可权利。

为了最佳展示效果,本站不支持IE9及以下版本的浏览器,建议您使用谷歌Chrome浏览器。 点击下载Chrome浏览器
关闭