18143453325 在线咨询 在线咨询
18143453325 在线咨询
所在位置: 首页 > 营销资讯 > 电子商务 > 电商平台用户数据分析

电商平台用户数据分析

时间:2023-03-15 23:00:01 | 来源:电子商务

时间:2023-03-15 23:00:01 来源:电子商务

目录

一、项目背景及项目分析目的

  1. 项目背景介绍
UserBehavior是阿里巴巴提供的一个淘宝用户行为数据集,该数据集包含了2017年11月25日至2017年12月3日之间,有行为的约一百万随机用户的所有行为(行为包括点击、购买、加购、喜欢)。

推荐系统中用户对物品的反馈分为显式和隐式反馈,显式反馈 (如评分、评级) 或单一的隐式反馈 (如浏览、点击、加入购物车)。 隐式反馈推荐是推荐系统通过对内容和用户行为的分析,建立适当的模型,帮助用户从海量的数据中找到自己感兴趣的内容。推荐系统中用户的行为反馈包括显式反馈和隐式反馈,隐式反馈信息在推荐系统算法中被广泛应用。隐式反馈体现着用户的兴趣爱好,对隐式反馈信息的挖掘有助于提高推荐系统的效果,以更好地设计推荐系统。
2. 项目分析目的

通过对该数据集的分析,给用户推荐精准的隐式反馈推荐。从用户维度来讲,我们能快速满足用户需求,提高用户忠诚度。从平台角度来看,能给平台带来大量忠实用户,平且提高平台知名度,以及帮助平台实现长久盈利。

二、理解数据

  1. 数据来源:
2. 理解字段

数据集介绍,且该数据集是2017年11月25日至2017年12月3日之间的数据

3. 字段介绍

其中行为类型,分为共有四种,分别是

4. 数据集大小说明

三、数据清洗

  1. 修改列名
我们将数据集导入Navicat以后发现,我们没有列名,数据集的第一行就是我们的数据,因此我们要手动为数据集添加列名,以便后来更好的处理数据。

列名修改结果如下

2. 缺失值处理

首先,我们先来确认,数据中是否存在缺失值

select count(*), count(UserID), count(Product_ID), count(Product_Category_ID), count(Behavior),count(Timestamp)from Userbehavior;我们在当初定义表的时候,选择了not null选项,现在在用count计算时,会发现,我们时没有缺失值的。

可是如果我们在未来工作中,碰到需要处理缺失值的时候,我们应该怎么做呢?

一般有两种处理方式,第一种,是删除缺失值,即,删除缺失值所在行,code如下

delete from 表名 where 列名 is null;第二种,是填充缺失值

select coalesce(列名, 要填充的值) from 表名;3. 将时间戳转换和拆分为日期和时间

首先,从时间戳中抽取日期

alter table Userbehavior add 日期 varchar(255);update Userbehaviorset 日期=from_unixtime(时间戳,'%Y-%m-%d')修改后结果如图

然后,从时间戳中抽取时间

alter table Userbehavior add Time varchar(255);update Userbehaviorset Time =from_unixtime(时间戳,'%H:%i:%s')修改结果如图

这样就能更好,更直观的帮助我们理解数据啦。

4. 异常值处理

我们在描述数据集时提到过,该数据时2017年11月25日至2017年12月3日之间的数据,因此,若是在此时间段外的数据,应该就是我们需要删除的异常值了。

DELETE FROM userbehavior WHERE 日期 not BETWEEN '2017-11-25' AND '2017-12-03';这样就删除了,不在我们需要的日期范围内的数据啦

我们再一次检查的时候,就会发现比之前少了三行数据

四、业务分析思路

我们将从四个方面对数据集进行分析

产品,业务流程,用户以及促销四个方面来对数据集进行分析

  1. 分析思路:
产品方面分析:热销产品和滞销产品分别有哪些,导致热销或滞销的的原因可能是哪些原因?

分析方法: 群组分析法 ,假设检验分析法

业务流程转化率分析:通过用户的购买流程,确定各个环节的流失率,留存率

分析方法:漏斗分析法

用户的行为习惯分析:以PV、UV等指标,找出用户最活跃的日期以及每天活跃时间段。

分析方法: 群组分析法 ,假设检验分析法


产品方面分析

我们将数据清洗整理后,我们先来看看我们的热销产品有哪些

SELECT product_category_ID,COUNT(product_category_ID)AS Num FROM userbehaviorGROUP BY product_category_IDORDER BY Num DESCLIMIT 10;我们选取了热销产品的TOP10来看,但是这里有一个问题,这个榜是包含了用户所有行为的表格,包括加购,收藏,点击和购买,我们拆开来看看,每个环节的情况。

select Product_Category_ID,COUNT(product_category_id)AS Num,(Select COUNT(u2.product_category_id) from userbehavior u2 WHERE u1.product_category_id = u2.Product_Category_ID AND Behavior = 'pv') as pv,(Select COUNT(u2.product_category_id) from userbehavior u2 WHERE u1.product_category_id = u2.Product_Category_ID AND Behavior = 'cart') as cart,(Select COUNT(u2.product_category_id) from userbehavior u2 WHERE u1.product_category_id = u2.Product_Category_ID AND Behavior = 'fav') as fav,(Select COUNT(u2.product_category_id) from userbehavior u2 WHERE u1.product_category_id = u2.Product_Category_ID AND Behavior = 'buy') as buyFrom userbehavior u1Group by u1.product_category_idOrder By Num DescLIMIT 10;我们可以看到,毫不意外,用户主要的行为还是在点击量上。

我们来看这个分析结果,可以发现,针对不同类别的产品,我们可以使用不同的策略。鉴于,商家最后追求的都是成交量,因此,我们将转化率列出来,用户的点击量和购买量之间的比。方便我们更直观的观察数据。

select Product_Category_ID,COUNT(product_category_id)AS Sum,(Select COUNT(u2.product_category_id) from userbehavior u2 WHERE u1.product_category_id = u2.Product_Category_ID AND Behavior = 'pv') as pv,(Select COUNT(u2.product_category_id) from userbehavior u2 WHERE u1.product_category_id = u2.Product_Category_ID AND Behavior = 'cart') as cart,(Select COUNT(u2.product_category_id) from userbehavior u2 WHERE u1.product_category_id = u2.Product_Category_ID AND Behavior = 'fav') as fav,(Select COUNT(u2.product_category_id) from userbehavior u2 WHERE u1.product_category_id = u2.Product_Category_ID AND Behavior = 'buy') as buy,CONCAT(ROUND(((Select COUNT(u2.product_category_id) from userbehavior u2 WHERE u1.product_category_id = u2.Product_Category_ID AND Behavior = 'buy')/(Select COUNT(u2.product_category_id) from userbehavior u2 WHERE u1.product_category_id = u2.Product_Category_ID AND Behavior = 'pv')*100),2),'%') AS changesFrom userbehavior u1Group by u1.product_category_idOrder By sum DescLIMIT 10; 我们发现,行为总数最多的商品种类3607361,成交率是0.那么很显然,产品的高点击量本质上毫无意义,因为不能给店铺带来收益。在高点击量的情况下,我们能够看出,该产品的获客能力是很强的,证明公司的推广策略本身很有效,但是用户点击进来后的,加购,收藏,和购买行为都在我们上面展示的10条数据里面,并不算是偏高的。由此说明,用户点击进来后,没有找到自己想要的,或者说,用户点击来发现产品不是自己期望的。该产品就需要在这种方面进行改善。

我们再来看看购买量排名前十的产品品类的状况。

由上面数据可以看出,转化率最高的能达到150%的890050,就说明,用户点击进入店铺后,还浏览的店铺的其他商品,并且促成了成交。这个种类的策略偏向也很明显了,pv只有两个,后期产品的策略选择上,应该着重放在获客情况上面。

业务流程转化率分析

通过用户的购买流程,确定各个环节的流失率,留存率

用户达成购买行为可能存在以下几种路径

  1. 点击 - 购买
SELECT CONCAT(ROUND(((SELECT COUNT(UserID) FROM userbehavior WHERE Behavior = 'pv')-(SELECT COUNT(UserID)FROM userbehavior WHERE Behavior = 'buy'))/COUNT(*)*100,2),'%') AS 加购流失率FROM userbehavior;我们看到这个用户流失率高达88.07%,我们先来看看剩下几个路径,再来一起对比。

2. 点击 - 加购 - 购买

SELECT CONCAT(ROUND(((SELECT COUNT(UserID) FROM userbehavior WHERE Behavior = 'pv')-(SELECT COUNT(UserID)FROM userbehavior WHERE Behavior = 'cart'))/COUNT(*)*100,2),'%') AS 加购流失率,CONCAT(ROUND(((SELECT COUNT(UserID) FROM userbehavior WHERE Behavior = 'cart')-(SELECT COUNT(UserID)FROM userbehavior WHERE Behavior = 'buy'))/COUNT(*)*100,2),'%') AS 购买流失率FROM userbehavior;加购流失率:84.48% 加购后购买流失率 - 3.58%

3. 点击 - 收藏 - 购买

SELECT CONCAT(ROUND(((SELECT COUNT(UserID) FROM userbehavior WHERE Behavior = 'pv')-(SELECT COUNT(UserID)FROM userbehavior WHERE Behavior = 'fav'))/COUNT(*)*100,2),'%') AS 收藏流失率,CONCAT(ROUND(((SELECT COUNT(UserID) FROM userbehavior WHERE Behavior = 'fav')-(SELECT COUNT(UserID)FROM userbehavior WHERE Behavior = 'buy'))/COUNT(*)*100,2),'%') AS 购买流失率FROM userbehavior;收藏流失率: 86.87%, 购买流失率: 1.19%

4. 点击 - 收藏 - 加购 - 购买

SELECT CONCAT(ROUND(((SELECT COUNT(UserID) FROM userbehavior WHERE Behavior = 'pv')-(SELECT COUNT(UserID)FROM userbehavior WHERE Behavior = 'cart'))/COUNT(*)*100,2),'%') AS 加购流失率,CONCAT(ROUND(((SELECT COUNT(UserID) FROM userbehavior WHERE Behavior = 'cart')-(SELECT COUNT(UserID)FROM userbehavior WHERE Behavior = 'fav'))/COUNT(*)*100,2),'%') AS 收藏流失率,CONCAT(ROUND(((SELECT COUNT(UserID) FROM userbehavior WHERE Behavior = 'fav')-(SELECT COUNT(UserID)FROM userbehavior WHERE Behavior = 'buy'))/COUNT(*)*100,2),'%') AS 购买流失率FROM userbehavior;加购流失率: 84.48%, 收藏流失率: 2.39%, 购买流失率 : 1.19%

流失率
其实,我们可以看出,用户点击进入页面后,流失率其实比较大。我们就要分析可能有哪些方面的原因,比如加购流失率高达84.88%,用户点击我们的产品,侧面反映出来,用户对我们的产品主图以及标题是感兴趣的。那么我就需要弄明白,在用户进入页面后,是产品详情页或者是副图不符合客户预期,导致加购和收藏流失率极度攀升。

用户分析

用户的行为习惯分析

我们来看看用户分析,首先来看看用户的行为习惯分析,首先来看,每日点击量pv,以及独立点击量uv

SELECT date, COUNT(behavior) as pv, COUNT(DISTINCT UserID) AS uvFROM userbehaviorWHERE Behavior = 'pv'GROUP BY DateORDER BY Date;我们从上述数据可以看出,在1202和1203这两天,用户无论是点击量还是独立用户访问数,都略高于平时。我们对这两天访问量高做假设检验的分析

提问:1202和1203访问量高的原因是什么?

假设:1202和1203有特殊的节日

而后,我们通过查询历史数据发现,1202和1203两天,是那周的周末。由此,我们确认,假设成立。

用户价值分析


对于本次数据,我们缺乏相关的M值的数据,因此我们主要关注,R值,和F值。

由于我们拿到的是历史数据,因此我们定义适合本次数据的R值和F值

R值:用户最近一次购买行为12月3日时长。

F值:用户2017年11月27日至2017年12月3日的消费了次数,F值越大,用户价值越高

SELECT UserID,DATEDIFF('2017-12-3',max(date)) as R ,count(Behavior) as Ffrom userbehaviorwhere Behavior ='buy'group by UserIDORDER BY R DESC,F DESC;随后,我们指定自己的打分规则

随后,我们根据我们的打分规则,对用户进行分组,确认用户价值

SELECT a.*,(case when R<=2 then 4when R between 3 and 4 then 3when R between 5 and 6 then 2when R between 7 and 8 then 1 end) as Rscore,(case when F between 1 and 3 then 1when F between 4 and 6 then 2when F between 7 and 9 then 3when F>=10 then 4 end) as Fscorefrom (SELECT UserID,DATEDIFF('2017-12-3',max(date)) as R ,count(Behavior) as Ffrom userbehaviorwhere Behavior ='buy'group by UserID)a;

总结与建议

产品方面,我们可以看到,在我们看到,各类的产品的销售状况很不一样,有的产品种类获客很容易,但是转化率很低,但是有的产品,获客能力不足,但是转化率却极高。因此,对于不同类型的产品,应该因地制宜选择不同的销售策略。

业务流程方面,我们对各种不同类型的业务流程分别进行了分析,然后我们就会发现,普遍情况,客户的流失都是在点击后,这就意味着,大家的重点都集中在引流,但是客户点击进来之后,很快就会走,这样的引流毫无意义,关于这方面,商家应该更侧重在客户点进来之后,如何留住客户。

用户行为方面,我们可以看到,在周六日这种特殊的日子,用户的访问时间明显变长,如果考虑做活动的话,应该主动集中在这些日子,能带来不少自然流量的同时,也能更好的提高转化率。

关键词:数据,分析,用户,平台

74
73
25
news

版权所有© 亿企邦 1997-2025 保留一切法律许可权利。

为了最佳展示效果,本站不支持IE9及以下版本的浏览器,建议您使用谷歌Chrome浏览器。 点击下载Chrome浏览器
关闭