分析报告 | 关于母婴电商问题的分析报告
时间:2023-03-26 02:12:01 | 来源:电子商务
时间:2023-03-26 02:12:01 来源:电子商务
一、分析背景与目的
1.背景:1.1母婴电商市场
母婴电商市场是指线上零售妈妈用品和婴幼儿用品。主要涵盖奶粉、营养辅食、尿裤湿巾、喂养用品、洗护用品、童车童床、安全座椅、玩具书籍、童装童鞋和服饰寝具等类别。
近几年来,中国母婴电商市场交易规模快速增长,线上交易渗透率走高,其中2011~2015年交易规模增长率达到一个高峰,之后便缓慢稳定地增长。
来源:艾瑞检测数据以及艾瑞统计模型推算下面用PEST分析方法来分析母婴电商企业的宏观环境:
PEST分析方法1.2本项目采用的数据集
数据获取来源:阿里巴巴天池
https://tianchi.aliyun.com/dataset/dataDetail?dataId=45数据来自淘宝和天猫上购买婴儿用户,本数据集包括2个表格文件:
2.目的提高母婴电商店铺的成交数量
二、分析思路与过程
1.分析思路本项目从用户和产品两个角度展开分析,分析思路概览:
2.分析内容2.1提出问题- 不同年龄段对总购买数量有什么影响?
- 不同性别青睐哪类一级商品?
- 哪些客户是忠诚客户?
- TOP N热销/滞销的二级商品是什么?
- 近几年的成交数量趋势如何?
- 哪些二级商品使用户的高频需求?
2.2理解数据【表1】购买商品.csv 共7个字段,29971个记录
表1字段描述【表2】婴儿信息.csv 共3个字段,953个记录
表2字段描述2.3数据清洗1)选择子集隐藏不用的列名property
2)列名重命名将day名字修改为buy_day,以便和birthday区分并体现字段的含义为“购买日期”
3)删除重复值4)缺失值处理通过检查每列的记录数,得知表1、表2都没有缺失值
5)一致化处理由于后面要对婴幼儿的年龄进行计算和筛选,所以需要提前对birthday和buy_day字段进行格式转换,转换为日期格式:
TEXT()函数6)数据排序7)异常值处理目前对所有字段检查之后没有发现异常值,但数据分析部分可能会产生异常值。
异常值处理方法2.4数据分析1)明确问题2)分析<用户角度>问题1:不同年龄段对总购买数量有什么影响?首先,将年龄段拆解为三维;
其次,在表2用VLOOKUP匹配表1的buy_mount,剔除未知年龄的记录。不同年龄段的成交数量用柱形图表现为:
对比分析思路:
结论:
1)0~3岁的婴幼儿的成交数量最多
2)总成交数量随年龄的增长而减少
问题2:不同性别青睐哪类一级商品?首先,将性别拆解为男、女二维,再分别对男、女按一级商品成交数量拆解;
在表2用VLOOKUP匹配表1的cat1,剔除未知性别2的记录,分别对0(女)、1(男)的一级商品成交数量展开比较,分别筛选出成交数量大于20和10的记录,用条形图表现:
结论:
1)女孩用户青睐ID为50018831的一级商品
2)男孩用户青睐ID为50013636的一级商品
问题3:哪些客户是忠诚客户?首先,筛选出复购过的客户:在user_id中突出重复单元格的条件格式并筛选重复记录;
其次,将忠诚客户拆解为购买次数、成交数量这二维;
最后,复购用户的购买次数和成交数量用不等宽柱形图表现为:
结论:
1)按复购且成交数量的标准,最忠诚的客户ID为890739828
2)按复购次数的标准,最忠诚的客户ID为814316568
<产品角度>问题4:TOP N热销/滞销的二级商品是什么?首先,创建数据透视表,以cat_id(二级商品ID)为行,求和:buy_mount(成交数量);
其次,以成交数量为依据,分别降序和升序排序。降序之后筛选成交数量大于1000的记录,则二级商品的成交数量可用条形图表现为:
升序排序后得到的TOP1滞销商品有83个。由于滞销商品较多,这里就不一一列举。
结论:
1)TOP 3热销的二级商品ID为50018831、50011993、50012788
2)TOP1滞销商品有83个
问题5:近几年的成交数量趋势如何?首先,将年份拆解为2012、2013、2014、2015这四维;
其次,分别将成交数量“按年份分布”和“对各年份按月分布”用图表可视化为:
由于2015年只有2个月份,这里剔除对2015年的分析
结论:
1)近几年成交数量整体呈上升趋势,但2014年第一季度稍有大幅下降
2)2014年第四季度环比其他任何季度的成交数量涨幅最大
结论:
3)2012年和2014年的最大成交数量在11月,2013年最大成交数量在12月
4)2014年11月的成交数量同比前两年暴涨
结论2有两个含义:
一是2014年第四季度成交量同比其他年份第四季度大增,二是环比当年11月份前的成交数量大增。容易推出:前者是结论4的影响,后文将对此详细分析;后者猜测是双十一大促活动的影响,采用假设检验法进行分析。
提出假设:2014年第四季度成交数量环比前期大增是因为双十一大促活动
收集证据:2014年11月每天的成交数量
上图表明:2014年11月11号附近的成交数量出现暴涨,符合双十一大促活动导致成交数量大增的假设。
结论:成立
除此之外根据其他三个结论发现以下3个新问题:
- 为什么2014年11月的成交数量同比前两年暴涨?
- 在其他年份成交数量下降的情况下,为什么2013年12月成交数量还能增长?
- 为什么2014年第一季度成交数量稍有大幅下降?
由于这些问题都是围绕成交数量展开的,可以将成交数量拆解为购买次数和单次购买数量这两个维度,采用假设检验法进行分析。1)对成交数量及其分布变化的原因进行假设检验分析本文中的“变化”默认是环比变化
- 分析成交数量同比变化与购买次数同比变化的关系(同比)
上图表明:各年份购买次数分布情况基本一致
结论:成交数量的同比变化与购买次数的变化基本没有关系
- 分析成交数量同比变化与单次平均购买数量同比变化的关系(同比)
由于
成交数量=购买次数*单次购买数量,而上文已分析得出了各年份成交数量的分布和购买次数的变化基本没有关系,可以直接推导出以下结论:
结论:成交数量同比变化与单次平均购买数量同比变化具有相关关系
散点图相关关系上图表明:随着购买次数的增加,成交数量也增加,二者的相关系数为0.72
结论:成交数量的变化与购买次数的变化有高度正相关关系
散点图相关系数上图表明:随着单次平均购买数量增加,成交数量也增加,二者的相关系数为0.88
结论:成交数量的变化与单次平均购买数量的变化有高度正相关关系
以上的分析思路为:
2)根据假设检验分析的结果对3个新问题分析原因- 为什么2014年11月的成交数量同比前两年暴涨?(同比)
成交数量的分布只和单次购买数量有关,因此直接分析各年份每月单次购买数量的变化:
上图表明:近三年来,每月单次平均购买数量在1.45~4.03之间波动,但2014年11月单次平均购买数量同比暴涨至7.12,直接导致了其成交总量相对其他年份的巨大增幅。
结论:单次购买数量的同比急剧增大,直接导致了成交数量的同比暴涨。而一般单次购买数量的增大,跟促销活动有很大的关系,但由于信息有限,没有近几年的促销活动信息,其根本原因暂不深究。
- 在其他年份成交数量下降的情况下,为什么2013年12月成交数量还能增长?(环比)
成交数量的变化和单次购买数量、购买次数都有关,因此需要对它们分别进行分析。
每月单次平均购买数量变化情况:上图表明:2012年和2014年12月的单次平均购买数量呈下跌趋势,而2013年12月的单次平均购买数量上升了1.83。
每月购买次数变化情况:上图表明:每年12月的购买次数都下跌,而2013年12月的下跌较少。
综合以上对两个指标的分析,可以得出结论:2013年12月成交数量上升的原因主要是单次平均购买数量增加了。而一般单次购买数量的增大,跟促销活动有很大的关系,但由于信息有限,没有近几年的促销活动信息,其根本原因暂不深究。
- 为什么2014年第一季度成交数量稍有大幅下降?(环比)
每季度单次平均购买数量变化情况:上图表明:单次平均购买数量基本呈现上升趋势,只有2012年第二季度和2014年第一季度下跌,且2014年第一季度的单次平均购买数量是近年来最低,相比上一季度的跌幅最大。
每季度购买次数变化情况:上图表明:购买次数呈震荡向上的趋势,其中2014年第一季度下跌幅度最大。
综合以上对两个指标的分析,可以得出结论:2014年第一季度成交数量稍有大幅下降是因为用户的单次购买数量和购买次数同时发生了大幅下降。单次购买数量和购买次数的下降与很多因素有关,由于信息有限,其根本原因暂不深究。
问题6:哪些二级商品是用户的高频需求?首先,筛选出复购的人数(购买2次任何商品的人数)及其对应的订单信息,并复制到新的工作表“复购商品”中;
其次,在工作表“复购商品”中创建数据透视表,字段设置如下:
数据透视表字段设置再次,找到同一商品购买次数>1的商品ID
由上图可得:同一商品复购的人数都为1
最后,可推算出:
付费人数=总记录数(29971)-复购人数(1)=29970
复购率=同一商品复购的人数/付费人数=1/29970*100%=0.003337%
综合以上,在该数据集中,所有被复购的商品的复购率都是0.003337%,属于小概率事件,不构成统计学意义,因此对此不作讨论。
3)决策本项目的北极星指标是成交数量,通过上述分析知晓:
- 成交数量同比发生变化是因为单次购买数量同比发生变化
- 成交数量的变化是因为购买次数或单次购买数量发生变化
接下来用回归分析方法来探究其
影响程度如何。
- 单次购买数量的变化对各年份间成交数量的分布的影响程度
首先,创建一个辅助表:
其次,用散点图表现其相关关系,添加趋势线并显示公式
上图显示,成交数量同比变化y与单次平均购买数量同比变化x的回归方程为:y = 1378x + 989.77,即当单次购买数量同比增长1的时候,成交数量就同比增长1378。
结论:当成交数量同比下跌或者没有达到期望值的时候,可以先给成交数量制定一个可行性标准值,通过y = 1378x + 989.77回归方程推算出相对应的单次购买数量目标,再制定计划使单次购买数量达到目标。
决策:当成交数量同比下跌或者没有达到期望值的时候,使用以下措施使单次购买数量达到目标:
1)买二送一或者第二件半价
2)买满500-50或者赠送小礼品
上图显示,成交数量y与单次平均购买数量x的回归方程为:y = 1725.5x - 1675.2,即当
单次购买数量增长1的时候,成交数量就增长1725.5。
结论:当成交数量下跌或者没有达到期望值的时候,可以先给成交数量制定一个可行性标准值,通过y = 1725.5x - 1675.2回归方程推算出相对应的单次购买数量目标,再制定计划使单次购买数量达到目标。
决策:当成交数量下跌或者没有达到期望值的时候,使用以下措施使单次购买数量达到目标:
1)买二送一或者第二件半价
2)买满500-50或者赠送小礼品
上图显示,成交数量y与购买次数x的回归方程为:y = 4.4968x - 1853.4,即当购买次数增长1的时候,成交数量就增长4.4968。
结论:当成交数量下跌或者没有达到期望值的时候,可以先给成交数量制定一个可行性标准值,通过y = 4.4968x - 1853.4回归方程推算出相对应的购买次数目标,再制定计划使购买次数达到目标。
决策:当成交数量下跌或者没有达到期望值的时候,使用以下措施使购买次数达到目标:
1)组织团购优惠活动
2)定期拜访老客户,优化售后服务
3)有偿让老客户带来新客户
另外,当成交数量下跌或者没有达到期望值的时候,
如果企业资源有限,可以计算出各个方案的成本,根据每一单位成本对单次购买数量和购买次数的影响,结合回归方程,来抉择采用哪一种方案。三、分析结论与建议
根据以上分析,将问题的结论总结如下:
结论总结针对本项目的数据分析结果以及分析目的,我提出以下几点建议:
<用户角度>
1.加大对0~3岁婴幼儿用户的家长的产品宣传力度,将高年龄段产品搭配婴幼儿产品促销;
2.分别对女孩、男孩用户加大宣传和促销50018831、50013636这两种产品;
3.邀请890739828和814316568加入会员,定期短信拜访、赠送小礼物等。
<产品角度>
1.加大宣传和促销50018831、50011993、50012788的二级商品,分析其推广渠道并借鉴;
2.对大量滞销的产品做好库存管理,向产品部门和客服部门咨询产品信息,并做相应的优化;
3.当成交数量下跌或者没有达到期望值的时候:
1)使用以下措施使购买次数达到目标(环比)
- 组织团购优惠活动
- 定期拜访老客户,优化售后服务
- 有偿让老客户带来新客户
2)使用以下措施使单次购买数量达到目标(同比+环比)
- 买二送一或者第二件半价
- 买满500-50或者赠送小礼品
分析报告的PPT版本