18143453325 在线咨询 在线咨询
18143453325 在线咨询
所在位置: 首页 > 营销资讯 > 电子商务 > 在线旅游电商数据分析二三事

在线旅游电商数据分析二三事

时间:2023-03-17 16:20:01 | 来源:电子商务

时间:2023-03-17 16:20:01 来源:电子商务

在线旅游电商数据分析二三事

在线旅游平台简称OTA(Online Travel Agency),平台提供流量空间和技术,传统旅行社、供应商或者平台自营机构上产品,提供咨询,销售和售后,相当于是一个旅游产品的销售平台。国内OTA市场携程占有率最高,所以这次数据分析就以携程本地游这块作为分析目标。

  1. 提出问题
Ota网站排名对销售的影响,国庆节和平时销售量的对比,再了解下线路的价格与销售的影响。

2.理解数据

OTA业务指标-网站站内排名:

销售转化率漏斗模型:

2018年9月1日 到10月15日 全国范围内“杭州旅游”关键词 百度搜索指数:

3.数据获取和清理

数据来源:携程杭州周边一日游

用后羿采集器爬取了数据后,保存为csv,用navicat导入mysql数据库,修改了数字型,时间型字段的相关属性,一路Next完成。导入前先看下csv的字符集编码,如果和数据库设置不一致,用NotePad++转换成UTF-8无BOM。

然后开始数据清理:

不知道什么原因保存的序列不是按照爬取顺序保存的,所以先做一个查询表,根据抓取时间,增加一个序列字段(相当于是网站的排列顺序),保存csv,导入为新表,对原表不做改动。

SELECT a.*, (@i :=@i + 1) AS 'id'FROM oneday1108 a, (SELECT @i := 0)bORDER BY capture_time;新表结构如下图:

本次分析用到的字段名解释:

Product 线路名称

Sales 月销量

Product_showprice 线路显示最低成人价

supply供应商

Capture_time 采集时间

Id 网站排列序号

4.数据分析 构建模型

4-1.有销售量的线路数量:

SELECT product, sales, product_showprice, supplyFROM oneday1108WHERE sales>0ORDER BY sales DESC;

有销量的线路一共294条,比国庆期间的357条少了约20%。

4-2.国庆和平时线路销售数量分析:

SELECT 1108new_id.id, 1108new_id.product as '线路', 1108new_id.sales as '1108销量', oneday1020.sales as '1020销量', (oneday1020.sales - 1108new_id.sales) as '国庆增量', round((oneday1020.sales - 1108new_id.sales)/7) as '国庆日增销量', round(1108new_id.sales/30) as '平时日均销量', 1108new_id.product_showprice as '线路最低价', 1108new_id.supply as '供应商', oneday1020.product as '曾用线路名'FROM 1108new_idJOIN oneday1020 ON(oneday1020.product_link = 1108new_id.product_link)WHERE 1108new_id.sales>0ORDER BY (oneday1020.sales - 1108new_id.sales) DESC;oneday1020是10月20日爬取的数据表

1108new是11月8日爬取的数据表

发现有线路修改了线路名称加了一条曾用线路名

由于是月销量,所以只能估计国庆的大概销售数量,设字段名 国庆增量,并以此排序。

由表看出,节假日的销售分量还是很大的,大部分线路相当于平时的4-5倍。

上次分析的结果,网站排名外,热门景点和高频交易线路(红框处)平时的销量也是不错的。

当然也有反例,平时销量比国庆还好的。

其中港澳团签机场做表直飞,显然是受了港珠澳大桥开通的热点影响,游客感受超级工程的意愿很强烈!

还有一个id517的乌镇一日游,应该是线路名称取得比较好“嘉兴乌镇一日游【金秋11月纯玩畅游乌镇,互联网大会120起】”,季节和月份的关键词,互联网大会的热点关键词都用上了,产品名称虽然只有几个字,对电商来说还是很重要的,有时还可以四两拨千斤!

4-3.最后我们再来看一下线路价格和销量的关系。

先是根据价格分段统计线路数量

select count(case when product_showprice >1000 then 1 end) as '大于1000',count(case when product_showprice between 900 and 999 then 1 end) as '900-999',count(case when product_showprice between 800 and 899 then 1 end) as '800-899',count(case when product_showprice between 700 and 799 then 1 end) as '700-799',count(case when product_showprice between 600 and 699 then 1 end) as '600-699',count(case when product_showprice between 500 and 599 then 1 end) as '500-599',count(case when product_showprice between 400 and 499 then 1 end) as '400-499',count(case when product_showprice between 300 and 399 then 1 end) as '300-399',count(case when product_showprice between 200 and 299 then 1 end) as '200-299',count(case when product_showprice between 100 and 199 then 1 end) as '100-199',count(case when product_showprice <100 then 1 end) as '99以下'from 1108new_id;99以下的低质特价团有不少,线路价格主要集中在100-400之间。

我们再来看下根据价格分段统计销量

select sum(case when product_showprice >1000 then sales end) as '大于1000',sum(case when product_showprice between 900 and 999 then sales end) as '900-999',sum(case when product_showprice between 800 and 899 then sales end) as '800-899',sum(case when product_showprice between 700 and 799 then sales end) as '700-799',sum(case when product_showprice between 600 and 699 then sales end) as '600-699',sum(case when product_showprice between 500 and 599 then sales end) as '500-599',sum(case when product_showprice between 400 and 499 then sales end) as '400-499',sum(case when product_showprice between 300 and 399 then sales end) as '300-399',sum(case when product_showprice between 200 and 299 then sales end) as '200-299',sum(case when product_showprice between 100 and 199 then sales end) as '100-199',sum(case when product_showprice <100 then sales end) as '99以下'from 1108new_id;同价格下,销量和线路成正比,参加99以下的特价团人不少,不过参加200-299的游客人数比较多,这个价位的旅游线路基本上是纯玩的高性价比线路。说明在价格合适的情况下,大多数人还是愿意参团品质较好的旅游线路。

5.可视化

关键词:分析,数据,旅游

74
73
25
news

版权所有© 亿企邦 1997-2025 保留一切法律许可权利。

为了最佳展示效果,本站不支持IE9及以下版本的浏览器,建议您使用谷歌Chrome浏览器。 点击下载Chrome浏览器
关闭