好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

新冠疫情下生鲜电商的交易情况预测分析.docx

11页
  • 卖家[上传人]:I***
  • 文档编号:227209863
  • 上传时间:2021-12-20
  • 文档格式:DOCX
  • 文档大小:169.41KB
  • / 11 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 新冠疫情下生鲜电商的交易情况预测分析 李宇 何跃 吴中霞 唐琪雨 郑灏键 摘 要:2020年春节以来,新冠疫情的逐渐恶化在很大程度上影响了消费者的生鲜购买习惯,实现从农贸市场向连锁超市和生鲜电商平台的转变因此,本研究利用Python语言抓取京东生鲜平台生鲜商品销量及新冠确诊人数,对数据进行处理、存储及可视化,将疫情指数、商品评论的数据进行了展现和分析据此提出“预测模型”,通过分析以上数据的变化与分布特点为生鲜电商平台提供适当的销售、供应方案,以期在将来某次应急事件中能缓解平台受到的冲击,并使平台从中发现商机关键词:疫情;生鲜电商;预测模型;交易;python;可视化一、文献综述华南理工大学研究了生鲜电商产品特征对消費者感知风险与购买意向的影响关系,通过实惠性、推介性、新奇性、便利性四方面构建理论模型,得出其对生鲜销售的影响关系;中国地质大学研究了生鲜电商中冷链物流需求预测,通过灰色预测模型,根据各影响因素的变化趋势的共同点或不同点,从而检测各个影响因素之间的关联性;南京林业大学汽车与交通工程学院的姜晓红曹慧敏,基于ARIMA模型的电商销售预测及R语言,通过对未来的全国和区域性需求量进行预测,能对产品的补货安排提供理论指导,对生产销售的安排具有指导意义;而本次的研究,将目标定位于销量与疫情指数之间,具有现实意义,也为帮助平台在疫情期间的良好发展贡献了自己的价值。

      二、背景2020年突如其来的疫情打破了很多人的生活节奏,也改变了许多行业的结构与发展方向与2019年同期相比,今年春节期间,生鲜类APP的平均日活增幅及新用户增幅达到2至3倍,疫情培养了用户在网上购买生鲜商品的习惯,实现了生鲜电商用户量和订单量的快速增长,也暂时将生鲜电商从低谷中拉出通过对生鲜电商平台疫情期间进行PESTEL分析,了解平台的外部宏观环境,本文将有针对性地为平台的发展做出预测、提供建议使平台实现精准运营并明确规划其发展战略法律方面,为了促进我国生鲜行业的快速发展,我国政府制定了行业相关的产业政策和法律法规,如《电子商务法》等,明确了生鲜行业发展规划方向,为行业的发展创造了较好的政策环境,为买卖双方提供了保障,但也不可否认还有一些售后的法律瓶颈需要解决;民生经济方面,疫情的暴发使得人们外出频率骤减,购买成问题的生鲜产品作为生活中的必要品,为生鲜电商平台带来了巨大的流量,伴随需求的增加,大多数人的购买行为也从线下转移到线上;科技方面,由于市场规模扩大、结构转变,对于行业相关技术的要求也相应提高冷链物流技术快速发展、无人配送正式开放等,都是疫情下生鲜电商行业的外部科技环境;社会文化趋向方面,消费者对于饮食健康问题愈发关注,并且对食物的品质和新鲜度的要求更加严格。

      因此,本研究旨在为平台提供一个预测模型,根据疫情的严重指数来量化影响生鲜电商平台的因素,预测平台发展方向并拟定供应、销售方案三、编程语言与技术介绍该模型的设计主要是基于python语言的网络爬虫,并用pyecharts进行可视化分析网络爬虫,通过一定的规则策略,自动抓取、下载互联网上网页,再按照某些规则算法对这些网页进行数据抽取,形成所需要的数据集而基于爬虫,可以更准确地获取目标数据,再辅以MySQL数据库储存,python数据可视化展示与MATLAB拟合数据,使得模型更清晰具体四、模型分析数据选取:根据艾媒咨询所统计的“疫情暴发前与暴发期生鲜平台食材销量对比”,蔬果类同比增长近100%,肉蛋类增长近120%,故选取蔬果肉蛋(由于水产品属于其中的肉类但有区别,故单独呈现),再选取其统计的具体食材销量在疫情前后同比增长高的食材,近20种而疫情暴发后,大年三十至正月初九,京东生鲜蔬菜获得销售和销量的双冠增长,销售同比增长近450%猪牛羊肉和禽肉蛋品等基本食材的销售同比都超过了400%,猪肉同比去年春节增长超10倍此外,饺子、包子、糕点等面点的全国销量也超过了2019年“京东双11”的规模,这一份答卷不仅为全国生鲜市场的供需稳定持续助力,也展现了其在生鲜电商领域的领先地位,再加上其网站代码较易爬取,故选取京东生鲜平台为数据爬取对象。

      1.模型微观分析(1)数据获取:本文的数据主要来源是京东生鲜网站,整个过程通过Python语言编写数据爬取过程中,采用模拟请求登录、Web自动化工具selenium模拟浏览器和多线程等技术手段数据爬取后进行采集分析,对数据进行了清洗和转换处理,并将其存入MySQL数据库,最后通过pyecharts可视化库对数据进行直观呈现与分析2)框架构建:该预测模型分析所需数据由三个步骤获取,抓取生鲜品类——抓取各生鲜商品——抓取商品对应评论最后再用pyecharts实现数据可视化,可视化结果为疫情指数-时间图和商品销量-时间图,matlab做回归方程曲线图通过分析得出的图像,为商家提供销售预测模型,进而使商家在再次经历类似灾难时能制订出更具可行性的销售方案3)抓取数据:首先,需要获取京东生鲜网站生鲜商品品类,其次才能抓取品类里的各商品的具体信息,确定各店铺该品类商品的评论数量,以此来估计商品销量该过程为:导入模块—定义京东生鲜主页—抓取网页并解析—封装品类名及url其次,在各品类信息基础上,可进一步抓取商品信息,主要是商品名称和商品评论在获取商品信息时,每页总共60个商品,但其中有30个商品是通过Ajax加载出来的。

      为了解决这个问题,我们使用selenium模块解决selenium本质是通过驱动浏览器,完全模拟浏览器的操作,比如跳转、输入、点击、下拉等,来拿到网页渲染之后的结果获取商品店铺和评论数的部分代码如下:该过程为定义品类url—定义浏览对象并访问url+解析源码,抓取url,评论数等最后,获取评论时间,确定消费者购买时间当爬虫爬取速度过快或者次数过多,可能会出现被封IP的现象,导致抓取到的网页源代码为空我们通过使用代理IP来解决这个问题,定义一个函数,每次运行这个函数都会通过API接口获取一个新的IP地址,并以这个IP地址去访问网址,这样解决了IP被封的问题其部分代码如下:该过程为获取代理IP—定义函数—访问评论页并储存(4)数据存储本设计采用MySQL数据库作为数据源存储,MySQL是一种关系型数据库管理系统,关系数据库将数据保存在不同的表中,而不是将所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性MySQL所使用的SQL语言是用于访问数据库的最常用标准化语言MySQL软件采用了双授权政策,分为社区版和商业版,由于其具有体积小、速度快、总体拥有成本低等特点,本模型使用MySQL数据库来存储目标数据。

      该过程为导入驱动包—连接数据库—定义执行sql语句—关闭数据库最终MySQL中共收集存储了435402条评论信息数据2.模型宏观分析:(1)组成部分:①销量/时间图:选取20种不同类别的热卖商品,将其分为四类,以月份为横坐标,评论数为纵坐标我们采取根据其评论数量反映销售数量的方法,并做累积,显示四大类的折线图该图旨在帮助平台确定商品出售时间及所需供应的商品数量比例,稳定供需关系,同时对商家也有一定的借鉴作用②疫情指数/时间图:利用腾讯地图官网的疫情实时数据,以月份为单位,患者/全国人数为纵坐标,显示折线图,是用来联系疫情指数与销量的媒介③销量/疫情图及回归方程:利用时间为媒介,以累积感染人数作为衡量疫情严重程度的指数,将对应疫情下的评论数用更直观的图像显现出来,并设计方程,方便平台在相应疫情状况下大致估测自己的销量水平2)购买力变化分析及产生的影响根据上图我们可以得到:①在感染人数累计达到6万左右时,生鲜商品评论量开始明显上升;②蔬菜类的销量增速为所有生鲜商品中最快的;③根据20种商品评价数的累计分析,疫情后的销量(评价数为)约为疫情前的2倍左右疫情下外出频率急剧降低,加上各大平台通过自身商品、供应链、物流配送、品牌战略合作等优势,结合不定期发放优惠券、举办促销活动等优惠手段互相竞争,使得疫情期间消费者的购买力远大于往年同期。

      另外,客观因素还有季节性滞销、社会交通发展程度、信息技术发展程度等例如在冬季,消费者更倾向于选择各种肉类等可以补充能量的生鲜类产品,在春秋季节购买水果的群体占比就较大社会交通发展程度是针对物流方面,随着社会经济的不断发展,公路、铁路、航空等运输方式的里程、货物量、吞吐量这类指标不断攀升,对中国电商的物流配送起到了直接重要的推动作用信息技术是电商发展的命脉,没有互联网的普及,没有电商基础设施和网点的建设,也不可能有如今蓬勃发展的电商行业最后,生鲜电商的交易水平与平台自身发展相关性最大创新和改进供应链,如永辉超市启动的“田间寻货源”方案,加大了供应链的协同程度;完善运营体系,如每日优鲜通过小程序与社交群,交易额度同比增长300%等;增强用户体验感,如永辉线下门店中,生鲜品旁的二次加工服务;除此之外,发达的物流体系,数字化技术,产品的质量等都是影响交易量的重要因素五、价值当重大灾难事件来临时,各行各业将受到不同程度的冲击,因此,预判企业发展方向、提前制定应对方案与风险防范措施能有效缓解其带来的影响本文将此次疫情的京东生鲜平台数据作为预测模型的数据基础,通过数据获取、处理、可视化等方式,為生鲜电商平台提供可作用于灾难事件下的预测模型。

      该模型描述了某疫情指数下对应的多类生鲜产品的销量,为平台解决了以下问题:1.难以把控购入量和时间,由此导致仓库的积压或是不足1)平台可根据不同疫情指数定位到相应销量区间,确定市场需求量的大致范围,进而根据市场需求量及企业内外部环境等因素来确定供应量并推测进货时间,在不同疫情指数时期有针对性地供应适量的产品,提高平台的供应链运转效率2)根据销量曲线,合理调整成本,减少库存积压和亏本兜售的情况2.难以确定类似疫情来临之时的生鲜热销品由于模型中样本的选取来自艾媒咨询中疫情前后同比增长率高的产品,平台可根据各品类生鲜产品的销量曲线以及季节等外部因素,利用销量与疫情指数的对应,在相应的疫情状况下进一步确定合理的货物购入、出售与存储方案,有利于制定切实可行的销售预案并将其应用于类似的市场情况中3.难以把控人员的数量及商品监管问题,造成平台运营成本增高利用疫情指数/时间图确定平台商品的安全监管程度,及相应的运营物流措施,及时调整工作人员的工作安排(所需工厂员工/总员工数量、合理采用多平台的共享员工模式来进行短期人力输出)由于不同疫情指数下,销量不同,所需要的人员数量也不同,平台根据该模型可以适当的人员配置和准确的生产销售方案,提高企业内部的工作效率,维持企业内部的稳定运转。

      六、不足之处当然模型还有一定的不足之处:1.操作性:构建非此次疫情的模型图,需要定期运行代码,并存入数据库做间断性记录,运行时间较长,需平台相关人员自行评估,操作较繁琐,但可以起到加强平台风险防范的作用2.准确性:由于京东平台对任何一家店铺的销量都是不公开的,所有销量数据均为店铺隐私,该模型只能利用评论数预测商品销量,又由于不同产品之间的评论与销量比值不一致(但由于针对的均为生鲜产品,幅度变化范围较小,所以有一定的借鉴意义),在高峰或低谷所对应的时间可能会有一定偏差3.兼容性:(1)该代码当前产出的折线图及回归方程,只适合于类似“新冠肺炎”这种导致人们居家、无法外出的情况,且时间在春节前后,若非该种情况,平台只能通过定期运行代码,根据疫情指数进行预测2)由于为了更准确地找到热销区间,样本选取是根据艾媒咨询披露的2020年疫情前后同比增长率较大的商品,所以销售产品也限于当期热销产品,商家的商品供应还应结合季节、温度、产量等因素作出合理预测4.其他影响因素:预测模型较片面地用此次疫情的数据进行。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.