电商企业用户消费行为分析

进入信息化时代后,如何选择高质量客户是当前企业普遍面临的现实问题。文章选取电商平台下的某企业客户消费数据进行研究,从而挖掘出高质量客户作为企业营销的目标群体。

标签:经管类

北京二手房价格基本情况分析

房价与现代人生活息息相关,一线城市的二手房交易更是在房产交易中占据了重要地位,通过抓取北京市二手房交易数据,有助于了解在新冠肺炎控制期间,北京市二手房市场的基本情况,为交易决策提供支持。

标签:经管类

2014-2019年高考数据分析与可视化

本项目使用主要使用Python中的Pandas和Pyecharts工具包,利用2014-2019年中国各省份本科分数线,以及各大学的招生分数线数据,对高考近几年在各省的情况作出分析。

标签:经管类

罗斯曼商店的销售数据“销售列”的预测

 本篇报告通过利用工具python,利用Rossmann(欧洲的一家连锁药店)的数据来预测德国各地1115家店铺的6周销量为了更好的实现目的,在数据处理部分我解决了一些数据集方面的问题,运用不同的方法对不同的特征缺失值进行了填充。又因为train和test数据集都与store产生了分离。而store中的特征又与预测结果息息相关。因此要做好一个完整的训练和测试集,必须用合理的方式把store得数据与train和test合并起来。 只有理解各个特征的现实意义才能做出更合理的特征工程,而这个理解需要通过一些统计上的知识与时机生活中的常识。在这里我运用matplot和seaborn的绘图工具中的统计工具对数据可视化后,洞察数据之间的相关性。然后辅助一些生活常识,进一步理解特征。 最后一部分,选取了几种方法对其进行优化,可以看出模型效果有显著提升。但是最终发现通过混合多种模型得到的结果比单个模型的效果更好,即加权融合的效果更好。

标签:经管类

疫情期间大学生线上学习情况调研

案例基于电子问卷回收数据(调查得到大学生群体在疫情期间的线上学习经历与态度),对问卷结果进行描述性统计分析与推论性统计分析。探究高校学生的线上学习情况、体验感、满意度等方面,以此分析网络教学的优点与弊端,进而对线上教学提出合理的改进措施。

标签:社会学

深圳地区二手车价格分析及预测

由于二手车市场管理混乱,车辆品质良莠不齐,经常有劣币驱逐良币的情况出现,由于信息不对称的原因,买方和卖方均对价格设定有一定疑惑。本文爬取了深圳地区二手市场的车辆状况和价格,对其进行分析。采用机器学习的线性回归的方法对二手车价格进行预测。然后进行结巴分词,利用pyecharts做了词云。可以得出二手市场网站对于车辆的一些描述。

标签:经管类

上海市摩拜单车使用数据的探索性分析

本案例基于摩拜单车2016年8月上海市的骑行记录数据.主要研究内容包括以下几点:1. 休息日和工作日的使用是否有明显区别? 2. 早高峰和晚高峰的用车哪个更大? 3. 一周内某天的逐小时使用累计量. 4. 骑行距离和骑行时长,并据此筛选异常骑行记录. 5. 根据track列重新计算骑行距离,并在此筛选异常骑行记录.

标签:社会学

2018北京积分落户数据分析

本案例基于北京积分落户数据,使用Python中pandas, numpy, matplotlib包进行数据统计分析,分析积分落户人群的一些显著特征。分析2018年通过积分落户居民的显著特征。案例主要内容包括以下几点:1. 落户人员就职公司分布分析及可视化 2. 落户人员积分数分析3.落户人员年龄分析 。

标签:经管类

2019年世界幸福状况相关研究——基于K均值聚类

随着人类的进步与发展,有关“幸福”定义也越来越深刻,幸福不再仅仅局限于物质方面,个人的主观感受也成为了定义幸福感的一个方面。联合国发布的《世界幸福报告》是对全球幸福状况比较权威的一个调查。2012年第一个世界幸福报告于全球发布,一时间引起了世界各地广泛而深刻的讨论。随着评判标准的越加科学与完整,这个报告得到了越来越多人的认可。对幸福感的一个正确度量,有利于政府的决策和国家各方面的发展。 本案例将对2019年世界幸福报告的数据进行研究,运用可视化方法来分析2019年世界各国的幸福状况,探讨影响幸福指数的因素,并依据数据对各国进行聚类分析,研究幸福感较强国家存在的普遍特点,并得出结论。

标签:经管类

新冠肺炎疫情背景下学生的在线学习满意度分析

本研究通过设计问卷收集数据,评估了新冠肺炎疫情期间学生对于在线学习以及传统学习的满意度。主要内容包括:(1)学生对在线学习的经历如何评价;(2)检验在线学习与传统学习整体满意度之间是否存在显著性的差异;(3)检验学生在线学习满意度与学生的性别,年龄,教育水平之间是否有相关关系;(4)检验哪些是影响学生对在线学习满意度的关键因素。

标签:经管类

新冠病毒疫情数据可视化分析

本案例应用Python网络爬虫方法,在腾讯新闻网站爬取新冠肺炎实时数据,通过数据可视化,展现中国各省市的疫情分布情况以及新发地新冠病毒爆发之后北京的战疫情况。

案例主要包含以下内容:1.爬取腾讯新闻网站实时更新的疫情数据,绘制疫情分布地图、柱状图、玫瑰图,展现中国各省市新冠肺炎确诊人数的分布情况;2.爬取北京市的每日疫情数据,选取新发地疫情爆发之后(2020年6月11日以来)的数据绘制折线图,反映北京面对新一轮新冠病毒爆发的应对情况。


标签:经管类

消费者投诉举报咨询信息挖掘分析

本案例数据包含了12315消费者投诉举报咨询等信息共65535条,本案例旨在研究针对消费者繁杂的投诉数据,将数据进行分类整理,并进行词云可视化的呈现。目的是为了挖掘出繁杂的投诉信息中,消费者主要关注商品的哪些地方,找出消费者在哪方面进行投诉并分析投诉原因。

标签:经管类

关于员工缺勤时长的因素分析

21世纪是竞争日益激烈的时代,时间就是金钱,各个公司都对员工的工作时间做了严格要求,员工缺勤不仅会影响了自身的薪资水平,还会间接影响到整个企业的利益。本文使用UCI数据库的缺勤数据集,建立多元回归模型,分析了个体特征、工作压力、生育状况与缺勤时长之间的关系,结果表明:员工的年龄和孩子数量对其缺勤时长有着显著的影响。

标签:经管类

二手车交易价格保值率影响因素分析

(新增变量)二手车的价格保值率 = 二手车报价/汽车原价

该新增变量反映了二手车与一手车的价格差距

数据预处理部分进行了描述性统计和特征工程

剩余部分主要研究了二手车价格保值率主要受哪些因素影响

主要方法是可视化分析和使用回归树进行回归分析


标签:经管类