游客情感分析及可视化—以苏州拙政园为例

2020年初新冠疫情的爆发重创了旅游景区的发展,现如今各大景区急需从新冠阴影中走出。TrustYou的最新研究发现,年轻的游客越来越相信网络评论,而那些拥有良好的网络影响的景区会从这些评论中受益。因此,随着网络的普及和大数据的发展,游客的网络评论不仅对于景区摆脱新冠疫情的阴影至关重要呢,还有助于其他潜在的游客深入地了解景区并唤起其旅游的意愿。

本次数据科学实战训练营中,我学习到关于文本分析以及网络爬虫的知识,所以运用学到的知识来对苏州拙政园的游客评论进行文本挖掘和分析。

标签:经管类

豆瓣电影数据分析

豆瓣电影通过收集用户观看电影后进行的打分、写的影评等信息,给出一个电影的排名。目前对于豆瓣电影的数据分析不在少数,但大多都只是对于各类信息的描述统计,本篇报告旨在针对豆瓣电影给出的排名前250名的电影数据,分别从各州、亚洲、中国三个层面来对入围电影的年份、数量和类型进行分析,希望发现层面间及层面内的电影行业发展特点。  首先通过编写网络爬虫爬取了排名前250名的250条电影数据,采集对象包括:影片的中文名、外文名、评分、评价数、概述及相关信息。经过对相关信息列的数据提取整理及其他数据的整理,最后得到了影片中文名、评分、评价数、年份、国家、剧情类型六类信息。  然后根据入围电影所属的国家,从各州、亚洲、中国三个层面来对入围电影所属的年份进行了描述统计,分析各层面高分电影产出的时间特点。接着,分别从三个层面对所入围电影所属国家(地区)的入围数量进行分析,然后从这三个层面对入围电影的类型进行描述统计,分析各层面在高分电影类型上的不同点。最后,对影片的概述进行词频统计,并制作词云,分析高分电影所共同突出的主题。

标签:经管类

成都市各区的出租房屋供需特点

成都地理位置优越、资源禀赋丰富、文化底蕴深厚,自古就被誉为“天府之国”。随着“一带一路”、西部大开发、成渝城市群等国家战略部署深入推进,成都市加快建设全面体现新发展理念的城市和美丽宜居公园城市,不断推动经济高质量发展,城市发展能级持续增强。成都作为西部消费中心和西南生活中心的地位进一步巩固,生活城市成为成都最鲜明的特质和最靓丽的名片,市民幸福指数持续提升,城市吸引力持续提升。近两年,成都新落户大学本科以上毕业生32万人,新增人口100万人,新增市场主体1357万户,每天近200家新经济企业在蓉诞生;2018年经济总量突破15万亿,增速连续11个季度保持在8%以上,今年前三季度增速居副省级及以上城市首位,城市综合竞争力在世界城市体系中跃升29位至全球第71位。
    成都不论是经济发展程度,还是公共基础设施和服务的完善度,对于迁移人口都有着很强的吸引力,吸引了大量人口的流入,同时也对城市公共服务、资源环境、住房保障等提出了一定的挑战。如何满足最基本、也是最迫切的民生需求之一的居住需求是摆在当前的重要课题。在全面建成小康社会的过程中,如何让“新市民”能够尽快地融入城市生活,切实满足居住需求,使他们能够“住有所居”“住有宜居”“安居乐业”,是当前进一步做好住房民生工作的一项重要任务。 “新市民”群体流动性较大、收入水平相对较低,短期内购房能力偏弱。住房租赁作为住房可循环供应系统的重要环节,是在住宅使用权的让渡下不同租住者之间的循环使用,既实现了房屋资源的高效配置,也为居民提供了灵活多样的居住方式。加快构建租购并举住房制度,大力发展住房租赁市场是解决“新市民”居住问题,增强其安全感、幸福感和获得感的有效途径。同时,住房租赁市场作为房地产市场的重要组成部分,也是房地产“全流通”框架发展的基石和市场稳定器,规范发展住房租赁市场对于房地产业平稳健康发展长效机制的建立具有举足轻重的作用。
    本文主要爬取了链家网站的租房信息,通过对不同特点的出租房屋的价格,分析了成都市各区的出租房屋的供需特点。 

标签:经管类

电子商务背景下,淘宝“双11”活动发展的新趋势

随着国内互联网使用人数的增加,利用互联网进行网络购物并以银行卡付款的消费方式已渐趋流行,市场份额也在迅速增长,各种类型的电商网站层出不穷。电子商务开发平台一方面以电子流代替了实物流,大量减少人力、物力,降低了成本;另一方面突破了时间和空间的限制,使得交易活动可以在任何时间、任何地点进行,从而大大提高了效率。通过互联网,商家之间可以直接交流、谈判,消费者也可以把自己的建议反反馈到企业或商家的企业网站开发,企业或者商家则根据消费者的反馈及时调查产品种类及服务品质,做到良性互动,从而为消费者构建良好的消费体验。不得不说,互联网已经开始成为日常生活中不可缺少的一部分,建设各种形式的电商平台也就变得十分重要。

标签:经管类

新中国人口发展情况分析

2020 目前我国正在进行新的一轮人口普查。人口问题是新时代中国社会经济发展必须面对的基础性、全局性和战略性问题。研究新中国成立至今的人口发展情况并对比历年的人口政策,可有效直观反映人口政策的政策效应。

标签:经管类

训练营报名问卷调查结果初步分析

不同编程基础与不同背景身份的师生对数据科学的了解情况可能不甚相同,对“财经数据科学实战训练营”的期望也不完全一致。那么大家的了解情况究极是怎样的呢?这些指标之间究极有什么样的关联呢?他们之间又会存在着什么样的联系?

标签:经管类

财经数据科学实战训练营报名问卷分析

显而易见目前数据科学与大数据技术正在迅速崛起,许多高已经申请数据科学与大数据技术专业。大数据已经与我们生活的方方面面联系在了一起。大数据的应用也是全学科,全方位的,医疗、金融、航天、生物等都用到大数据。面对大量的数据,将其分为不同维度不同指标,以及进行可视化,便于我们更好地理解。从大量的数据中进行挖掘,得到有用的消息,从而帮助我们做出更好的决策,这些就是大数据的作用和意义的一部分。  在百智享科技有限公司的支持下,为满足财经高校师生对数据科学技术强烈的学习需求、推进我国财经高校数据科学普及化教育工作,中国财经教育资源共享联盟、中国财经高校慕课联盟、中国法律信息资源共享联盟联合推出财经院校数据科学实战训练营活动。高校师生填写问卷报名此次活动。通过对问卷分析,更好地了解此次报名的情况。


标签:经管类

山西省城乡居民收入和消费差异的非参数检验

收入和消费是与居民的日常生活有着密切联系的两大指标,是对居民生活情况的直接衡量和反映。这十几年来,山西省的经济发展水平有了很大提高,如今居民的收入和消费水平同十多年前也不可同日而语。国家统计局网站发布的最新数据显示,2019年城镇居民人均可支配收入为33262元,同比增加2227元,增长7.2%,扣除价格因素实际增长4.5%;农村居民人均可支配收入比上年增加1152元,达到了12902元,增速比上年高了0.5%。

尽管山西省城乡居民的收入和消费水平已是今非昔比,但是居民人均可支配收入水平和中国诸多省份相比还有着不小的差距,因此山西省居民提升收入水平还存在很大的空间。再加上居民收入会对消费水平造成很大影响,所以对山西省居民收入和消费情况进行统计分析具有重大意义。政府部门可以以山西省居民收支情况为基础,对经济进行宏观调控,同时还可采取有效的措施促进社会经济的发展。


标签:经管类

公共卫生事件中的谣言传播过程模拟

在科学技术发展的今天,消息的传播方式发生了巨大变化。各种媒体平台的出现加快了信息的传播速度,也使信息的受众进一步普及。但是人们对于所收集到的各种消息的真伪,很多时候难以辨别。

突发性事件往往会引起人们的注意。人们希望了解事件真实的危害情况,以便对自己的行程等决策进行调整,或是提醒自己的亲朋好友规避危险。但是现实生活中,难免会出现部分评论者做出夸大事件的危害程度以博取人们关注。如果让谣言进一步发酵,那么将对社会产生负面影响,如损害他人名誉,减低人与人之间的信任感,影响经济发展,破坏社会安定,等等。

因此,本程序以突发性公共卫生事件为背景,研究人们对于事件危害程度的判断如何受到谣言的影响,并分析哪些因素可以影响两者的作用关系,然后基于程序得到的模拟结果,进一步探讨可能存在途径以减轻谣言的影响。


标签:经管类

应用机器学习对信誉评级进行预测

本文采用的是发票数据,用321家已有信誉评级的企业信息对123家未知信誉评级的企业进行预测


标签:经管类

新冠疫情实时数据查询与分析

疫情牵动着举国上下每一个人的心,而全国上下的步调一致,不仅仅表现在医疗与抗疫方面的驰援相助,数据科学界内亦汇聚起了战“疫”硬核力量,大数据作用在疫情宣传、疫情防控、资源调配、复工复产等方面都扮演着重要角色。

怀揣着对python与数据科学的巨大热情,在本次数据科学实战训练营中取得了满满收获后,我亦产生了制作本次案例的想法,利用python网络爬虫、数据分析与数据可视化的一些知识,我希望能制作出简易而实用的疫情数据查询分析工具,同时也是以一名学生的身份,用自己所学的知识为祖国疫情防控出一份力。


标签:经管类

熵权法确定权重

熵权法(entropy weight method, EWM)是一种纯客观的做法,它认为若某指标的离散程度大,则该指标对综合评价的影响(即权重)就应该更大。反之,如果某项指标的值全部相等,则该指标在综合评价中应当不起作用。

标签:经管类

学生考试成绩影响因素的相关性分析和分类预测算法应用

在当今的教育手段和背景下,学生的学习成果一向是通过考试这种形式来进行考核和计量的。因此学生的学习效果的好坏优劣直接体现在了考试成绩上。

随着教育学、社会心理学、认知心理学、发展心理学等学科不断地融合发展和深入探索,人类的学习行为得到了研究者们越来越多的关注,因此对于“学习行为以及学习效果的影响因素”这一主题探索越来越丰富、越来越多元。

人们已经意识到,对于不同种类的知识,最有效的学习方式大不相同,而对于不同种类知识的认知优势更是因人而异。除了知识的种类之外,学习者的性别、身体状况、心理状况、早期教育、家庭氛围、勤奋程度和生活习惯都会对学习者的学习效果,也就是考试成绩产生一定的影响。 本案例旨在探讨几种常见影响因素对于考试成绩的影响。

值得说明的是,我作为一名会计专业的本科学生,对于python、统计分析、机器学习的了解和应用都非常粗陋和浅显,但是在学习和实践的过程中,我自认为对于这些工具和知识的掌握程度有了长足的提高,其收获甚至远远胜过平常的被动式学习。这也印证了此次课程学习中,让我印象非常深刻的谢斐教授的一句话,他说“学习是要在解决问题和不断实践中完成的,否则效果很不理想”。事实证明,动手实践、解决问题确实让我获益良多。


标签:经管类

文献期刊分区统计——以美国宾夕法尼亚大学为例

 InCites平台是用于分析与文献相关的人员,组织,地区,研究领域,期刊,书籍,会议论文集和资助机构等的工具,并由Web of Science核心集合索引提供支持。对JCR数据库中每个Web of Science学科中的期刊按其影响因子值从高到低排序,平均分为4个区,若某期刊的影响因子位于前25%,则将其划分到Q1区间,依此类推。通过对某高校各分区期刊以及文献数量与占比进行统计,可以对该校的文献的发文规模与影响有一定的了解,也可通过多次调用,进行高校间期刊相关的一个对标。

标签:经管类

探究子女数量对老人主观幸福感的影响

近年来,我国社会老龄化进程加快,人们的老年生活幸福感受到社会广泛关注,对老年人主观幸福感的研究有利于寻找提高老年人的生活水平的途径。老年人的主观幸福感主要依据于人们在老年时期的情感反应和生活满意度。在中国社会,子女承担着赡养老人,与老年人进行情感沟通,为其提供经济支持和心灵慰藉等责任,因此,子女数量是影响老年人的主观幸福感的重要因素之一。日前,计划生育政策正在改革,二孩政策全面落实,增加子女数量对于提高老人的主观幸福感的影响引起了广泛的讨论。

标签:经管类

员工是否离职的影响因素分析与预测

本文对所获得的人力资源数据进行了描述性分析和探索性分析,展示了数据主要构成和性质,并且以是否离职作为二元因变量,分别进行了logit回归和决策树预测。最后比较了两个结果的差异,解释了回归和预测的不同。

标签:经管类

房价预测任务

目标:根据房屋属性预测每个房子的最终价格。

标签:经管类

我国数字普惠金融水平分析

普惠金融这一概念最早由联合国在2005年提出,之后普惠金融的概念引入中国,并得到中国政府的认可。2013年11月,中共十八届三中全会通过 《中共中央关于全面深化改革若干重大问题的决定》,正式提出发展普惠金融。2015年年底,国务院发布《推进普惠金融发展规划(2016-2020年)》,对普惠金融事业进行了更具体的部署,并在其中明确了普惠金融的定义。2016年G20峰会首次提出发展数字普惠金融的理念,将数字普惠金融定义为“一切通过使用数字金融服务以促进普惠金融的行动”,数字普惠金融可以理解为“数字技术”与“普惠金融”的结合,其目的在于通过“数字技术”的手段来最终达到金融普惠的目标,为所有群体尤其是被传统金融系统所排斥的群体提供可得的金融服务。

在北大数字普惠金融指数公布之后,出现了许多利用此指数对具体社会问题比如脱贫、缩小城乡差距、缓解中小企业融资约束等进行实证研究的学术作品,对北大数字普惠金融指数所反映的情况进行具体趋势分析和区域分布分析具有重要的理论意义和现实意义。


标签:经管类

学历在国有企业与非国有企业的重要性分析

最近几年,随着互联网企业的发展,程序员薪资逐年上升,尤其是 python 方 面的程序员。为了进一步了解 python 程序员的薪酬,本文爬取了前程无忧上 python 程序员招聘信息来进行分析。

标签:经管类

数据科学从业人员职业培训数据分析

数据来源于kaggle,提供者为美国一家提供数据科学行业职业培训的公司,数据表共含14个变量,包括:员工ID,城市ID,城市发展指数,性别,是否具有相关工作经验,教育水平,专业,培训后是否跳槽等。

标签:经管类

财经数据科学实战训练营入营调查问卷可视化分析

在大数据时代,数据科学知识越来越重要。对于大数据处理的工具Python我们更应该去掌握。

标签:经管类

利用Python数据可视化对《“十四五”规划和2035年远景目标建议》报告生成词云图

2020年10月29日中国共产党第十九届中央委员会第五次全体会议(既党的十九届五中全会)胜利召开,“十四五”时期是我国全面建成小康社会、实现第一个百年奋斗目标之后,乘势而上开启全面建设社会主义现代化国家新征程、向第二个百年奋斗目标进军的第一个五年。党的十九届五中全会深入分析国际国内复杂形势,就制定国民经济和社会发展“十四五”规划和二〇三五年远景目标提出建议;因此,本案例试图通过Python数据可视化,生成《中共中央关于制定国民经济和社会发展第十四个五年规划和二〇三五年远景目标的建议》报告的词云图,使我们更直观领会把握党的十九届五中全会精神要领。

标签:经管类

北京市房价分析预测

房子是每个人心中的大事,买好房,住好房是每个人的心愿。

标签:经管类