“统计大讲堂”第156讲回顾:数据科学的实战案例分析
2021-06-02
5月27日下午,“统计大讲堂”系列讲座第156讲举行。本次讲座采取在线会议的方式,邀请九峰医疗首席数据科学家李舰作题为“数据科学的实战案例分析”的报告。统计学院白琰冰老师参加本次讲座,讲座由统计学院教授、应用统计科学研究中心研究员李扬主持。
李扬首先介绍了主讲人的相关信息。李舰现任九峰医疗首席数据科学家,兼任中国人民大学统计学院和华东师范大学统计学院硕士生校外导师。本科毕业于中国人民大学统计学院,博士毕业于辅仁大学商学研究所,专注于数据科学在行业里的应用,在医疗大数据、工业大数据等领域有多年的工作经验。参与编著了《统计之美》《数据科学中的R语言》《数据科学概论》等书,发表国内外期刊数篇,主持省部级科技项目一项。
李舰首先介绍并阐述了数据科学工程应用的一般流程,分别为:问题理解、数据理解、数据准备、数据建模、模型评价,模型部署六个方面,帮助我们对接下来要讲的零售和公共卫生这两个案例分析有更好的理解。
接下来李舰对零售行业所运用的数据科学进行分析。他以“某连锁奶茶品牌,想要新开一家门店,该如何选址?”为切入点,探索奶茶店周围有几家星巴克时的生意最好,盈利最高,对比说明了在这一方面数据科学相较于传统数据分析法的优势。
最后李舰分析了公共卫生行业的数据科学技术的应用。他从新冠疫情中的问题出发,探索是否有办法提升公共预警的能力,并向我们举例可以用来预警的模型和预警系统的验证方法,引导同学们去思考如何利用自己的专业知识来做出一个产品,从而提升公共预警的能力。
在提问交流环节,李舰首先向老师和同学们提出了两个问题,引导同学们思考数据科学在其他行业的应用,并耐心解答了老师和同学们的提问,与在线师生对此课题进行了深入的交流探讨。
本次讲座介绍了数据科学在零售和公共卫生这两个领域的应用。此后“统计大讲堂”系列将陆续推出更多精彩讲座,敬请关注。