新闻公告

首页 / 新闻公告 / 中心新闻 /

新闻公告

“统计大讲堂”系列讲座第一百二十一讲顺利举行

2020-06-17

6月16日下午,“统计大讲堂”第一百二十一讲顺利举行。此次讲座为线上讲座,共有百余名师生通过腾讯会议参与研讨。讲座以“数据科学在互联网教育的应用与实践”为主题,邀请了51Talk首席数据科学家、大数据智能中心负责人刘思喆作为报告人。统计学院老师、中心研究员吕晓玲、黄丹阳参加讲座。本次讲座由统计学院副院长李扬主持。

李扬介绍了报告人刘思喆的相关信息。刘思喆是51Talk首席数据科学家,大数据职智能中心负责人,负责商业流程算法优化、数据产品、数据平台建设,以及数据分析团队的管理及技术指导工作。同时他也是“统计之都”理事会成员,中国人民大学大数据分析实验班、首经贸信息学院校外硕士生导师,《153分钟学会R》的作者,《R语言核心技术手册》的译者。

刘思喆首先借助大量数据向大家简要介绍了51Talk和在线教育行业的现状,从学员分布、实例展示、培训结果、商业逻辑等方面给出了可视化分析,进而引出如何确定目标用户的问题,即通过第三方提供的不同类别、不同标签的个体信息及其覆盖度,计算目标用户在平台消费的概率。他总结了一系列从正、负向影响付费的指标,以实现通过构建模型大致计算具有某些标签的用户的消费概率。之后,他以51Talk的运行模式为例,重点介绍了人工智能在教育领域的应用,从以下四个方面展开说明:用数据量化学习过程,将分析后的数据提炼为标签并构建起完善的系统,从而高效直观地了解学生的学习效果;用模型控制意愿流向,通过建立注册用户付费概率模型和COX比例风险回归模型,实现管理和运营的智能化;用技术实现智能降噪,基于人工智能的软核解决方案实现人声与噪音分离,保证良好的教学环境;用概率评估教育效果,通过大量模型的构建进行自适应测评并根据结果制定教师推荐策略,提高了约课率和好评率。最后,他提出互联网教育在数据科学领域仍有许多待探索待开发之处,如何利用数据来衡量和评价教学效果是我们持续面临的挑战,他也表达了对于教研、技术、产品、数据的完美整合形态的期待。最后,结合数据科学的发展趋势,他向同学们寄语:“It’s a beautiful thing when free data meets free algorithm”。

在交流和提问环节,李扬提出了“如何计算多标签用户的消费概率”和“如何使用基于BPFR模型建立的教师推荐系统”这两个问题,并就如何根据实际数据对现有的模型和方法进行优化和创新这一问题与刘思喆展开讨论。对于在线师生提出的“如何建立分析学习影响因素的模型”等问题,刘思喆也给出了细致的解答。

通过刘思喆的回答和深刻的探讨,大家对于数据科学在互联网教育方面的重要意义有了更深层次的理解。此后统计大讲堂系列讲座还将陆续推出精彩讲座,敬请关注。