“统计大讲堂”系列讲座第四十八讲——“双一流”学科建设顾问专家报告
2018-07-17
6月29日,我院有幸邀请到宾夕法尼亚大学沃顿商学院的蔡天文(Tony Cai)教授为参加统计学院夏令营的同学进行了“双一流”学科建设顾问专家报告。报告开始前,我院副院长尹建鑫教授对蔡教授的到来表示欢迎后,向同学们介绍了蔡教授的经历。蔡教授现在是宾夕法尼亚大学沃顿商学院的Dorothy Silberberg教授,并且曾经获得过拥有统计界“诺贝尔”奖之称的COPSS总统奖,是世界知名的统计学家。
今天,蔡教授为同学们报告的题目是《Statistical Analysis of Big Data: A Few Problems and Challenges》。首先,蔡教授向同学们展示了大数据时代的变化。蔡教授回顾,二十一世纪之初,互联网改变了我们的生活方式。而现在,大数据也如同当年的互联网一样,改变着我们的世界。哈佛商业评论也认为数据科学家是21世纪“最性感的职业”。然后,蔡教授说到,美国的Google和Facebook及中国的阿里巴巴和腾讯集团都是当今最具影响力的企业之一,他们共同的特点是数据是公司最有价值的财产,且这些公司20年前都不存在。对比于老牌大公司ExonMobil, BHP billiton等,这些新兴公司的市值已经远远超过了他们。这说明随着大数据时代的到来,对企业的冲击也是巨大的。
接着,蔡教授向同学们介绍了大数据在各个领域的应用。蔡教授认为大数据技术最有潜力且最有需求的领域就是个性化医疗领域。其次,大数据技术对于科学研究的帮助也是巨大的,在宇宙学的信号探测,生物学的基因研究等等,大数据技术都有相当的用武之地。接着,是工程学上的应用,特别是量子计算的研究,离不开大数据技术的发展。然后,对政府而言,利用大数据技术预防流感和预防犯罪也有很有效的帮助等等。
然后,蔡教授向同学们阐述了大数据中“大”的含义。蔡教授说到,大数据之大,首先在于数据量的增大,对于计算和方法的适用性上带来了挑战;其次,随着数据的增加,数据类型也变得多种多样。蔡教授还介绍了宾夕法尼亚大学医学院对于大脑的研究,不仅仅着眼于大脑功能的变化,还关注着大脑的形状,期望探索出大脑形状对大脑功能的影响。而形状数据,就是一类新型的数据类型。之后,蔡教授就个性化医疗,图及网络,低秩矩阵恢复和矩阵补齐等具体领域,向同学们介绍了当今统计研究在不同领域的研究内容及其意义。
最后,蔡教授向同学们简述了大数据分析的挑战。蔡教授介绍到,在大数据时代最直接的挑战就是方法精度和计算效率之间的权衡。传统统计方法更多地在意统计方法的精度,即统计方法是否有效,而不太在意计算的效率。而在大数据时代,计算效率则是不可忽视的技术问题。蔡教授还介绍了甚至某些问题还可能存在所有能够保证精度的统计方法,都无法在可接受的时间内计算出来,而所有能在可接受的时间内计算出来的统计方法,都无法保证其精度的情况。其次,在大数据时代,对于分布式存储的数据及流数据,如何进行统计推断则是另一个十分重要的挑战。
但是,蔡教授认为,这些挑战都是技术上的挑战,这些挑战终将会被解决。而目前对于大数据时代而言,最大的挑战是人才紧缺。这不仅包括专业数据分析的人才紧缺,还包括能够理解大数据分析结构并进行决策的经理人和分析师的紧缺。于是,蔡教授对同学们说,我们生活在激动人心的时代,我们的时代来临了。并鼓励同学们只要在统计和数据科学领域认真学习,就一定不会学无所用。
报告结束后,蔡教授和同学们又进行了积极热烈的讨论。