新闻公告

首页 -- 中心新闻

新闻公告

第七届中国 R 语言会议(北京)纪要

2014-05-26

第七届中国 R 语言会议(北京会场)于 2014 年 5 月 24 -25 日在中国人民大学成功召开。第一日 举办于如论讲堂,第二日举办于明德商学楼 0102,0202 以及 0302 三大分会场。

一、会议概况

会议由中国人民大学应用统计科学研究中心、中国人民大学统计学院、北京大学商务智能研究中心、 统计之都(cos.name)主办。量邦科技是本次会议的协办方。在两天的会议时间里,参会者齐聚一堂,就 R 语言在互联网、商业、统计、生物、制药、可视化等诸多方面的应用进行了深入的探讨。

本次会议约有 1100 多名参会者前来参会,规模创历届之最。报名者共六百多家单位,包括两百多家大 学及研究机构和四百多家公司。

二、会议内容

本次会议讨论的主题涵盖了 R 语言在编程艺术、深度学习、文本挖掘、社交网络、云计算、广告定向、 量化投资、视频分析、可视化、大数据、并行计算、数据挖掘、商业决策、数值计算、药物研发、计算模 型等众多方面的最新进展。

大会在会议主席冷静与荣誉主席吴喜之老师的真诚致辞中拉开帷幕,两天共呈现了 33 场精彩的主题演 讲。除主题演讲外,会议第一天还穿插了企业科研单位的 Lighting Talk、特邀嘉宾关于数据科学产业的大 讨论、线下数据交流之夜等环节,交流学习形式更加丰富多样,较之前会议更加注重参会者的交流与讨论。

其中关于大数据/数据科学之产业&教育主题的集中讨论与答疑环节邀请到了重量级嘉宾,包括吴喜之、 王汉生、余凯、姚远、杜长嵘、胡浩、刘道明等知名学者、业界大咖,在当前人言谈必及大数据的环境下, 各位数据科学领域的先行者都从自身出发,深入阐释了自己对于大数据的理解以及对于未来的展望,给略 微有些浮躁的大数据氛围指出了更加明晰的发展路线,观点鞭辟入里,发人深省。晚上的数据之夜活动是 本次活动的亮点之一。众人平等相待,把酒言欢,在畅谈中相互学习、切磋交流。

会议第二天分三个会场,演讲内容涉及多个数据分析领域(包括数据模型、量化投资、可视化、大数 据、数据分析、生物心理学等专场),各会场主题明确,内容集中,便于参会者交流与讨论。从现场情况 来看,各分会场均人气颇高,虽然场地所限,天气炎热,但各会场仍挤满了席地的听众,大家对数据科学 热情高涨。

三、大会主题演讲

1、吴喜之教授与会议主席冷静致辞

在会议主席致辞环节中冷静主席回忆了自己与 R 的各种趣闻轶事,在引人忍俊不禁的同时又发人深省, 回顾过去而又不忘展望未来,在娓娓道来中描绘出 R 语言的强大威力与光明图景。 随后德高望重的吴喜之教授发表了讲话。吴喜之教授是统计学的前辈,在推广 R 的进程中属于中国的 开拓者。吴老师随手采撷的个人经历中的些许片段,以及足以引人入胜,让大家津津乐道了。

2、Hadley Wickham: R packages: principles and best practices

你可能从来没有想过自己写过 R 包,毕竟你只是一个数据分析人员,每天与 Data 打交道,写写画画, 计计算算。但是有很多的数据分析工作并不是特别简单,是不太可能用很少的几行代码轻松解决的。因此, 说来道去,还是非得写自己的包不可。Hadley 先生告诉大家一句话:packages are easy. 只要开始书写自 己的函数,那么写一个 R 包也是很快就可以上手的。

3、David Smith:How to growth of R helps data-driven organizations succeed

R 语言的发展日新月异,每一天的清晨都有新发现。作者信马由缰,看似无拘无束,其实提纲挈领。在 与自己的喜好相结合的同时,也道出了 R 发展的天机。

4、余凯:Deep Learning Unfolds Big Data Era

余凯先生来自百度深度学习研究院,任常务副院长,同时担任南京大学和北邮兼职教授,中科院计算 所客座研究院,国家“千人计划”专家,中关村高端领军人才及北京市海外高层次人才。近年来,他领导 的团队是的深度学习在互联网广告业务和网页搜索排序获得突破性的进展。其演讲的内容深入浅出,讲解 在大数据中巧妙的找到平衡。

5、周明:计算机对联和诗词

周明是微软亚洲研究院自然语言计算组首席研究员,中国计算机学会通讯动态栏目主编。他是中国第 一个中-英机器翻译系统 CEMT-I、日本最富盛名的中-日机器翻译系统 J-北京的发明人。对自然语言计算的 精深理解加上对诗词的巧妙认识,开发出一整套对联系统。演讲的内容贴近生活、简单易懂、妙趣横生, 同时又能够将统计算法渗透在里面,让大家大开眼界。

6、王汉生:A Statistical Model for Social Network Labeling

王汉生老师是统计学博士,北京大学教授、博士生导师,现任北京大学商务智能研究中心主任。王老 师的演讲以微博为案例,首先详细阐述了挖掘用户标签信息对于挖掘用户信息的动机和价值,然后为能更 高效利用用户标签信息,同时可以高效运算,便提出了一种基于网络结构的统计模型,能够准确预测用户 缺失的标签信息,在实际应用中还比较有效。

7、胡浩:云计算时代的量化投资

胡浩先生现任微量网络科技的 CEO。目前,他主导的“微量网”项目是互联网证券金融的领导品牌,搭 建了投机策略提供者和策略使用者之间的“云交易”平台。在此之前,云计算和量化投资还仅仅只有像是 专业人士才能进行的投资。但现在,只要你有模式的思维,数据储存,模型测算,IT 执行都已经不是难题。 换句话说,如果你能够从量化的角度找到规律性的东西,那么你也可以成为一个高效的量化投资者。

8、靳志辉:广告定向中的用户分析

靳志辉先生先后毕业于北京大学计算机系计算语言所,日本东京大学。目前在腾讯担任研究员。腾讯 拥有庞大的互联网用户和流量,如何挖掘这些海量的用户行为数据以支持腾讯广告业务中的精准定位是腾 讯互联业务中的一个难题。本次演讲主要分享了腾讯广告点对点团队在以上问题中的一些积极地尝试。

9、刘道明:R 与金融大数据挖掘

刘道明先生是本次 R 会议的特邀嘉宾,他是光大证券研究所金融工程研究部总经理,首席金融工程师。 长期从事数量化投资特别是金融大数据用于数量化投资方面的研究工作。作为证券基金业系统性推广 R 语 言的第一人,长期在业内进行各种类型的语言推广、培训工作,为 R 语言进入证券基金业做出巨大贡献。 本次演讲中,刘道明先生从 R 语言用于金融投资研究的团队实践、数据分析平台的框架结构、文本挖掘三 个方面深入细致探讨了 R 在金融大数据挖掘中的应用实践,内容精彩实在,会场反响很热烈。

10、郑义:基金评选平台之建立

郑义先生是美国爱荷华大学财务博士,专长于投资组合理论与金融咨询系统开发。本演讲将多个基金 指标融合为单一总和指标,并藉此挑选较佳的基金产品,提供消费者简易而且有效的基金评选平台,此外 鉴于退休规划之需求日益提升,本平台亦推荐数种严控风险的投资组合,作为长期投资之参考。 11、廖逸竹:玩转三亿视频——数据分析在视频产业中的应用 演讲以大家众所周知的万万没想到为例,讲解数据分析在生活中的应用。

大家表示“纷纷中枪”,数 据果然一针见血,能够抓住生活中的真实。

12、大数据专场

大数据专场畅谈了随着大数据概念的发展,新数据的产业是怎样一番图景、在实战中又会有那些真实 地瓶颈、又有着那些重大的突破。在新的产业下有新的动态,新的动态下有新的发现。

13、R 与技术流专场

在 R 语言中,有哪些高深的技术?什么样子的编程称得上是一种艺术?可视化是怎样将数据中的信息 发挥到了极致?代码的背后有什么样的数学支持?凡此种种都值得我们深思。这里的每一场演讲都是精华, 信息量众多值得学习。

14、量化、生物以及心理学应用专场

在这里有程序化交易的开发,有金融大数据的应用,有新药研发的知识,有 SEM 在心理学中的光彩。 不论你来自哪行哪业,不论你心醉与哪门哪派,在这里总有一款适合你。

四、嘉宾讨论

会议期间,在林祯舜博士的主持下,各位参会嘉宾一起讨论了 R 在企业的应用中的关键问题和未来趋 势。台下嘉宾问题很多、台上嘉宾积极回应,在会议正式结束之后,各位依然三三两两,自行组团讨论。

五、感想与建议

两天的会议是一场巨大的成功:对于学生来说,我们接触到了书本中学习不到的产业实际应用,更好 地理解手中的理论武器与编程工具,而不会再有空有一身屠龙技而无处施展的惆怅;对于从业者来说,会 议提供了一个氛围良好的交流共享平台,一方面能够传达自己的理念,一方面能够与新鲜的血液接洽,让 自己在日新月异的科技中紧跟浪潮,发现有潜力的人才。

当然,在会议上除了能够了解到众多新奇的知识、概念与方法,更重要的是我们能够结识来自四面八 方的志同道合的 useR(R 语言的用户),分享知识、聚集智慧、沉淀情感。“相见时难别亦难”,众多不 同年龄段的人们能够有这么一次聚会实属不易。虽然在会议之前,大家都是擦肩而过,点头之交,经过这 一次活动的摩擦,融合,彼此都成为了人生经历的一部分,再也不会割裂。在短短的两天当中,与会者之 间建立起了联系,而会议筹备者之间经历了浓缩的两天,将友谊达到了新高度。

一年一度一相聚,一年一度一收获,一年一度一别离。会议在一系列紧张的准备工作中开始,又在众 人的品味和畅谈中结束,七届元老与新生力量的紧密合作,让走过七年风风雨雨的 R 会议更加开放、包容 与有责任感。展望未来,我们仍将抱着“十年磨一剑”的决心,秉承统计之都专业、人本、正直的理念, 为打造更加开放、科学、自由的数据分析平台而努力!

最后,由衷感谢王汉生教授对于会议给与的极大支持,以及来自中国人民大学及统计之都的年轻志愿 者。没有他们的兢兢业业,任劳任怨,会议是难以成功组织起来的。

会议委员会包括:冷静(主席)、霍志骥(秘书长)、魏太云、高涛、陈昱、李妙竹、肖楠、谢益辉、 邓一硕、陈堰平、林祯舜、王剑、林荟、刘思喆、李舰、苏建冲、肖展航、陈森、邱怡轩、陈钢、陈逸波、 郝智恒、张翔、陈丽云等。

R 语言会议官方网站:http://china-r.org