问学讲堂聚焦大数据时代的统计

2015年7月5日晚,以“大数据时代,统计无处不在”为主题的问学讲堂在我院李达三楼二楼报告厅隆重举行。作为复旦管院恢复建院30周年的系列活动之一,哈佛大学文理研究生院院长孟晓犁教授、美国普林斯顿大学运筹与金融工程系系主任范剑青教授这两位复旦大学1978级数学系校友,同台讲述统计的美妙,阐述商业教育的真谛。我院副院长郑明教授主持了本次活动。

嘉宾合影

郑明副院长首先介绍了孟晓犁教授和范剑青教授在统计学界的卓越成就。“考普斯奖”是国际统计学的最高荣誉,每年只颁奖给一位40岁以下的统计学最杰出的学者。由于诺贝尔奖项中没有统计学,所以此奖在国际上被视为统计学“诺贝尔”奖。孟晓犁教授和范剑青教授都曾获得了此项殊荣,对统计学做出了重要而广泛的贡献。

孟晓犁教授率先发表了主题为“更大的数据、更深的探索、更好的理解”的精彩演讲。“统计的仙境与陷阱同时存在,而统计的目的就在于去伪存真。”统计方法,是运用概率方法去描述生活中的不确定性,从而区分数据中的信息与噪音。统计思想,则是运用对统计规律的理解去做出正确的推断与决策。孟教授以日常生活中的喝汤为例,深入浅出地阐述了抽样调查的精度等相关问题。

随后,孟教授介绍了他研究的课题“个性化治疗:太好了,可是谁是我的临床试验‘老鼠’?”。大数据意味着能将人看得更清楚,优点在于提供给一个人的方案是根据与其相像的人而制定的,但缺点在于没有两个人是一模一样的。从肾结石的案例,以及工资高低与SAT分数关系的案例,孟教授引出了辛普森悖论。传统统计在于,累积有代表性的个体资料去推断母体的特征。而大数据时代的统计,则在于寻找有相关性的近似母体去推断个体的特征。

孟晓犁教授发表主题演讲

范剑青教授则就五个方面发表了对于大数据的看法,一是大数据无处不在;二是大数据能做什么;三是大数据的特征和影响;四是大数据时代的机会与挑战;五是互联网中的大数据。

“大数据不仅大,而且很复杂,既有结构性的数据,也有非结构性的数据,与生物、工程、自然科学、社会科学等息息相关。”大数据有两方面富有挑战的问题,异质性和共性。异质性能提供个性化的医疗和服务,共性则存在于不断的变化之中。“研究大数据,不仅能够预测未来,更重要的是探索其中的因果联系。”

大数据的影响包括数据获得、数据管理、计算基础建设、计算优化等方面。大数据对统计分析的影响则包括噪声叠加、假相关、内生性、误差、异质性等。在大数据时代,机会与挑战并存。范教授认为,统计学的梦想,在于找到有效的统计方法,运用合适的计算手段,预测未来。

范剑青教授发表主题演讲

孟教授和范教授的精彩演讲获得了经久不息的热烈掌声,在场的同学和校友们积极踊跃地提问,纷纷得到了两位教授的专业而又细心的解答。至此,本次讲座圆满地落下了帷幕。

“问学讲堂”是复旦大学管理学院最高层次的论坛,以“兴邦立业、问道治学”为宗旨,分享前沿专家学者的新思想、新发现和新成果。“问学讲堂”会一如既往地举办优质的讲座,解读时下经济热点、把握前沿管理趋势,搭建深度交流和深入研讨的高端平台。

 

统计学系

管理教育推广与发展中心

2015年7月7日