由于国内“新冠肺炎”疫情原因,电子科技大学教授,新经济发展研究院执行院长周涛未能到场。
他用视频的形式,从“计算社会经济学”的角度和在场的观众分享了未来如何以更高效率和更低成本来研究社会经济发展中的各种现象,从而量化实现联合国可持续发展目标11(SDG11)的进程。
此外,周涛教授还分享了如何用大数据监测和防治此次新冠肺炎疫情。
以下为演讲内容全文。
大家好,非常抱歉我无法亲临现场参加本次WUF10“科技创新驱动未来城市:新经济与共享城市繁荣”分论坛。
一是因为我接到一个新的风险研究任务,需要利用大数据和人工智能来预测正在发生的新冠肺炎疫情的未来发展趋势,我们所使用的方法即是我稍后要介绍的内容;二是为响应中国政府降低病毒全球传播的风险,所以我委派了我们团队最优秀的成员来参加本次大会。
言归正传,今天我分享的主题为计算社会经济学。
近年来,社会科学方面的研究越来越依赖于多源的高质量真实数据,然而,传统的数据获取方式存在很多的局限性。
例如通过问卷得到的数据往往样本规模很小,而且数据可能存在系统误差,因为问卷的回答往往倾向于给出更容易被社会接受的答案,而非真实的答案。
更准确且更大规模的数据,例如经济普查数据,又往往要消耗大量的资源才能获得,并且时效性很差。
在很多贫困的地区,这种全国性的普查甚至是不现实的。
所以我们需要新技术和新数据。
典型的新数据包括卫星遥感、移动通讯、社交媒体等数据。
而新技术包括数据挖掘、机器学习、统计物理等。
以上的这些挑战和尝试,为计算社会经济学这一新兴学科带来机遇。
它基于大规模的真实数据,用定量化的手段研究社会经济发展中的各种现象,特别是与社会过程有关的经济发展问题,以及与经济发展有关的社会问题。
在上面的定义中,有三个要素极为关键:第一个是“真实数据”、第二个是“大规模”、第三个是“定量化”。
“真实数据”是指在受试者不知情的情况下收集的数据。
如果你是一位受试者,你的信息不是通过调查问卷填报一些信息,而是来自于你的生活的记录(比如来自Twitter、Facebook或手机通信数据),因此你对研究的影响因子毫不知情。
但它又会带来一些问题,这将在后面进行讨论。
第一个例子是研究社交网络中的宗教隔离。
有证据表明,人们通常不希望与不同宗教信仰的人保持亲密关系或频繁互动。
因此,不同信仰的人倾向于形成相对孤立的团体,这种宗教隔离将会增加宗教之间的偏见,并导致区域暴力和群体间冲突。
然而,获得宗教隔离的公开数据并不容易,因为有关他们信仰的问题通常是敏感和冒犯的。
我们从微博用户中把有宗教信仰的用户找出来,并根据用户之间的关注关系形成了宗教网络数据。
基于这些数据,我们分析得出以下结论。
首先,不同宗教之间的隔离非常严重。
信仰同一宗教的用户连边(关注关系)为98.4%,而只有1.6%的连边跨越不同宗教,这明显比种族隔离和政党隔离更严重。
其次,跨越宗教的连边对于维持网络整体的连通性起到了决定性的作用。
第三,佛教徒是最具开放性的,佛教徒关注其他宗教信徒或被其他宗教信徒关注的可能性都要更大。
最后,所有的跨宗教连边中有一半都和慈善有关,因此,如果你想要加强不同宗教之间的交流,慈善是一个很好的契机。
第二个例子是利用手机数据来预测卢旺达地区的贫困情况。
然而,收集卢旺达的经济情况数据是不可靠的,科学家们对856名手机用户的家庭经济情况进行了详细的调查,让每个用户回答了工资、福利、固定资产等75个问题,并详细记录了每个用户手机的使用时间,频率,呼入与呼出,通信网络,移动性等数据。
然后通过机器学习方法,建立利用手机数据预测家庭经济情况的模型,从而可以以很高的精度直接从手机数据中推测卢旺达150多万家庭的经济情况,进而准确地构建整个卢旺达的财富分配图景,相对贫困的个人可以被准确地识别出来。
通过调查验证,预测模型与真实情况的相关系数约为0.8。
最后一个例子是政治动员中的社会影响分析。
实验将2010年11月2日(美国国会选举之日)访问Facebook网站6100万的所有18岁以上用户随机分配到社交消息组、信息消息组或对照组。
社交消息组的“新闻提要”顶部显示了一条消息,鼓励用户投票;提供查找本地投票地点的链接,显示一个可点击的按钮,显示“我已投票”;显示一个计数器,指示以前有多少其他Facebook用户曾报告投票;并显示最多六个随机选择的小“用户的Facebook朋友的个人资料照片,这些用户已经单击了“我投票”按钮。
信息性消息组显示了消息,民意调查信息,计数器和按钮,但未显示任何朋友的头像。
对照组在其新闻Feed的顶部未收到任何消息。
最终,社交消息组有20.04%的用户点击按钮“我投票了”,“信息消息”组的概率为17.96%,较社交信息组差2.08%。
这表明,公开的社交关系意味着您朋友的脸可以增强社交动员的能力。
综上所述,这种结合全体尺度易获得数据,少量难以获得的高价值数据和机器学习算法,去推断全体尺度难以获得的高价值数据,是计算社会经济学研究中很有代表性的一种新方法,体现了社会科学和计算机科学理念和方法的深度融合。
计算社会经济学的应用领域不止我向大家展示的内容。
例如我们可以利用传感器数据监测城市内部的交通事故数量、利用高分遥感数据量化城市的水污染情况等。
此外,我们仍然面临许多挑战。
一是如何展现隐藏的因果关系。
大多数研究只能显示关系性,而不是因果关系,如果你想在某个传统活动中进行某项改变,则需要事件间的因果关系作为支撑。
第二个有趣的问题是如何构建传统技术和新技术之间的桥梁。
利用大数据技术,我们可以设计出更优的方案来进行实地调研和问卷调查。
第三个问题是如何避免科学道德中的潜在危险。
当我们运用真实数据进行大规模实验时,个人隐私需要备严格保护,同时实验过程需仔细评估,避免对社会弱势群体产生歧视或伤害。
最后,请允许我简单介绍我们正在进行的关于2019-CoV的研究。
我们建立了一个SEIR仓室模型来分析全国新增确诊病例增长情况,它不仅包括2019-CoV病例相关数据,还涉及到人口流动性和人口统计学的影响,具体细节这里就不再赘述。
事实上,除了湖北,其他省的确诊数量减少得很快,截止昨天,新确诊病例数量连续下降了5天。
在我准备这个报告的时间里,包括湖北在内,全国新增确诊病历数量的增长率已趋于稳定,情况已逐渐好转。
请看一些图片。
一个男人在向将要去武汉帮助病人的妻子告别,他们都知道那儿有多危险;医生和护士把他们的头发剪短,让防护服紧紧地贴在身上;医疗小组的成员们工作非常努力,累到稍有空闲就会睡着。
有一些人在与2019-NCoV的斗争中不顾自我安危,为了更多人的生命坚守在一线,他们中有65%是共产党员,而全中国共产党员的比例只有7%。
为什么包括医生、护士和工人在内的大批共产党员蜂拥来到武汉帮助那里的人们,是因为他们在入党的时候,都曾在党旗下宣誓,“随时准备为党和人民牺牲一切”。
这就是中国正在发生的事情,我们希望一切都会过去。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)