社计书香|王修晓、凌超:从这里开启计算社会科学研究之旅!

当前,人类社会正在经历新一轮的数字化、信息化和智能化大变革。互联网、大数据、云计算、人工智能、大语言模型、区块链等新技术正在日益融入经济社会生活的各个角落。与以往几次大的技术革命不同,在这次数字化转型过程中,中国正以其独特的优势和基础,以肉眼可见的速度稳步领先世界。截至2023年6月,我国移动电话基站达1129万个,其中5G基站293.7万个,移动互联网累计流量1423亿GB,活跃APP数量260万款,覆盖民众工作、学习和生活的方方面面。2022年底,我国移动物联网终端用户数18.45亿户,成为全球主要经济体中首个实现“物超人”的国家;数据中心总规模超过650万标准机架,在用数据中心算力总规模超180EFLOPS,数据存储量724.5EB;全国一体化政务数据共享枢纽发布各类数据资源1.5万类,208个省级和城市的地方政府上线政府数据开放平台。

党的二十大报告提出,加快建设网络强国、数字中国,把建设数字中国作为数字时代推进中国式现代化的重要引擎。面对日新月异、方兴未艾的数字化浪潮,传统社会科学研究范式已经越来越难以适应以大数据、云计算和人工智能为代表的经济社会新样态。在这个充满彷徨和迷茫的历史关口,以“社会科学家的第一节人工智能课”为愿景的《计算社会科学导论》问世,向学界发出清晰坚定的声音:社会科学家要勇敢拥抱计算社会科学,躬身入局、置身事内,积极投身数字社会研究,抓住计算社会科学带来的技术优势和历史契机,突破社会科学长期面临的方法论困境。

《计算社会科学导论》,吕鹏、范晓光主编,清华大学出版社2023年版

该书的主要目标,一是面向人文社科类专业的学生和从业者介绍计算社会科学的主要研究方法,二是面向计算科学类专业的学生和从业者介绍社会科学家关心的主要议题。无论是面向哪类人群,作者团队都作了大量的共情理解,努力在人文社科和计算科学之间搭建起一座沟通桥梁和互动平台。为了实现第一个目标,该书对“小白”较为友好,担心过多的数学原理、公式推导和代码写作吓退“文科生”,有意舍弃一些技术细节,从最简单的Python软件安装ABC开始,手把手地循循善诱。笔者就是这种典型的“文科生”,近些年来转向量化研究,想重新把学生时代所受的定量训练和软件操作捡起来,同时追踪计算社会科学的最新方法。

通读全书,可以感到该书的主要目标受众还是侧重第一类群体,即人文社科领域的学生和从业者。特别是第一章绪论,基本是站在人文社科从业者的角度,系统反思实证社会科学面临的宏观与微观解释、数据与理论驱动、相关与因果、同质性与异质性,以及信度与效度五大方法论困境。直面部分研究“把比常识还常识的研究发现当作重要创新”的尴尬和痛点,勾起人文社科从业者借助计算社会科学和数据科学最新方法,跳出传统研究泥潭的野心和抱负。

为了让人文社会科学从业者不会感到完全没有抓手,该书不仅在第一章绪论做了充分的理论准备,且在主体篇章介绍若干人文社会科学相对熟悉的“传统”方法,如回归分析、聚类分析和社会网络分析。当然,最堪称亮点的,还是机器学习、神经网络分析、自然语言处理、计算机视觉和基于多主体建模与仿真 (ABM)等计算科学色彩更为浓厚的最新方法。

《计算社会科学导论》就像一个研究数字社会的入门工具箱和进阶多宝盒,既有新手友好、趁手入门的成熟方法,又不遗漏进阶的前沿技术,基本涵盖计算社会科学的主要方法和最新进展。书中多数篇章附有人文社会科学领域的案例应用及Python代码和注释,数据集和代码都可以免费下载。该书由中国社会科学院社会学研究所研究员吕鹏和浙江大学公共管理学院“百人计划”研究员范晓光主编,联合学界和业界计算社会科学的中青年骨干,呕心沥血精心编写,立志通过“理论+案例+平台”的理念把此书打造成一本开源共享、不断迭代、与数字时代共同进步的新教材。

《计算社会科学导论》由国内人文社科学者主导完成,是我国计算社会科学教材的代表之作。如果说普林斯顿大学萨尔加尼克 (Salganik)的《计算社会学》更侧重“通识”的博雅导向,乔治梅森大学乔菲-雷维利亚 (Cioffi-Revilla)的《计算社会科学》更突出“专精”技术风格,该书则在文理交融、中西会通上独树一帜。该书可以是人文社科从业者的入门课,适合作为案头工具书随时查阅,同时也可以开拓计算科学学生对社科领域的兴趣和视野,帮助他们认识到数字技术与社会议题之间新的知识生长点。在如火如荼的大数据和人工智能时代,我们期待未来能有更多科研院所基于这本教材开设相关课程,培养出既掌握人文社科又精通计算科学的复合型创新人才,立足中国本土实践,打破学科专业壁垒,在数字时代挖掘并培育新的学术增长点,为建构中国自主知识体系提供扎实有力的前沿交叉方法支撑。

作者简介:

王修晓、凌超 中央财经大学社会与心理学院副教授、中央财经大学社会与心理学院数字生社会价值研究所特约研究员