聚类分析

物以类聚,人以群分。无监督学习在人类学习中占居主导地位,是监督学习的必要补充,聚类分析十其中的典型算法。本节结合主成分分析、潜类分析等传统方法,重点介绍k均值聚类和分层聚类,并通过该方法在相关研究中的应用来加深理解。

打开树模型的黑箱

本专题系统介绍传统树模型、分类回归树、集成算法、贝叶斯叠加回归树以及广义随机森林的基本原理。力图从算法的角度提升对树模型原理的理解,从而助力相关模型在社会科学研究中的应用。

计算社会科学的人工智能工具箱

为推动人工智能在计算社会科学中的理解和应用,开拓大数据与社会科学研究结合的策略视野,本讲座通过具体案例讲解以下内容:

·基于开放平台的自然语言处理、图像理解等

·零算法基础定制高精度人工智能模型

·与算法公平性相关的理论概念和技术措施

计算社会学的两大范式

课程将介绍计算社会学的两大发展范式:agent-based modeling的演绎范式,基于大数据计算的归纳范式。内容涵盖两大范式的基本框架内涵和学术应用。

计算社会科学导论

计算社会科学是计算科学、数据科学和社会科学相结合的新范式。本节从实证社会科学的困境出发,就计算社会科学的发展历史、基础概念、核心议题、发展趋势等进行总体性评价,并结合中国数字治理的最新实践,就中国的计算社会科学在知识生产和全球治理中的地位和作用提出新思考。

回归模型

化繁为简,大道至简。监督学习能够显著提升统计学的泛化能力。从传统的线性回归和逻辑斯蒂回归入手,重点介绍岭回归和拉锁回归在计算社会科学中的概念和原理。并通过赏析经典的社会科学研究来介绍该方法的应用场景。

自然语言处理

自然语言处理(NLP)处在认知智能最核心的位置,与计算社会科学的联系越来越紧密。本节主要围绕词法分析、文本分析和情感分析,结合研究案例分析其在理论建构和解释上的应用和新进展。

大数据和机器学习的社会学应用

基于近年来团队的研究成果,运用多来源大数据和量化历史资料,凸显大数据和机器学习对于多角度呈现中华文脉和宏观社会研究中的关键变量测量和预测的价值,并对将人文社科大数据和计算社会方法运用到社会学研究中去进行案例展示。