社会科学家的机器学习

本课程面向社会科学研究者,采用Python介绍机器学习的基本逻辑(需要学员提前安装Anaconda),主要内容包括三(或四)个部分:1. 机器学习简介:从泰坦尼克号讲起;2. 机器学习初步: 朴素贝叶斯与线性回归;3. 机器学习进阶:支持向量机与随机森林;4. 机器学习扩展:基于Pytorch的神经网络模型(备选)。

人工智能中的算法治理:审计与干预

人工智能引发的伦理讨论日益进入社会责任的议程,这同样需要在技术层面考量和落实伦理的要求。本课程从案例出发,讲解机器学习中与公平性相关的技术措施,降低出现负面后果的风险。

深度学习入门与实践

本课程上午是理论课程,围绕如何使用深度学习进行展开,以全连接导入,介绍包括建立模型、损失函数、参数学习等过程;并在此基础上讲述卷积神经网络的特性,详细讲解如何使用卷积层、池化层建立卷积神经网络,如何使用卷积神经网络解决自然语言处理中的文本分类问题。下午为实践课程,针对上午所学理论知识,学会如何使用飞桨搭建DNN模型,并在此基础上,学会如何使用CNN来实现微博谣言检测任务。最后介绍飞桨预训练模型管理工具PaddleHub的使用。

面向数据生态的分布式机器学习

现有的中心化和分布式机器学习机制所伴随的数据获取成本高、易被攻击、缺少高效数据融合方法等缺点,限制了数据资源的开发以其流通,在很大程度上阻碍了机器学习的广泛落地应用。为解决这些问题,本项目的研究中提出去中心化建模的概念,与传统分布式建模不同,将模型训练分散到海量数据端,建设一个利于机器学习的数据资源可持续开发与流通的生态环境,促进未被利用的海量数据的价值开发,对互联网、大数据、人工智能同实体经济深度融合具有重要的推进作用。

开放数据的获取与可视化

本课程将介绍利用开放数据进行累积性研究的思路,介绍开放数据来源与获取方式,通过实例讲解开放数据获取方法,提升开放数据整理加工和分析能力。

人类新议题:算法社会的到来

算法是什么?如何理解算法的“前世今生”?算法作为当今社会发展的最热议题,其政治、经济和社会科学上的意义是什么?如何研究算法?未来的算法社会将如何发展?

计算社会科学的人工智能工具箱

从技术的角度来看,人工智能借助标注数据和先验知识获得快速发展,突出体现于感知智能和认知智能,分别对应以机器学习尤其是深度学习为代表的联结主义和以知识图谱中逻辑表示和推理为代表的符号主义。为推动人工智能在社会科学领域中的理解和应用,发展计算社会科学,开拓大数据与社会科学研究结合的策略视野,最终提高研究的创新水平和工作效率,本课程结合具体案例讲解以下内容:(1)基于深度学习的自然语言处理和图像理解,零算法基础定制高精度AI模型;(2)知识图谱在社会计算中的应用。

文本分析与因果推论

针对文本挖掘重在描述性分析的局限性,探讨如何利用文本数据开展因果推论,介绍结构主体模型、文本匹配、大数据+小数据以及大数据实验设计等研究方法。

数字化与实证社会学

以新一代数字技术为底层支撑的数字时代为背景,针对传统实证社会学存在的宏观与微观解释、数据与理论驱动、同质性与异质性等内在张力,本讲座结合最新研究案例,试图从研究设计的维度探讨应对挑战的可能路径。