本课程上午是理论课程,围绕如何使用深度学习进行展开,以全连接导入,介绍包括建立模型、损失函数、参数学习等过程;并在此基础上讲述卷积神经网络的特性,详细讲解如何使用卷积层、池化层建立卷积神经网络,如何使用卷积神经网络解决自然语言处理中的文本分类问题。下午为实践课程,针对上午所学理论知识,学会如何使用飞桨搭建DNN模型,并在此基础上,学会如何使用CNN来实现微博谣言检测任务。最后介绍飞桨预训练模型管理工具PaddleHub的使用。
算法是什么?如何理解算法的“前世今生”?算法作为当今社会发展的最热议题,其政治、经济和社会科学上的意义是什么?如何研究算法?未来的算法社会将如何发展?
本课程将介绍利用开放数据进行累积性研究的思路,介绍开放数据来源与获取方式,通过实例讲解开放数据获取方法,提升开放数据整理加工和分析能力。
从技术的角度来看,人工智能借助标注数据和先验知识获得快速发展,突出体现于感知智能和认知智能,分别对应以机器学习尤其是深度学习为代表的联结主义和以知识图谱中逻辑表示和推理为代表的符号主义。为推动人工智能在社会科学领域中的理解和应用,发展计算社会科学,开拓大数据与社会科学研究结合的策略视野,最终提高研究的创新水平和工作效率,本课程结合具体案例讲解以下内容:(1)基于深度学习的自然语言处理和图像理解,零算法基础定制高精度AI模型;(2)知识图谱在社会计算中的应用。
针对文本挖掘重在描述性分析的局限性,探讨如何利用文本数据开展因果推论,介绍结构主体模型、文本匹配、大数据+小数据以及大数据实验设计等研究方法。
以新一代数字技术为底层支撑的数字时代为背景,针对传统实证社会学存在的宏观与微观解释、数据与理论驱动、同质性与异质性等内在张力,本讲座结合最新研究案例,试图从研究设计的维度探讨应对挑战的可能路径。
针对不同来源的非结构化的文本数据,本专题尝试讨论深度学习对社会学的影响,并结合研究实例,探讨深度学习在文本数据处理中的适用性和具体应用场景。
监控和隐私保护虽然不是一个新问题,但在大数据、人工智能时代背景下,特别是疫情常态化下表现出新的特点,伦理学、政治学、法学、传播学、社会学、心理学、经济学都从不同的视角进入这一问题,但要理解和面对这一问题必须了解监控的发展历程,和伴随着的隐私观念及隐私保护策略的变化。本课程将系统梳理监控崛起和隐私退让下的隐私策略,关注个人信息保护问题的当下和未来。
基于近年来团队研究成果,运用多来源大数据和量化历史资料,以可视化和远观总揽的方模式,凸显大数据视角对于历史与社会的透视价值,多角度呈现中华文脉和当代中国社会脉动的不同侧面,并对如何将人文社科大数据和计算社会方法运用到社会学研究中去进行案例展示。
费孝通群学讲坛·社计未来 社会科学家的第…