类别

社计师学院

类别

本课程面向社会科学研究者,采用Python介绍机器学习的基本逻辑(需要学员提前安装Anaconda),主要内容包括三(或四)个部分:1. 机器学习简介:从泰坦尼克号讲起;2. 机器学习初步: 朴素贝叶斯与线性回归;3. 机器学习进阶:支持向量机与随机森林;4. 机器学习扩展:基于Pytorch的神经网络模型(备选)。

现有的中心化和分布式机器学习机制所伴随的数据获取成本高、易被攻击、缺少高效数据融合方法等缺点,限制了数据资源的开发以其流通,在很大程度上阻碍了机器学习的广泛落地应用。为解决这些问题,本项目的研究中提出去中心化建模的概念,与传统分布式建模不同,将模型训练分散到海量数据端,建设一个利于机器学习的数据资源可持续开发与流通的生态环境,促进未被利用的海量数据的价值开发,对互联网、大数据、人工智能同实体经济深度融合具有重要的推进作用。

本课程上午是理论课程,围绕如何使用深度学习进行展开,以全连接导入,介绍包括建立模型、损失函数、参数学习等过程;并在此基础上讲述卷积神经网络的特性,详细讲解如何使用卷积层、池化层建立卷积神经网络,如何使用卷积神经网络解决自然语言处理中的文本分类问题。下午为实践课程,针对上午所学理论知识,学会如何使用飞桨搭建DNN模型,并在此基础上,学会如何使用CNN来实现微博谣言检测任务。最后介绍飞桨预训练模型管理工具PaddleHub的使用。

从技术的角度来看,人工智能借助标注数据和先验知识获得快速发展,突出体现于感知智能和认知智能,分别对应以机器学习尤其是深度学习为代表的联结主义和以知识图谱中逻辑表示和推理为代表的符号主义。为推动人工智能在社会科学领域中的理解和应用,发展计算社会科学,开拓大数据与社会科学研究结合的策略视野,最终提高研究的创新水平和工作效率,本课程结合具体案例讲解以下内容:(1)基于深度学习的自然语言处理和图像理解,零算法基础定制高精度AI模型;(2)知识图谱在社会计算中的应用。