用数据让互联网痕迹和互联网记忆永驻。
用信息量更丰富、可拓展性更强的卫星图像和机器学习模型来解析非洲的财富状况。
一个智能经济的时代已经来临。人们在畅想智能化给经济发展带来的无限空间的同时,也常常伴随着诸多担忧甚至恐惧。其中最常见的就是“机器取代人类”、“智能化将造成大量失业”的梦魇。这也让一些人产生困惑:是不是如果大力发展智能经济,就会造成大量失业?如果要稳就业,就要重点投资传统基础设施?大力发展“新型基础设施建设”与“稳就业”这样的政策组合,是不是矛盾的呢?
青年一代在数字科技领域中如何择业?如何在“职前”积累能量?如何在“职后”创造价值?
本课程面向社会科学研究者,采用Python介绍机器学习的基本逻辑(需要学员提前安装Anaconda),主要内容包括三(或四)个部分:1. 机器学习简介:从泰坦尼克号讲起;2. 机器学习初步: 朴素贝叶斯与线性回归;3. 机器学习进阶:支持向量机与随机森林;4. 机器学习扩展:基于Pytorch的神经网络模型(备选)。
人工智能引发的伦理讨论日益进入社会责任的议程,这同样需要在技术层面考量和落实伦理的要求。本课程从案例出发,讲解机器学习中与公平性相关的技术措施,降低出现负面后果的风险。
现有的中心化和分布式机器学习机制所伴随的数据获取成本高、易被攻击、缺少高效数据融合方法等缺点,限制了数据资源的开发以其流通,在很大程度上阻碍了机器学习的广泛落地应用。为解决这些问题,本项目的研究中提出去中心化建模的概念,与传统分布式建模不同,将模型训练分散到海量数据端,建设一个利于机器学习的数据资源可持续开发与流通的生态环境,促进未被利用的海量数据的价值开发,对互联网、大数据、人工智能同实体经济深度融合具有重要的推进作用。
在仿真模型代码编写或者人工智能具体的应用场景的实践过程中,都包含着我们对个体或群体假定。算法的构建不仅是一个技术层面的编码,同时还包含了数据工程师对社会场景、个人、群体的认知与假定。在计算社会科学的发展路径中,算法审计是一个重要的研究方向。
当机器真正拥有了理解能力时,当强人工智能时代到来之时,人如何理解自身和机器?关注着“人”的社会科学又应如何发展?今天的社会学研究者,应当如何处理人工智能和社会学的关系?
大数据是什么?与传统数据有何种区别?为何与智能社会紧密相连?从算法到人工智能,学者面临着算法专利保护的“制度性黑箱”与理解和解释机器学习算法的“意义黑箱”。要试图理解智能社会的两个黑箱,我们不得不重新回到大数据何以作为生产要素的基本命题中,从大数据入手,理解人工智能。