当前位置: 首页> 要闻动态列表 >要闻动态详情

人工智能时代下,我们如何进行社会科学研究

作者:中国社会科学网
发布时间:2024-03-18
收藏 纠错

  

  人工智能如何改变了科学研究,特别社会科学研究?在这一方面,人工智能有什么优势和缺陷?基于人工智能对社会科学研究的深度影响,我们应该如何在新形势下学习和使用人工智能以更好地服务于社会科学研究呢?

  为社会科学研究提供强大动力和发展空间

  人工智能 (Artificial Intelligence),是一种模拟人类智能的计算机系统。它可以用于分析和解释大数据、识别模式和趋势,并做出预测或建议。科学研究的本质就是知识生产。在前人工智能时代,知识生产模式主要有两种:其一以个体探究、兴趣导向为主,即个体知识生产,比如科学家自主研究其感兴趣的话题;其二以政府或者企业干预、应用导向为特征,即组织知识生产,如国家组织一系列研究所对某一重大问题进行科研攻关。随着人工智能时代的来临,以信息基础设施以及信息技术的广泛应用为特征的知识生产模式应运而生,即智能知识生产。这种模式的出现,使得知识生产的路径、动力机制都发生了革命性改变。

  第一,由于人工智能工具的使用,科研人员在研究中的角色从“全程式”参与转变为“环节式”或“节点式”参与。一方面,研究所需要的准备性工作和基础性任务可以交由人工智能完成,这极大节约研究人员的时间。研究人员可以将精力更多投入创造性的科研活动中去。另一方面,利用人工智能,研究人员在科研合作中的比较优势得以充分发挥。在一项科研项目中,不同研究人员可能负责不同的部分或环节。譬如,负责理论构建部分的研究人员可以利用人工智能辅助其跟踪最新理论动态,挖掘学科领域进一步的研究方向;负责数据分析部分的研究人员可以利用人工智能高效处理数据并解读结果。

  第二,人工智能扩展了社会科学研究领域,尤其是定量研究的发展空间。人工智能的本质是运算力、数据量和算法模型,核心是将各种应用场景中包括文字、图像或者声音等符号转为数据进行处理。基于此,研究者不仅可以利用人工智能分析显性的数据,还可以研究原来很难量化的事物。在没有大数据的处理能力以前,衡量两个国家之间政治经济关系的水平是困难的。现在人工智能可以通过分析两国间政治、经济和文化等海量的新闻事件数据来帮助研究者达成这一目的。

  第三,人工智能为社会科学研究的知识生产提供了强大的动力。社会科学研究的选题集中于解决人类社会面临最紧迫、最重大的问题。人工智能帮助研究者更全面地了解、分析当下时事的动态发展,培养研究者对社会焦点的敏感性。此外,大数据技术是智能知识生产的技术驱动力。大数据的特点表现为“4V”,即规模性(volume)、多样性(diversity)、高速性(velocity)和价值(value)。利用高性能计算机和机器学习等技术手段对大数据进行分析、处理,为开展科学研究提供技术基础。

  人工智能在社会科学研究中的优势与不足

  使用人工智能技术的优势体现在以下几个方面:一是,人工智能便利了量化社会科学研究的各个环节。1.数据收集。人工智能可以根据研究者的需求确定合适的数据库,并收集原始数据。2.数据分析。人工智能可以用于对大规模数据的描述性统计分析,并且根据数据分布特征帮助我们确定合适的统计模型。3.数据解释。人工智能可以解释复杂数据,识别传统统计无法显示的关系。这可以帮助研究者形成新的假设和见解。4.数据可视化。人工智能可以通过绘制图表等方式将数据可视化,以便研究者理解数据并与其他研究同行分享。5.文献综述。人工智能可以帮助研究者确定与研究主题相关的文献,梳理学术脉络。当我们确定相关文献并着手阅读时,还可以利用人工智能软件帮助我们理解相关文献,指出文献主要的贡献与缺陷,为进一步研究指明方向。6.数据处理自动化。人工智能可以自动实现许多乏味和耗时的研究任务,如数据清洗和预处理。7.行文规范。人工智能可以按照学术化的语言风格润色文章,生成特定期刊所要求的引文格式。

  二是,人工智能可以改进传统定量研究方法。社会科学中的定量研究主要关注可以用数据形式呈现的变量之间的变化,进而找出特定社会现象背后的规律。因果推断的定义如下:利用社会现象或过程在时空上呈现的局部数据,基于适当的模型方法,控制数据之外的未知信息,为社会决策和研究提供信息和依据。量化研究中的过拟合(over fitting)问题使得对特定现象因果关系的揭示难以外推。已经有学者提出利用监督学习(supervised learning)框架下的正则化(regularization)和调参等方式,缓解过拟合问题。此外,对实验研究的模拟也是保证因果推断质量的关键。在匹配方法上,为了模拟更接近于随机分配的实验研究,有学者借助机器学习的方法来估计倾向分。

  三是,人工智能技术可以帮助开发新的方法并应用于社会科学研究。基于人工智能的方法推动社会科学研究从解释性研究向预测性研究拓展。运用机器学习技术能够在预测精度上达到更好的效果。机器学习强调关联性、共现性和相似性,将其运用到社会分析有显著优势。其一,机器学习能够从已知信息中抽取特征向量并实现模式识别,然后利用样本外数据进行模式验证和预测。其二,机器学习能够捕捉多重数据特征的关联变化。其三,机器学习可以根据输入数据特征自动识别特征向量、调整预测结果。这提升了预测模型在不同社会情境的适用性。

  但是,人工智能在科学研究中也存在很多问题和不足,其无法取代人类在科学研究中的作用。第一,人工智能的创新能力有限。基于纯粹技术工具的创新与基于(人类)情感和“顿悟”的创新存在本质不同。纵观人类科学发展历史,人类的灵感或者联想在许多发明创造上发挥了重要作用。基于逻辑规则与数据处理的人工智能无法进行类似的基于心理因素与社会因素的创新。同时,创新的本质是对未知领域的探索。然而,人工智能只能处理已知的数据。对于未知问题,人工智能可能会给出不准确的结果。知识创新还有赖于对既有知识的批判式反思,在这一方面人工智能无法代替人的思维。

  第二,人工智能在处理“隐性知识”(tacit knowledge)方面存在缺陷。所谓“隐性知识”是相对于“显性知识”(explicit knowledge)而言的。显性知识指能够用“价值中立(value-free)的完美语言(perfect language)”,譬如数学、图表等表达出来的知识;隐性知识则是只存在于主体意识之中,受个体经验形塑的且无法言传的知识。人工智能可以处理显性知识,但是由于隐性知识的复杂性、多义性和变动性,人工智能无法对其做出有效反应。相反,人类则可以在不同情境下结合自身经验理解隐性知识。当人工智能技术逐渐普及并达到一定瓶颈时,企业或国家之间的比较优势来源就不再是人工智能技术,反而基于经验与实践的隐性知识将提供更持久的竞争力,譬如组织文化、社会网络以及动员力。

  第三,即使仅进行数据分析和处理,人工智能也存在各种问题和不足,还需要研究人员进行仔细地甄别和反复调试。比如, 1.人工智能最大的缺陷是只能处理已知的数据和问题,无法提出完全原创的探索性研究假设;2.人工智能的训练依赖大量高质量数据。如果完全依靠计算机自动识别、抓取和编码网络数据,可能会产生一定的理解偏差,影响数据质量。譬如,在对复杂语句和语境的理解、对虚假信息的甄别等方面,计算机的自动处理能力较为有限;3.人工智能对参数的敏感性决定了选择正确参数值的重要性,因此需要大量的试错和重复训练。4.人工智能倾向于追求模型的复杂性和预测的准确性,但是忽略了结果的可解释性。

  第四,人工智能对生产“建构意义性质的知识”作用有限。知识生产可以从描述性与建构性的意义上来理解。描述性知识生产是指创建和传播基于描述性数据收集、分析和呈现的知识的过程。建构性知识生产是指创建和传播基于规范、价值观和道德原则的知识的过程。这种知识生产涉及确定什么是正确或不正确、公正或不公正的原则和标准,以及如何应用这些原则和标准来指导人们的行为和决策。人工智能的价值中立决定了其出色的描述性知识生产能力,但是也限制了其生产建构性知识的能力。此外,人工智能发挥作用取决于研究者的研究目的以及既有的学术氛围与文化,包括同行评议等规范模式。因此,知识生产也是特定时空中社会协商的产物。人工智能显然无法塑造独立于研究者的学术规范。

  总的来说,在人工智能的帮助下,一个从事定量研究的初级研究人员成长到高级人员所需要的技术和经验积累都会大大加速。但是,人工智能只能对已有的数据进行处理,却难以创造全新的知识。换句话说,人工智能不会完全取代我们对事物之间联系的思考(科研创意)。科学研究这一复杂过程仍然需要研究人员的创造性工作。

  人工智能时代应如何学习和使用研究方法

  人工智能技术的发展与应用给研究带来了重要机遇,同时也形成挑战。我们应该充分挖掘人工智能技术在研究中的优势,同时发挥人在研究创新的主体性作用。具体来说,我们应该做到以下几点。

  第一,加强理论和研究方法的学习,坚持对事件本质的洞察以及对事物联系的思考。人工智能在提出原创性核心假设、阐释数据分析结果的理论与实际意义等方面都无法超越人类。我们应该坚持数据、方法与理论相结合,不能将研究变成简单的数据挖掘,而是要提出能够为人类社会提供实用价值的知识成果。另外,我们要加强研究方法的深入学习,只有充分理解研究过程和每个细节,才能正确地使用人工智能。我们需要理解,解决各种不同类型的研究问题应该采用的方法。

  第二,尽可能广泛地学习人工智能技术。正如“随机森林”的提出者布雷曼所言,“如果我们的目标是用数据解决问题,我们应该摆脱对传统方法的过度依赖,采用多样化的研究手段”。我们应该不断丰富自己的研究工具箱,不仅仅要在基础性操作上,如在数据处理、分析和可视化等环节上利用人工智能技术进行辅助,还要掌握基于人工智能的新方法,如善用机器学习等手段以得出更为精确的结果。

  第三,坚持对人工智能结果的人为验证。人工智能基于算法给出的结果有时候并不贴合实际情况。为了保证研究的质量,我们在必要的时候应该坚持人为验证,即使这会一定程度上削弱人工智能为研究带来的便利性。譬如,在应用大语言模型(LLM)时,我们应该保持警惕。大语言模型在回答的可靠性、质量、实时性、稳定性和安全性上均有不足。这就需要我们静下心对相关问题进行人工考证。

  (龙泰格,清华大学社会科学学院;庞琴,中山大学国际关系学院教授)

 
×
错误反馈
请支付
×
提示:您即将购买的内容资源仅支持在线阅读,不支持下载!

当前账户可用余额

余额不足,请先充值或选择其他支付方式

请选择感兴趣的分类
选好了,开始浏览
×
推荐购买
×
手机注册 邮箱注册

已有账号,返回登录

×
账号登录 一键登录

没有账号,快速注册

×
手机找回 邮箱找回

返回登录