AI 语言模型首次达到人类专家的语言分析水平

概述

这篇文章探讨了人工智能（AI）语言模型在语言分析能力上是否能够达到人类专家的水平。通过对大型语言模型（LLMs）的一系列语言学测试，研究人员发现某些模型已经具备了分析语言结构、理解复杂语法以及解决歧义的能力，甚至在某些方面超越了人类研究生的水平。这一发现挑战了我们对 AI 能力的传统认知，并引发了关于语言的本质以及人类独特性的深入思考。

In a First, AI Models Analyze Language As Well As a Human Expert | Quanta Magazine

语言模型的“元语言”能力

文章的核心内容围绕着语言模型是否能够像人类一样分析语言本身。传统观点认为，尽管 AI 模型能够生成自然语言，但它们缺乏对语言的深入理解能力。例如，著名语言学家诺姆·乔姆斯基（Noam Chomsky）曾指出，语言的复杂性无法仅通过大数据学习来掌握。然而，最新的研究结果表明，某些语言模型已经具备了“元语言”能力，即不仅能够使用语言，还能对语言进行分析和推理。

研究人员设计了一系列语言学测试，包括对复杂句子结构的分析、递归语法的处理以及对新语言的规则推导。测试结果显示，OpenAI 的语言模型 o1 在这些任务中表现出色，能够像人类研究生一样分析句子结构、解决歧义，并处理复杂的递归语法。例如，o1 能够正确解析句子“Rowan fed his pet chicken”中的歧义，生成两种不同的句法树（一种表示 Rowan 的宠物是鸡，另一种表示 Rowan 给宠物喂了鸡肉）。此外，o1 还能够处理复杂的递归句子，如“Maria wondered if Sam knew that Omar heard that Jane said that the sky is blue”，并进一步扩展递归层次。

这些测试结果表明，语言模型不仅能够生成语言，还能够像人类一样分析语言结构。这一发现挑战了之前关于 AI 语言能力的局限性观点，证明了语言模型在某些方面已经达到了人类专家的水平。

语言模型的递归能力与复杂性

递归是人类语言的一个关键特征，它允许通过嵌套短语来生成无限多的句子。例如，从简单的句子“天空是蓝色的”可以扩展为“Jane 说天空是蓝色的”，再进一步扩展为“Maria 想知道 Sam 是否知道 Omar 听到 Jane 说天空是蓝色的”。这种递归能力被认为是人类语言独特性的体现，因为目前没有证据表明其他动物能够以类似的方式使用递归。

在测试中，研究人员设计了包含复杂递归结构的句子，例如“The astronomy the ancients we revere studied was not separate from astrology”。o1 模型不仅能够正确解析这些句子的结构，还能够进一步扩展递归层次，生成更复杂的句子结构。例如，o1 将上述句子扩展为“The astronomy [the ancients [we revere [who lived in lands we cherish]] studied] was not separate from astrology”。

这种递归能力的测试结果表明，语言模型在处理复杂语言结构方面已经达到了相当高的水平。研究人员指出，这种能力不仅体现了语言模型对语言结构的理解，还表明它们能够像人类一样处理复杂的语言嵌套。这一发现对于理解语言的本质以及人类语言能力的独特性具有重要意义。

语言模型的音韵学能力

除了语法和句法的分析能力，研究人员还测试了语言模型在音韵学（phonology）方面的表现。音韵学是研究语言中声音模式的学科，例如英语中“dog”后加“s”发音为“z”，而“cat”后加“s”发音为“s”。这些规则通常是人们在语言学习过程中无意识掌握的，但对于语言模型来说，需要通过分析和推导来掌握这些规则。

研究人员设计了 30 种全新的“迷你语言”，每种语言包含 40 个虚构的单词。这些语言的音韵学规则是随机生成的，因此语言模型不可能在训练过程中接触到这些规则。测试结果显示，o1 模型能够正确推导出这些新语言的音韵学规则。例如，对于一种语言，o1 模型正确地推导出“当一个元音紧接在一个既是浊音又是阻塞音的辅音之后时，元音会变成呼吸音”。这种能力表明，语言模型不仅能够处理书面语言，还能够理解和推导语言的发音规则。

这一发现进一步证明了语言模型在语言分析方面的强大能力。研究人员指出，这种能力的实现可能与语言模型的训练方式有关，它们通过大量的语言数据学习语言的模式和规则。然而，这种能力的出现也引发了关于语言模型是否能够真正理解语言的讨论。尽管语言模型能够推导出音韵学规则，但它们是否能够像人类一样“理解”这些规则仍然是一个开放的问题。

语言模型的未来与人类的独特性

文章最后探讨了语言模型的未来发展以及人类语言能力的独特性。研究人员指出，尽管目前的语言模型已经表现出强大的语言分析能力，但它们仍然存在局限性。例如，语言模型的训练目标是基于上下文预测下一个单词，这使得它们在泛化能力上存在不足。然而，随着计算能力的提升和训练数据的增加，语言模型有望在未来进一步提升其语言分析能力。

研究人员提出了一个问题：语言模型是否能够通过增加计算能力和训练数据来无限提升其语言能力？或者，人类语言的某些特征是否是人类进化过程中的独特产物，无法被 AI 完全复制？目前的研究结果表明，语言模型在某些方面已经能够达到甚至超越人类的语言分析能力，但它们尚未能够创造出新的语言规则或教给我们关于语言的新知识。

这一发现引发了关于人类独特性的深入思考。如果语言模型能够在未来进一步提升其语言能力，那么人类语言能力的独特性将受到挑战。研究人员指出，语言模型的进步正在逐步“侵蚀”那些被认为是人类语言独特性的特征。例如，递归能力曾被认为是人类语言的独特标志，但语言模型已经证明了它们也能够处理复杂的递归结构。这一趋势表明，人类语言能力的独特性可能并不像我们之前认为的那样明显。

概述

语言模型的“元语言”能力

语言模型的递归能力与复杂性

语言模型的音韵学能力

语言模型的未来与人类的独特性

框架 & 心智模型（Framework & Mindset）