百模大战：中国的ChatGPT有多强？

ChatGLM是当前正在开发的数百个中文AI语言模型之一，其开发者表示，该模型在多个指标上的表现接近ChatGPT。

ChatGLM有英文和中文界面。来源：ChatGLM

仍需深究

唐杰说，这些中文数据来自网上，有些是向公司购买的。目前缺少可公开使用的中文数据集来训练模型，来自海口的Hugging Face工程师王铁震说。

开发非英语LLM还面临其他挑战。为了方便分析，大部分语言模型会将文本拆分成名为“词元”（token）的小单位。但中文词语间不用空格来分隔，这让分词（tokenization）变得很复杂，Wang说。但唐杰表示，ChatGLM使用的分词法与英文AI模型使用的几乎一模一样。

在ICLR 2024上，智谱AI用数据表示，ChatGLM底层模型GLM-4的最优版本在多个标准上能达到GPT-4模型（OpenAI的强大模型）得分的90%以内。这其中包括对通用知识、一般常识和数学能力的测试。ChatGLM还在LLM面向中文的一个优化标准上打败了GPT-4。唐杰表示，他们团队很快将发布一份关于GLM-4的技术报告。

加州大学洛杉矶分校的计算机科学家孙怡舟说：“我对他们能和GPT-4达到差不多的水准印象特别深刻。”

中国的LLM热

ChatGLM网站发布了一个面向公众的中英文界面版本。有些GLM产品——包括更早的GLM-130B基础模型[2]和ChatGLM-6b对话机器人——都是开源的。这表示任何人都能下载并训练它们用于特定场景，科学家也能查看底层代码，研究它是如何运作的。

唐杰说，ChatGLM-6b已被下载1300万次。该模型使用60亿个“参数”——这些参数是捕捉词语间统计学关联的单元，这个模型也是ChatGLM对话机器人中最小的。不过，GLM-4模型和更大版本的ChatGLM（有1300亿个参数）的内部运作方式和ChatGPT和GPT-4一样，是不开源的。

中国还在开发的LLM有几十种。Yakefu说，2023年中国推出了超过100个AI模型，“我们称之为‘百模大战’。”比如科技巨头百度和阿里巴巴都推出了自己的AI对话机器人。

中国的LLM需要遵守针对生成式AI系统的监管规定，这些规定自去年8月开始执行，要求这些模型符合社会主义核心价值观，并采取有效措施提升生成式人工智能服务，提高生成式内容的准确度和可靠性等。

Yu将中国的规定与其他国家为保障AI系统安全的措施进行了比较。“在中国，整个国家坚持一定的价值观，”他说，“任何社会都有大家不谈论的内容，每个社会都有这些禁忌。”

通用智能

唐杰现在主要关注提升ChatGLM和GLM-4的能力。他将当前的系统比作“水中大脑”，因为它无法与世界产生物理互动。让AI系统在各种任务中具有人类的能力——被称为通用人工智能（AGI）的里程碑——就需要它们能在世界中具身化，他说。ChatGLM能成为第一个实现AGI的AI系统吗？“我不知道，”唐杰说，“我希望我们能成为第一个，但我们还有很多竞争者。”

计算机科学家距离开发出AGI有多远，以及LLM是否会是实现AGI的技术，目前正被激烈讨论着。考虑到超智能AI模型对人类的威胁，AGI是否是最理想的目标也众说不一。Yu说：“AGI不是你随随便便说的词。”

Yu说，除了AGI，AI系统还有望解决全球变暖和预防下一次疫情等宏大挑战。他说，中国正在大力投入AI基础设施和技术建设。“我们相信我们有很大的机会能优化整个AI产业，并把这件事做好，”他说，“这不仅能造福中国民众，如果能减少能源消耗和二氧化碳排放，这将造福全人类。”