百模大战:中国的ChatGPT有多强?


ChatGLM是当前正在开发的数百个中文AI语言模型之一,其开发者表示,该模型在多个指标上的表现接近ChatGPT。

ChatGLM有英文和中文界面。来源:ChatGLM

仍需深究

唐杰说,这些中文数据来自网上,有些是向公司购买的。目前缺少可公开使用的中文数据集来训练模型,来自海口的Hugging Face工程师王铁震说。

开发非英语LLM还面临其他挑战。为了方便分析,大部分语言模型会将文本拆分成名为“词元”(token)的小单位。但中文词语间不用空格来分隔,这让分词(tokenization)变得很复杂,Wang说。但唐杰表示,ChatGLM使用的分词法与英文AI模型使用的几乎一模一样。

在ICLR 2024上,智谱AI用数据表示,ChatGLM底层模型GLM-4的最优版本在多个标准上能达到GPT-4模型(OpenAI的强大模型)得分的90%以内。这其中包括对通用知识、一般常识和数学能力的测试。ChatGLM还在LLM面向中文的一个优化标准上打败了GPT-4。唐杰表示,他们团队很快将发布一份关于GLM-4的技术报告。

加州大学洛杉矶分校的计算机科学家孙怡舟说:“我对他们能和GPT-4达到差不多的水准印象特别深刻。”

中国的LLM热

ChatGLM网站发布了一个面向公众的中英文界面版本。有些GLM产品——包括更早的GLM-130B基础模型[2]和ChatGLM-6b对话机器人——都是开源的。这表示任何人都能下载并训练它们用于特定场景,科学家也能查看底层代码,研究它是如何运作的。

唐杰说,ChatGLM-6b已被下载1300万次。该模型使用60亿个“参数”——这些参数是捕捉词语间统计学关联的单元,这个模型也是ChatGLM对话机器人中最小的。不过,GLM-4模型和更大版本的ChatGLM(有1300亿个参数)的内部运作方式和ChatGPT和GPT-4一样,是不开源的。

中国还在开发的LLM有几十种。Yakefu说,2023年中国推出了超过100个AI模型,“我们称之为‘百模大战’。”比如科技巨头百度和阿里巴巴都推出了自己的AI对话机器人。

中国的LLM需要遵守针对生成式AI系统的监管规定,这些规定自去年8月开始执行,要求这些模型符合社会主义核心价值观,并采取有效措施提升生成式人工智能服务,提高生成式内容的准确度和可靠性等。

Yu将中国的规定与其他国家为保障AI系统安全的措施进行了比较。“在中国,整个国家坚持一定的价值观,”他说,“任何社会都有大家不谈论的内容,每个社会都有这些禁忌。”

通用智能

唐杰现在主要关注提升ChatGLM和GLM-4的能力。他将当前的系统比作“水中大脑”,因为它无法与世界产生物理互动。让AI系统在各种任务中具有人类的能力——被称为通用人工智能(AGI)的里程碑——就需要它们能在世界中具身化,他说。ChatGLM能成为第一个实现AGI的AI系统吗?“我不知道,”唐杰说,“我希望我们能成为第一个,但我们还有很多竞争者。”

计算机科学家距离开发出AGI有多远,以及LLM是否会是实现AGI的技术,目前正被激烈讨论着。考虑到超智能AI模型对人类的威胁,AGI是否是最理想的目标也众说不一。Yu说:“AGI不是你随随便便说的词。”

Yu说,除了AGI,AI系统还有望解决全球变暖和预防下一次疫情等宏大挑战。他说,中国正在大力投入AI基础设施和技术建设。“我们相信我们有很大的机会能优化整个AI产业,并把这件事做好,”他说,“这不仅能造福中国民众,如果能减少能源消耗和二氧化碳排放,这将造福全人类。”