OpenAI草莓计划揭秘:Q*推理能力大爆发,未来触手可及!
近日,OpenAI悄无声息地揭开了「草莓」计划的神秘面纱。这个项目,之前被称为Q*,现在以草莓的身份重新登场,据说它能让AI提前规划任务,自主上网搜集信息,甚至进行深入研究。
连科技界的大腕马斯克也忍不住插了一脚,他在评论中调侃道:「原以为AI的末日是回形针灾难,现在看来,可能是无尽的草莓田。」
尽管外界对草莓计划充满了好奇,但OpenAI对其运作细节守口如瓶。这个项目的研发过程在公司内部都是高度保密的,以至于连发布时间都成了一个谜。
在最近一次内部会议上,OpenAI展示了草莓计划的一个演示版本,其推理能力之强,几乎可以与人类媲美。这与他们最近公布的AGI路线图不谋而合,让人不禁怀疑,OpenAI是否在酝酿着更大的动作。
草莓模型的设计理念,是让AI不仅能够生成查询答案,还能够提前规划,自主且可靠地浏览互联网,进行所谓的「深度研究」。目前,这样的能力在AI领域尚属首次。
知情人士称,OpenAI的草莓计划有点类似斯坦福大学开发的一种方法——「自我教导推理者」(简称STaR)。STaR通过迭代创建训练数据,实现自我提升。
论文地址:https://arxiv.org/pdf/2203.14465
目前,让AI生成推理过程的方法要么成本高昂,要么牺牲准确性。但STaR技术通过迭代使用少量推理示例和大量无推理数据,让AI自我提升。
STaR技术的工作流程是这样的:首先,AI尝试回答许多问题,并生成推理过程。如果答案错误,就在知道正确答案的情况下重新生成推理。然后,对所有最终得出正确答案的推理进行微调,并重复这个过程。
OpenAI希望草莓的创新能够显著提升AI模型的推理能力。这涉及到一种特殊的处理方式——在AI模型经过大量数据预训练之后,进行调整以优化性能。
OpenAI还希望草莓能够执行长时间任务(LHT),这需要模型提前规划并执行一系列动作。为了实现这一目标,他们正在创建和评估「深度研究」数据集。
随着草莓计划的逐步推进,OpenAI离实现AGI的目标越来越近。如果草莓的推理能力真的能够与人类相媲美,那么AI的未来将不可限量。