OpenAI草莓计划揭秘：Q*推理能力大爆发，未来触手可及！

近日，OpenAI悄无声息地揭开了「草莓」计划的神秘面纱。这个项目，之前被称为Q*，现在以草莓的身份重新登场，据说它能让AI提前规划任务，自主上网搜集信息，甚至进行深入研究。

连科技界的大腕马斯克也忍不住插了一脚，他在评论中调侃道:「原以为AI的末日是回形针灾难，现在看来，可能是无尽的草莓田。」

尽管外界对草莓计划充满了好奇，但OpenAI对其运作细节守口如瓶。这个项目的研发过程在公司内部都是高度保密的，以至于连发布时间都成了一个谜。

在最近一次内部会议上，OpenAI展示了草莓计划的一个演示版本，其推理能力之强，几乎可以与人类媲美。这与他们最近公布的AGI路线图不谋而合，让人不禁怀疑，OpenAI是否在酝酿着更大的动作。

草莓模型的设计理念，是让AI不仅能够生成查询答案，还能够提前规划，自主且可靠地浏览互联网，进行所谓的「深度研究」。目前，这样的能力在AI领域尚属首次。

知情人士称，OpenAI的草莓计划有点类似斯坦福大学开发的一种方法——「自我教导推理者」（简称STaR）。STaR通过迭代创建训练数据，实现自我提升。

论文地址:https://arxiv.org/pdf/2203.14465

目前，让AI生成推理过程的方法要么成本高昂，要么牺牲准确性。但STaR技术通过迭代使用少量推理示例和大量无推理数据，让AI自我提升。

STaR技术的工作流程是这样的:首先，AI尝试回答许多问题，并生成推理过程。如果答案错误，就在知道正确答案的情况下重新生成推理。然后，对所有最终得出正确答案的推理进行微调，并重复这个过程。

OpenAI希望草莓的创新能够显著提升AI模型的推理能力。这涉及到一种特殊的处理方式——在AI模型经过大量数据预训练之后，进行调整以优化性能。

OpenAI还希望草莓能够执行长时间任务（LHT），这需要模型提前规划并执行一系列动作。为了实现这一目标，他们正在创建和评估「深度研究」数据集。

随着草莓计划的逐步推进，OpenAI离实现AGI的目标越来越近。如果草莓的推理能力真的能够与人类相媲美，那么AI的未来将不可限量。