“越大越好”的旅途走欠亨？OpenAI正在寻求测验模子的新秩序

发布日期：2024-11-16 10:23 点击次数：64

　　好多东谈主工智能(AI)科学家和初创公司觉得，通过加多更多数据和算力来扩大刻下模子，以捏续矫正AI模子的秩序正在走到绝顶。因此，像OpenAI这么的AI公司正在寻求通过诞生新的测验技艺来克服刻下边临的挑战，这些技艺更像东谈主类的念念考形势。

　　自风靡各人的聊天机器东谈主ChatGPT发布以来，科技公司齐是通过加多更多数据和算力来扩大并改善AI模子。但面前，一些最了得的AI科学家正在指出这种“越大越好”的局限性。

　　东谈主工智能履行室Safe Superintelligence和OpenAI的聚合独创东谈主Ilya Sutskever近日默示，扩大预测验(测验AI模子的阶段，该模子使用广宽未标志的数据来交融讲话样式和结构)所取得的效果还是达到了一个平安期，对提高模子性能的匡助有限。

　　Sutskever早期方针通过在预测验中使用更多数据和算力来完了生成式AI的高大飞跃，这最终创造了ChatGPT。他本年早些时候离开OpenAI，创立了Safe Superintelligence。

　　Sutskever默示：“往常是畛域彭胀的期间，面前咱们又回到了名胜和发现的期间。每个东谈主齐在寻找下一个东西，这比以往任何时候齐更弥留。”

　　此外，Sutskever还承认他的公司正在照应一种扩大预测验畛域的替代秩序，但未自满更多细节。

　　新技艺竞赛

　　大模子的所谓“测验”需要同期开动数百个芯片，资本可能高达数千万好意思元。筹商到系统的复杂性，它们更有可能出现硬件导致的故障；在测试限度之前，照应东谈主员可能无法知谈这些模子的最终性能，这可能需要几个月的时分。

　　另一个问题是，大讲话模子团结了广宽数据，而AI模子还是破钞了宇宙上通盘容易赢得的数据。电力短少也落魄了测验开动，因为这个经由需要广宽的动力。

　　为了克服这些挑战，照应东谈主员正在探索测试时计较(test-time compute)，这是一种在所谓的推理阶段或使用模子时增强现存AI模子的技艺。举例，模子不错及时生成和评估多种可能性，最终选择最好前进旅途，而不是立即选择一个谜底。

　　这种秩序使模子梗概将更多的惩办才智插足到具有挑战性的任务中，比如数学或编码问题或需要访佛东谈主类的推理和方案的复杂操作。

　　OpenAI照应员Noam Brown此前默示：“事实解说，让一个机器东谈主在一盘扑克牌中念念考20秒，与将模子放大10万倍、测验时分延迟10万倍的效果疏通。”

　　OpenAI 在其新发布的模子“o1”中继承了这项技艺，与此同期，来自Anthropic、xAI和DeepMind等其他顶尖AI履行室的照应东谈主员也在悉力于诞生我方的技艺版块。

　　OpenAI首席居品Kevin Weil默示：“咱们看到了好多低落的果实，摘下来让这些模子变得更好。比及东谈主们奋发图强的时候，咱们会悉力诞生新的技艺。”

　　多位科学家、照应东谈主员和投资者觉得，这种新技艺可能会重塑AI武备竞赛，并对AI公司所需求的各样资源产生影响。