语言模型的疾风骤变:迈入新阶段的转折点?

来源:网络时间:2025-05-29 18:06:06

在过去的两年中,大语言模型领域经历了一场前所未有的“狂飙突进”,其发展速度之快、技术突破之大,令人瞩目。从基础的自然语言处理到深度学习的广泛应用,模型的规模与能力实现了指数级增长,引发了人工智能界的广泛讨论与探索。然而,随着技术的日益成熟和应用领域的不断扩展,我们不禁思考,这一领域是否正站在一个至关重要的十字路口?是否即将迎来从量变到质变的拐点?本文将深入探讨大语言模型当前的发展现状,分析其所面临的挑战与机遇,以及未来可能的演进方向,试图揭示在这个快速演变的科技前沿,下一步的关键所在。

  

chatgpt问世两年来,生成式ai的蓬勃发展让许多人相信,随着算力的提升和海量数据的涌入,通用ai指日可待。然而,一些专家对此表达了担忧。谷歌ceo皮查伊预测2025年ai发展将放缓,大型语言模型的研发似乎已达拐点。

  

“狂飙”两年,大语言模型已至拐点?

  

AI模型的规模膨胀

  

ChatGPT的成功点燃了科技公司对大型语言模型的研发热情。谷歌、亚马逊、Meta以及微软等巨头投入巨资,纷纷推出各自的生成式AI应用,这些模型能够生成高质量的文本、图像、视频,并具备语音对话功能。OpenAI等公司也因此名利双收,其估值更是高达1570亿美元。纽约大学神经科学教授加里·马库斯指出,这种高估值很大程度上源于一种信念:只要持续增加数据和算力,AI模型就能无限强大,最终实现与人类智能匹敌的“通用AI”。

  

智能提升速度放缓

  

然而,这种乐观预期是否现实?马库斯认为这只是美好的幻想。CNBC报道指出,谷歌、Anthropic和OpenAI等公司在大型语言模型研发方面似乎已遭遇瓶颈。OpenAI股东安德烈森-霍罗威茨公司联合创始人本·霍罗威茨也承认,尽管算力持续提升,但AI模型的智能水平并未显著提高。OpenAI联合创始人伊尔亚·苏茨克维也表示,利用大量未标记数据训练AI模型的阶段已趋于稳定。专家指出,可用于训练的数据已近乎枯竭。Spellbook公司CEO斯科特·史蒂文森认为,单纯依靠文本数据扩展AI模型注定会遇到瓶颈,问题不在于知识量,而在于机器理解句子或图像含义的能力。“抱抱脸”研究员莎拉·卢乔尼也强调,“以大为美”的路线最终会触及极限。

  

迫切需要变革

  

OpenAI负责人萨姆·奥尔特曼承认GPT-4的后续模型进展不如预期,并延迟了其发布。作为转型尝试,OpenAI推出了专注于复杂问题解答(特别是数学问题)的o1模型,旨在提升推理能力而非单纯增加数据量。史蒂文森认为,这预示着AI模型研发领域将迎来一场“深刻变革”。OpenAI、“深度思维”等公司正在探索“高效扩展”技术,目标是让大型语言模型模拟人类思维方式,而非依赖“蛮力”。史蒂文森将AI技术发展比作火的出现,认为业界应该创造出类似蒸汽机那样的变革性技术,而非仅仅依赖增加数据和算力。斯坦福大学教授沃尔特·德·布劳沃则将当前的先进大型语言模型比作高中生,认为它们容易出错,但具有跳跃思维能力的机器即将到来。

以上就是“狂飙”两年,大语言模型已至拐点?的详细内容,更多请关注其它相关文章!

文章内容来源于网络,不代表本站立场,若侵犯到您的权益,可联系我们删除。(本站为非盈利性质网站) 联系邮箱:rjfawu@163.com