首页 > 行业频道 > 正文

推荐:在线提供新闻线索

ChatGPT热潮背后,算力如何突围?

来源:华夏小康网 2023-05-24 14:31:30
  • 关注官方微信

  • 天天315消费维权

  作为史上用户增速最快的消费级应用,ChatGPT,自新年肇始至今,热度持续发酵,每天都有超2亿人次疯狂抛出各式各样的问题“调教”ChatGPT,“请代替产品经理写一篇年终总结”、“如何评价马云回国”、“请写出一段爬取网页内容的程序”……诸如此类问题,OpenAI开发的ChatGPT都能轻松给出“中肯”的回答,不久前推出的最新一代版本GPT-4,撕掉“Chat”的标签再次进化,不但比前代更“聪明”、更安全,还掌握了“读图技能”。

  (图源:IC photo)

  “百模大战”全面打响

  ChatGPT这只蝴蝶扇动翅膀,掀起今年春天最强劲的AI大模型风暴。作为一个集高级会话、创作答题等多重能力于一身的新一代人工智能聊天机器人,ChatGPT强大的“超能力”背后,隐藏着的是以天量级数据为基础训练出的“巨无霸”通用大模型。

  回溯ChatGPT 的发展历程可知,OpenAI自GPT 1.0 开始,就将大型语言模型( LLM)视为通往通用人工智能(AGI)的必由之路,该模型使用“利用人类反馈强化学习(RLHF)”训练方式,通过人类提问机器回答、机器提问人类回答,并不断迭代,让模型逐渐具备对生成答案的评判能力,变得“越来越聪明”。

  随着ChatGPT的应用热情被点燃,AI大模型技术应用在业界激起层层浪花。继百度“文心一言”聊天机器人产品发布后,包括阿里巴巴、360、华为、昆仑万维、商汤、腾讯、知乎等在内的各大厂商纷纷摩拳擦掌,相继布局加入AI大模型赛道。

  (图源:IC photo)

  AI大模型产品百花齐放的背后,算力场上的角力也悄然展开。在这场人工智能大模型从“可用”进化为“好用”的涅槃之旅中,不断经历着人力研发和应用计算成本高、模型算法从实验室场景到真实场景效果差距大等痛点考验。参战大模型竞赛,算法、算力、数据环环相扣,如何在AI计算上缩小GAP、实现技术突破、降本增效,成为一个求共解的命题,也是新一轮科技创新的焦点。

  AI大模型,正在“榨干”算力?

  大模型的实现依赖强大的计算资源支撑训练和推理过程, 其中的“训练”表现为AI的学习过程,通过对大量数据的分析处理,形成至关重要的“模型”,“推理”则是AI的应用过程,利用模型对用户输入的数据进行分析,产生输出结果。

  根据OpenAI报告,训练一次1746亿参数的GPT-3模型需要的算力约3640PFlop/s-day,即假如每秒计算一千万亿次,也需要计算3640天,对应训练成本超过1200万美元,而历经GPT-1、GPT-2、GPT-3三次迭代的GPT-3.5模型,参数量从1.17亿增至1750亿,预训练数据量从5GB增至45TB(数据相当于整个维基百科英文版的160倍),中泰证券研报据此分析认为,ChatGPT类生成式AI应用的迭代优化主要源自模型的不断增大以及由此引爆的算力激增。

  AI大模型对算力资源的需求贯穿于模型预训练、日常交互运营及模型迭代训练全过程场景。数据显示,自2012年至2018年,训练AI的算力需求大约每隔3~4个月翻倍,所耗费的算力增长近30万倍。通用AI时代下,呈指数级上涨的算力需求,不断刷新摩尔定律新认知,正以困兽冲破牢笼之势迅猛攀升。

  在这场大模型引发的技术军备竞赛中,“算力幕后兵”被推至台前,成为行业炙手可热的焦点。伴随着人工智能技术的加速变革,大模型的训练和推断需求不断跃升,要想实现AI模型的“智力”进阶,并从技术理论到大规模场景加速落地,真正走入“寻常百姓家”,需要更为强大的运算能力和更加丰富的算力资源,而传统的CPU架构已难以满足AI算法对算力的多元需求。

  面对大模型中成千上万个神经元和参数,作为计算机图形学领域的主流技术,具备海量数据并行计算能力、擅长加速计算处理的GPU算力越来越广泛地应用于人工智能大模型领域,成为实现高效训练和推断的核心驱动力。除了显著的速度提升优势外,GPU算力还可帮助实现GPT类更加复杂和精确的深度学习模型。

  算力,作为人工智能的“发动机”,是AI大模型得以实现的基础,而AI领域的算法进步同时反哺GPU算力提升成为可能。算力的升级与加持,为纷繁多元的AI大模型场景应用按下加速键。

  未来已来,ChatGPT开启通用AI新时代

  ChatGPT的问世开启人工智能新纪元,加快现代生产方式变革的步伐。以ChatGPT为代表的生成式AI未来的应用场景充满无限可能,从工业设计到广告创意,从影视娱乐到编程代码……,每个创造性的行业生态都在悄然被颠覆性重塑。

  作为GPU算力云服务商,蓝耘通过近20年深厚的IT基础设施建设与GPU算力云服务积累,应对模型规模和算力指数级增长的未来潜在趋势,为AI“智力”升维注入澎湃动力。公司拥有成熟的GPU算力云服务平台,针对诸如AI大模型训练、机器学习、计算机视觉等多样化需求的前沿科技应用场景,可为客户提供从私有云解决方案到以GPU云服务器、GPU裸金属服务器以及HPC平台等产品为核心的算力云服务。

  蓝耘AI算力云服务集成AI深度学习算法,协同GPU和CPU异构集群资源,搭建数据集创建、数据预处理、模型训练、模型超参调优、模型部署等全流程的开发环境,为AI计算开发、AI模型训练提供强大的计算力支撑。

  以普惠算力提升生产力曲线,厚植AI发展的底层土壤,助力企业突破算力瓶颈,推动产业链上下游协同创新,蓝耘已经做好了准备,以极致算力“乘风破浪”,不断探索未知的边界。

  (搜索“蓝耘”官网、公众号,了解更多产品和解决方案详情)

【广告】
有新闻想爆料?请登录《今报网呼叫中心》( http://www.jinbw.com.cn/call)、拨打新闻热线0371-65830000,或登录东方今报官方微信、微博(@东方今报)提供新闻线索。今报网商务合作招募中,诚邀合作伙伴,联系邮箱:jinbw2004@126.com。
本站部分内容系互联网转载,本站不拥有所有权,不承担相关法律责任。企业宣传商业资讯,仅供用户参考,如用户将之作为消费行为参考,敬告用户需审慎决定。
  • 时政
  • 河南
  • 社会
  • 民生
  • 财经
  • 教育
  • 行业
  • 综合

东方今报|资源手册|呼叫中心|联系我们|版权声明|法律顾问|广告服务|技术服务中心

Copyright © 2005 - 2020 JINBW.com.cn All Rights Reserved.

制作单位:东方今报·今报网编辑部  版权所有:东方今报社

关注我们