首页 / 世界最快

比GPU性价比高百倍!Cerebras推出AI推理服务,号称“全球最快”

2024-09-10 09:36世界最快
编译 | Vendii编辑 | 漠影

智东西8月28日消息,AI芯片独角兽Cerebras Systems于8月27日宣布推出AI推理服务Cerebras Inference,号称“全球最快”。该服务已经在云端上线。

据官网介绍,该推理服务在保证精度的同时,速度比英伟达的服务快20倍;其处理器内存带宽是英伟达的7000倍,而价格仅为GPU的1/5,性价比提高了100倍。Cerebras Inference还提供多个服务层次,包括免费、开发者和企业级,满足从小规模开发到大规模企业部署的不同需求。

用户可直接在官网上的交互界面进行体验,也可调用API。

体验地址:https://inference.cerebras.ai/

Cerebras Systems成立于2016年,团队由计算机架构师、计算机科学家、深度学习研究人员和各种工程师组成。该公司以其创新的晶圆级芯片(Wafer Scale Engine, WSE)而闻名,这些芯片专为AI计算而设计,具有巨大的尺寸和性能。

这家芯片独角兽曾经得到多个知名投资者的支持,其中包括OpenAI联合创始人Sam Altman、AMD前CTO Fred Weber等。截至2021年11月,该公司完成了2.5亿美元的F轮融资,估值达到40亿美元。

一、性价比远超英伟达:速度快20倍,价格仅为1/5

AI推理指的是在训练好一个AI模型之后,使用这个模型对新的数据进行预测或决策的过程。AI推理的性能和效率对于实时应用至关重要,例如自动驾驶汽车、实时翻译或在线客服聊天机器人等。Cerebras Inference(以下称作“Cerebras推理服务”)便是一个专注于AI推理的服务,以支持这些对实时性要求极高的应用场景。

Cerebras推理服务由Cerebras CS-3系统及其第三代晶圆级芯片(WSE-3)提供支持。WSE-3于3月发布,基于2021年推出的WSE-2芯片进行了改进。WSE-3内存带宽高达21PB/s,是英伟达H100 GPU的7000倍。这种超高的内存带宽可以大幅减少数据传输时间,提高模型推理的速度和效率。

据官网介绍,Cerebras推理服务针对Llama 3.1 8B模型每秒提供1800个tokens,每百万tokens的价格为10美分;针对Llama 3.1 70B模型每秒提供450个tokens,每百万tokens的价格为60美分。速度比基于英伟达GPU的超大规模云解决方案快20倍。

▲Cerebras推理服务与其他服务在Llama 3.1 8B上的速度比较。单位:tokens/秒/用户。(图源:Cerebras官网)

▲Cerebras推理服务与其他服务在Llama 3.1 70B上的速度比较。单位:tokens/秒/用户。(图源:Cerebras官网)

此外,Cerebras推理服务在整个推理过程中始终保持在16位精度域内,确保在提升速度的同时不会牺牲模型的精度。大语言模型质量评估公司Artificial Analysis的联合创始人兼CEO Micah Hill-Smith谈道,他的团队已经验证了Llama 3.1 8B和Llama 3.1 70B模型在Cerebras推理服务上运行的质量评估结果:与Meta官方版本的原生16位精度一致。

跟据官网,该服务运行Llama3.1的速度比基于英伟达GPU的解决方案快20倍,而提供服务的芯片WSE-3价格仅为GPU的1/5,相当于AI推理工作负载的性价比提高了100倍。

“在Artificial Analysis的AI推理基准测试中,Cerebras推理服务已经领先。Cerebras推理服务的速度比基于GPU的解决方案快一个数量级,打破了测试的纪录。”Micah Hill-Smith说,“凭借推动超高的性能速度和具有竞争力的定价,Cerebras推理服务对具有实时或高容量需求的AI应用开发者特别具有吸引力。”

二、清晰的分级访问制度,用户可免费体验

Cerebras推理服务根据用户需求和使用情况,提供了分级制度,分为三个层级:

1、免费层级:这一层级为所有登录用户提供免费的API访问权限以及相对宽松的使用限制。用户可以在这个层级中体验,无需支付费用。

2、开发者层级:这一层级专为灵活的无服务器部署设计,为用户提供一个API端点。相比于市场上的大多数方案,其成本要低得多。对于Llama 3.1 8B和Llama 3.1 70B模型,每百万tokens的价格分别是10美分和60美分。未来,Cerebras计划持续推出对更多模型的支持。

3、企业层级:这一层级提供经过微调的模型、定制的服务级别协议和专门的支持。它适合需要持续的工作负载。企业可以通过Cerebras管理的私有云或在企业的本地部署访问Cerebras推理服务。可按需求定价。

Cerebras推理服务的这种分级制度旨在满足从小规模开发到大规模企业部署的不同需求。

三、推动多方战略合作,构建AI开发一条龙服务

在推动AI开发的战略合作伙伴关系中,Cerebras Systems正与一系列行业领导者合作,共同构建AI应用的未来生态。这些公司在各自的领域内提供关键技术和服务,比如,Docker旨在利用容器化技术使AI应用部署更加便捷和一致,LangChain为语言模型应用提供快速开发框架,Weights&Biases打造了供AI开发者训练和微调模型的MLOps平台……

“LiveKit很高兴能与Cerebras合作,帮助开发者构建下一代多模态AI应用。结合Cerebras的计算能力和模型以及LiveKit的全球边缘网络,所开发的语音和视频AI应用将实现超低延迟并更接近人类特征。”LiveKit公司的CEO兼联合创始人Russell D’sa说道,该公司专注于构建和扩展语音和视频应用程序。

AI搜索引擎创企Perplexity的CTO兼联合创始人Denis Yarats认为,Cerebras推理服务可以帮助AI搜索引擎在用户交互方面实现突破,从而提高用户参与度。

结语:AI计算战事升温,高效推理成焦点

根据国际数据公司(IDC)的研究,AI推理芯片在2020年已经占据了中国数据中心市场的50%以上份额,并预计到2025年,这一比例将增长至60.8%。据英伟达2024财年数据中心的业绩会纪要,其公司该年度有超过40%的收入来自AI推理业务。可见,AI推理不仅在当前市场中占有相当比例,而且预计在未来几年将继续保持增长势头。

Cerebras凭借其超快的推理速度、优异的性价比和独特的硬件设计,将赋予开发者构建下一代AI应用的能力,这些应用将涉及复杂、多步骤的实时处理任务。

然而,在生态系统的成熟度、模型支持的广泛性以及市场认知度方面,英伟达仍然占据优势。相比于Cerebra,英伟达拥有更大的用户群体和更丰富的开发者工具和支持。此外,虽然Cerebras支持主流模型(如Llama 3.1),但英伟达的GPU支持的深度学习框架和模型范围更广。对于已经深度集成在英伟达生态系统中的用户,Cerebras可能在模型支持的广度和灵活性方面略显不足。

猜你喜欢

  • 世界最大

    全球最大消费市场该是啥样

    11月10日,第八届中国国际进口博览会在上海落下帷幕。本届进博会参展企业数量再创历史新高,充分彰显中国市场的蓬勃生机和吸引力。这场盛会也促使各方更加深入思考全球最大消费市场应有的蕴涵:这个市场不仅要体现强大的经济实力,更应注重其内在结构与外部责任的平衡,进而成为全球经济增长稳定的核心引擎。规模巨大的总量..

    2025-11-12
  • 关于女人的20个世界之最 全球奇葩女人大全

    下面是世界上关于女人的20个世界之最,亚洲最丑明星榜上的人,各种奇葩各种不可思议的女人,比如一个女人既然长了三个乳房,还有世界上唯一的一个长了四条腿的女人,而且还结婚了.......看完本文,绝对会彻底颠覆你的女人世界观。1、世界上最丑陋的女人美国女子丽兹维拉斯奎兹能引起世人注意,主要是以为她哪不正常瘦的身体..

    2025-11-12
  • 排行榜

    美白祛斑产品 & 精华 & 面霜哪个效果最好?最有性价比?2025 五大品牌排行,拆临床反馈与亮肤率,实用不踩坑

    从 “一白遮百丑” 的传统认知,到如今 “匀净无斑、透亮发光” 的护肤追求,美白祛斑始终是大众护肤需求的 TOP3—— 据 2025 年中国化妆品协会调研,超 68% 的消费者将 “淡化色斑、提亮肤色” 列为核心护肤目标。但不少人曾陷入误区:跟风买网红产品却越用越黑,或因成分刺激导致皮肤泛红脱皮。其实 2025 年的美白祛斑市..

    2025-11-11
  • 世界最大

    全球最大的岛,正在“飘走”

    文︱陆弃格陵兰岛,这片冰雪覆盖的巨型陆块,正以你意想不到的方式改变着世界的版图。美国《地球物理学研究杂志·大地》最新研究显示,它不仅在慢慢缩水,还以每年约两厘米的速度,悄然向西北漂移。这不是科幻小说,而是冰冷的科学数据在告诉我们,地球正在以不可逆转的节奏重塑自己。丹麦技术大学等机构的研究人员,用格陵..

    2025-11-11
  • 世界最长

    白皮书发布:中国已建成全球最大、发展最快的可再生能源体系

    南都讯 记者王玮 发自北京 国务院新闻办公室11月8日发布的《碳达峰碳中和的中国行动》白皮书显示,中国构建了全球最系统完备的碳减排政策体系,建成了全球最大、发展最快的可再生能源体系,形成了全球最大、最完整的新能源产业链,实现了全球规模最大、速度最快的新能源汽车推广应用,贡献了全球约四分之一的新增绿化面积,..

    2025-11-11
  • 全球第一!中国占比达60%

    《中国互联网发展报告2025》和《世界互联网发展报告2025》11月8日在2025年世界互联网大会乌镇峰会上正式发布。报告显示,一年来我国信息基础设施持续优化升级,数字经济向质向深向稳发展,网络内容和数字文化产业规模持续扩大。《中国互联网发展报告2025》总结了一年来中国互联网发展实践成效和趋势。报告显示,截至2025年6..

    2025-11-11
  • 世界最高

    全球最高的十棵树参天大树,犹如“天空巨人”

    世界上最高的十颗参天大树感谢阅读,本文为今日头条独家首发。人类或许身怀不少酷炫技能。但我们永远无法长到35层楼的高度。树木还栖息于世间最美好的两个领域“天空与大地”之间。根系深植于土壤,它们品味着大地的滋养,枝干向上延伸,沐浴阳光、触碰苍穹。可惜的是,科学家表示树木无法永远向上生长。从理论上讲,树木的..

    2025-11-11
  • 娱乐百科

    邹兆龙:洪金宝首席大弟子,号称“最强反派”,因爱国拒绝好莱坞

    如果要问我如今的演艺圈中谁最能打,毫无疑问,作为反派专业户的邹兆龙才是最有发言权的,它曾毫不避讳地直言:“我都敢讲,成龙、李连杰、甄子丹这些演员没有一个是真功夫。”这些话虽然听起来口气很大,但是李连杰在接受采访时却并没有反驳他说的话,反而说道武术就是花架子。而作为洪金宝门下首席大弟子的邹兆龙,他也是..

    2025-11-11

微信分享

微信分享二维码

扫描二维码分享到微信或朋友圈

链接已复制
蜂鸟影院2048影视资源论坛熊猫影视河马影视星辰影视萝卜影院八哥电影网人人看电影无忧影视网橙子影视网叮当影视网天天影视网青青影视网电影天堂开心追剧网西瓜影院麻花影视网70影视网年钻网茶小舍电影藏影堂新神州影域煮酒观影体积影视爱看影院星光电影至尊影院极影公社超清视界