2025年被AI行业普遍认为是"推理之年"。随着OpenAI o1、DeepSeek R1等推理模型的广泛应用,市场对AI芯片的需求正快速增长。英伟达CEO黄仁勋预测,AI推理已取代模型训练成为算力需求的主要驱动力,其规模增长可能超过去年预估的100倍。
面对美国芯片禁令和国产GPU性能不足的挑战,国内厂商采取了集群化技术路线。华为最新发布的"昇腾384超节点"成为业内最大规模算力集群,通过高速互联技术将384张AI芯片连接起来。在此基础上,华为云推出的CloudMatrix 384单集群算力已达300 PFlops,性能与英伟达NVL72相当。
随着AI推理需求比重增加,算力优化变得尤为关键。新型AI应用如"长思考"功能和智能体应用的出现,使模型需要更复杂的计算过程。华为通过优化MOE架构,实现了15ms的低时延和业界4倍以上的单卡吞吐量。
全球算力基建正在快速扩张,英伟达、AMD等公司在中东地区达成百亿美元订单,计划建设数十万张GPU规模的算力集群。国内厂商也在加速发展,华为表示多个昇腾384超节点组合已可支持10万卡集群的算力需求。
模型推理推动算力需求百倍增长,国产厂商如何进行AI基建?
界面新闻
腾讯发布混元3D 2.1大模型 全面开放源代码
腾讯在计算机视觉领域的顶级会议CVPR2025上宣布了一项重要消息,混元3D 2.1大模型正式对外开源。这一举措标志着腾讯在3D视觉技术方面的研究成果开始向全球开发者开放。混元3D模型是腾讯在3D视觉领域的重要研究成果,目前已经在知名开源社...
界面新闻|2025-06-16 12:12
"智能玩具新趋势:大模型如何引爆情绪消费"
近期,AI技术正在快速渗透玩具行业,为传统玩具赋予智能化交互能力。全球玩具巨头和科技企业纷纷布局这一新兴领域,预示着玩具市场即将迎来一场智能化变革。OpenAI与芭比娃娃制造商美泰公司达成战略合作,计划在今年推出首款AI玩具产品。美泰作为全...
财联社|2025-06-15 16:55
中国基建成就显著,任正非强调发展为民
近日,华为创始人任正非在接受《人民日报》采访时,分享了对基础科学研究、中美发展模式差异以及人工智能前景的深刻见解。他特别强调了理论科学家的重要性,认为他们往往处于孤独的研究状态,需要社会给予更多理解和战略耐心。任正非透露,华为每年投入180...
快科技|2025-06-13 21:30
"豆包大模型1.6高考数学144分创纪录 实力碾压全国考生"
6月11日,字节跳动旗下火山引擎举办了FORCE原动力大会,正式发布了豆包大模型1.6版本。此次发布的新系列包含三个大模型,分别是Doubao-Seed-1.6-thinking、Doubao-Seed-1.6和Doubao-Seed-1....
快科技|2025-06-13 21:00
meta发布LlamaRL框架:异步分布设计让AI训练提速10倍
meta公司近日推出了名为LlamaRL的全新强化学习框架,这一创新技术在大规模语言模型训练领域取得了突破性进展。根据科技媒体marktechpost的报道,LlamaRL框架采用全异步分布式设计,在4050亿参数模型上的测试结果显示,强化...
IT之家|2025-06-13 18:10
小鹏G7首发自研芯片:性能超Orin-X三倍,智能驾驶再升级
小鹏汽车在6月11日晚正式发布了全新车型G7,这款车被称为全球首款具备L3级算力的AI汽车。该车最大的亮点是搭载了小鹏自主研发的图灵芯片,官方宣称1颗图灵AI芯片的算力相当于3颗Orin-X芯片。G7配备了3颗自研图灵AI芯片,有效算力达到...
IT之家|2025-06-13 11:00
小鹏G7首发智能驾驶辅助系统,实现大脑小脑协同控制
小鹏汽车在6月11日的发布会上正式推出了智能驾驶辅助VLA-OL模型,这一技术将首次应用于全新G7车型。该模型实现了从"小脑式反射"到"大脑+小脑"认知模式的重大升级,标志着小鹏汽车在自动驾驶领域迈出了重要一步。这套系统通过"运动型大脑"和...
快科技|2025-06-13 10:50
创投大佬周炜预言:大模型巨头将不超过3家
创世伙伴创投创始主管合伙人周炜近日接受新浪科技《科创100人》栏目专访,分享了对AI与机器人赛道的深刻见解。作为技术出身、跨越多轮投资周期的资深投资人,周炜对行业趋势的判断具有重要参考价值。周炜指出,大模型行业正经历残酷洗牌,但激烈程度不及...
新浪科技|2025-06-13 07:00
英欧电信巨头联手推进AI基建
6月11日,英伟达在法国巴黎举行的GTC Paris大会上宣布了一项重要合作计划。该公司将与欧洲多家知名电信企业展开深度合作,包括法国的Orange、意大利的Fastweb、瑞士电信、西班牙电信以及挪威电信。这一合作旨在共同开发和扩展覆盖欧...
界面新闻|2025-06-12 19:00
"中东数据中心巨头Khazna联手英伟达 打造非洲AI新基建"
6月11日,阿联酋科技公司G42旗下的数字基础设施提供商Khazna数据中心宣布与英伟达达成合作,双方将在中东和非洲地区共同建设人工智能工厂。这一合作标志着该地区人工智能基础设施发展迈出了重要一步。根据声明内容,英伟达已经对Khazna下一...
界面新闻|2025-06-12 18:50
元戎启行VLA模型三季度量产 年内覆盖五款新车
6月11日,界面新闻从相关渠道了解到,自动驾驶企业元戎启行研发的VLA模型计划在今年第三季度正式进入消费市场。根据目前掌握的信息,预计至少有5款不同品牌的车型会搭载这一创新技术。这一进展标志着自动驾驶技术向大规模商业化应用又迈出了重要一步。...
界面新闻|2025-06-12 18:40
科技巨头meta发布新一代AI模型V-JEPA 2
6月11日,meta公司发布了新一代视觉预测模型V-JEPA 2。这款模型在物理世界的视觉理解和预测方面取得了突破性进展,达到了业内领先水平。官方表示,该模型能够显著提升人工智能代理的物理推理能力,为AI理解现实世界提供了新的技术支撑。为了...
界面新闻|2025-06-12 15:30
本信息来自互联网,不代表导读网立场,如若转载,请注明出处:http://www.frfey.com/news/67473/