本文由半导体产业纵横(ID:ICVIEWS)轮廓激情与放荡
陈立武对准了英伟达。
据报说念,英特尔新任CEO陈立武在最新提交的年报中暗意,“咱们无疑须建造具竞争力的机柜级系统处理有打算,借此强化云霄AI数据中心的市集面位,这将是我跟团队的优先要务。”
据悉,陈立武对准的竞争居品,是英伟达当今最顶级的GB200 NVL72 Blackwell AI系统。别称英特尔前高层曾暗意,英伟达这套系统是AI探究领域的“终极掠食者”(apex predator)。GB200 NVL72在一台做事器机柜里面贯穿了72颗GPU,远多于上一代的8颗GPU,能在有限空间内提供前所未见的算力密度。
当今,英伟达在AI数据中心市集居于霸主地位,占据接近90%的AI芯片市集份额。AMD在2024年也竣事了进步50亿好意思元的AMD Instinct加快器收入。比较之下,英特尔在AI市集确切认却欠佳。
2024年10月,英特尔公司就曾坦承旗下Gaudi系列AI加快器无法达成之前设定的2024年5亿好意思元营收打算。本年1月,英特尔新一代AI数据中心居品“Falcon Shores”被传难产,将转而研发另一款AI数据中心处理有打算“Jaguar Shores”。
无法达成预期营收的Gaudi
Gaudi 系列AI加快器是英特尔推出的用于东说念主工智能探究的居品。2024年4月,英特尔晓示将推出Gaudi 3 AI加快器,其在芯片架构和性能进步方面确切认受到外界关怀。
相较于上一个版块 Gaudi 2,Gaudi 3制造工艺从台积电7nm升级到台积电5nm,MME(矩阵乘法引擎)从2个增多到8个,诚然每个MME里面的TPC(张量处理中枢)从12个减少到8个,然而总和从24个大幅增多到了64个,媒体解码器差从8个增至14个,内置SRAM缓存容量翻番至96MB,带宽翻倍至12.8TB/s。
中枢肠能方面,MME BF16/FP8皆是1835 TFlops,矢量BF16则是28.8 TFlops,划分进步了3.2倍、1.1倍、1.6倍。HBM2E高带宽内存容量从96GB增多到128GB(八颗),带宽也适合增多来到惊东说念主的3.7TB/s。24个200Gb RDMA收集接口,双向收集互连带宽1.2TB/s,主机接口峰值双向带宽128GB/s,系统总线升级为PCIe 5.0 x16。
按照官方说法,Gaudi 3对比NVIDIA H100,LLM大模子推感性能最初50%、践诺期间快40%,性价比则是敌手的2倍。在居品推出的同期,英特尔就晓示Supermicro 和 Dell 等主流做事器供应商也曾开动复古 Gaudi 3 系统,何况与IBM张开天下合营,IBM的watsonx AI和数据平台中将率先复古Gaudi 3。
英特尔对Gaudi 3将来发展充满信心。同月,英特尔发布财报瞻望 Gaudi AI芯片居品线将带来5亿好意思元销售收入。但可惜抑制并不乐不雅,稍后在2024 年第三季度财报电话会议上,英特尔首席实行官帕特・盖辛格暗意,尽管 Gaudi 3 加快器已于本季度推出,但因居品从Gaudi 2向Gaudi 3的过渡以及软件易用性问题影响了接管率,合座市集选择度低于预期,无法竣事2024年Gaudi收入达到5亿好意思元的打算 。
始终停留在实验室阶段的Falcon Shores
r级书屋长篇小说Falcon Shores 是英特尔下一代 GPU,并将整合英特尔Gaudi的本领。但Falcon Shores从想象到量产,沿途皆很险峻,临了甚而被取消。
伊始,Falcon Shores想象筹谋是XPU,集成x86架构CPU与GPU,然而这一想象靠近致命过错,CPU 模块性能不及且功耗过高,无法与AMD Instinct MI300A等竞品竞争。2023年,英特尔被动烧毁XPU有打算,转向纯GPU架构,导致建造周期蔓延。
Falcon Shores与台积电合营,行使3nm和5nm工艺坐蓐,并勾通CoWoS先进封装本领,这既进步了芯片性能与集成度,又提高了坐蓐效果与居品性量。该 GPU 瞻望集成 288GB 的 HBM3 内存,运行速率可达 9.8TB/s 蒙胧量,还复古 FP8 和 FP16 浮点精度,能猖獗 AI 过火他使命负载的不同精度探究需求。
Falcon Shores本来打算于2024年推出,但自后推迟到2025年。2025年2月,在财报电话会议上,英特尔临时纠合 CEO Michelle Johnston Holthaus 涌现,原打算于本年推出、旨在勾通Intel Xe图形才气和Gaudi AI性能上风的 Falcon Shores面貌将始终停留在实验室阶段。“咱们打算仅将Falcon Shores用作里面测试芯片,不会推向市集。”
全力押注机架级处理有打算Jaguar Shores
在资历一系列不毛之后,英特尔再行评估了其策略,合计与其推出单一芯片,不如整合Gaudi加快器、Xeon CPU和收集本领,打造Jaguar Shores机架级处理有打算。
Jaguar Shores由Habana Labs主导建造,接管Intel 18A 工艺与后面供电本领,强调机架级优化。其烧毁了Falcon Shores 的纯 GPU 阶梯,转向夹杂架构,可能集成Gaudi ASIC与Xe-HPC GPU本领,兼顾通用性与 AI 加快。其中,Falcon Shores部分本领(如液冷想象、CoWoS 封装)将被移植到 Jaguar Shores。
凭证筹谋,英特尔将在2025 年推出Jaguar Shores样品,2026 年量产,将来Jaguar Shores会替代Gaudi 3成为英特尔AI数据中心主力居品,与英伟达GB200 NVL72 张开竞争。
*声明:本文系原作家创作。著述本色系其个东说念主不雅点,本身转载仅为共享与参谋,不代表本身讴颂或认可激情与放荡,如有异议,请有关后台。