美国唐人社 互联网大厂「算力荒」,智算中心却在「卖卡」求生
发布日期:2025-04-22 08:45 点击次数:183
"能运动跑 70B 模子的国产 GPU 有推选的吗?"在一个算力疏浚群里美国唐人社,一位从业者问。不少复兴玩笑谈:" 48GB 显存的 4090。"
48GB 显存的 4090 显卡并非英伟达推出的官方版块,而是国内专有的魔改版,专为倨傲推理算力需求。该版块在市集上多数流通,价钱近乎翻倍,现时在京东商城里,其售价在 2-4 万元不等。
算力资源信息分享平台柏林云负责东谈主说:"天然现时购买 4090 的价钱翻了快一倍,但租借供给比较充足,房钱并莫得涨。"
与出租算力 3-5 年才能回本的周期比较,告成卖卡赚取翻倍利润,让囤有 4090 的智算中心收拢"救命稻草"。了解智算中心更多"自救"妙技,宽饶添加作家微信YONGGANLL6662疏浚推敲。
" 4090 莫得二手市集这个说法,市集上一些有卡的智算中心会把卡拆下来,更始后再拿去当新卡卖掉,赚取成倍的利润,否则 4090 停产这样潜入,卡从那里来?"智算中心运营商张翔说,"国内的 4090 主如果消费级电扇卡,用在智算中心要先改成涡轮卡,涡轮卡磋磨冷却恶果较电扇卡更为解析,是以智算中心流出来的卡大多经由改装。"
拆卖显卡的另一个要紧原因在于,智算中默算力闲置情况严峻。
评估智算中心的算力使用情况,上架率和点亮率是两个要害方针。上架率温雅的是开辟是否安设上架并通电可运行,而点亮率温雅的是开辟是否在本色奉行谋划任务,为业务所用。
软通能源首席东谈主工智能官金亚东告诉雷峰网:"智算中心上架率不及 70%-75%,没办法盈利,而现时说智算中心点亮率 20%,本色情况可能比这更晦气。"
面对多数闲置算力与回本难题,"卖卡回血"成了业内公开的奥妙。
算力供给"无东谈主问津"的另一面,是算力消纳方"算力荒"。
一头部互联网大厂许多业务部门的算力需求都排不上号,特等是其大模子产物接入 DeepSeek 之后,集团反应各个业务部门算力需求的速率便慢了好多,致使连明星 AI 应用都排不到算力。
"百度算力也不够用,文心、云和大搜索几个部门都在抢。"曾在百度负责 AI 应用开发的李杰说,"算力就像食粮一样,各个部门都在抢,生怕哪天短暂闹饥馑。"
供需错配之下,智算产业乱象丛生。
智算中心销售李海说:"市集上出现了一类被称为‘算力媛’的东谈主,主打信息差收货,了解买方的需求再匹配合适的卖方,撮合一个几亿的形状就能从中赚几千万。"
智算中心数目多余,而算力消纳方高度磋磨,致使消纳方得以向智算中心冷漠极为残忍的互助条件。据了解,旧年某明星大模子创业公司聊了近 30 个智算中心,压价除外,还要求智算中心给他们投资,帮其作念高估值,终末莫得一家签下订单。
卖卡回血、倒卖算力和坏心压价除外,智算中心还濒临哪些行业"暗礁"?究竟是哪些身分致使行业生态误解?古怪的产业环境之下,智算中心又路在何方?
大厂算力紧缺,智算中心却堕入"压价、退租"寒潮
四肢市面上最主要的算力消纳方,大厂"苦算力短缺"已久。
前文说起的两家大厂除外,阿里在全力进入通义千问之后,阿里集团内其它部门的算力也处于紧缺景况。对于更多大厂算力内幕,宽饶添加作家微信YONGGANLL6662互通有无。
于是,头部互联网大厂纷纷加码算力进入,新一轮的算力武备竞赛愈演愈烈。
微信接入 DeepSeek 后,腾讯向英伟达采购了数十亿元领域的 H20 芯片。阿里则告示,翌日三年将进入跨越 3800 亿元用于栽培云和 AI 硬件基础要害,进入总数跨越以前十年总和。而字据浙商证券的研报数据,2025 年字节用于 AI 算力采购的老本开销或达 900 亿元。
大厂对算力抢得火热,智算中心的算力却闲置一旁。
据中国信通院禀报高慢,宇宙已上线的智算中心,算力的合座愚弄率仅 32%。而不少行业东谈主士告诉雷峰网,本色数据比这更低。
"旧年模子厂商到处聊需求,营造出市集很火热的气候,2024 年权术出了上千座智算中心,这些算力根柢迫害不了。"张翔示意。
当供给无法消纳,需求又难以倨傲,行业注定偏离正轨,驶入邪道。
大厂和主要的模子厂商虽濒临算力短缺的问题,但对算力照旧有较高的要求,比喻要求高功率机柜、高密度机柜以及对时刻和空间的一些指定需求,大部分智算中心都无法达标,加之算力闲置的情况严峻,让买方在市集里的讲话权不休彭胀。
金亚东示意,智算中心市集有解析的金字塔效应,巨匠都追赶头部厂商的需求。
一朝营业行动被太多起义等的近况裹带,强势的一方例必将统共利益搜刮殆尽。
据悉,旧年某大厂要建一个 H800 算力集群,最终惟有一家上市公司告捷寄托。原因不仅是大厂要求多,而且贴着智算中心栽培方的成本价去出价,条件也很残忍,导致算力供应方作念起来就很难。
张翔显现,好多东谈主作念大厂的单据,投资申诉率还跑不外银行贷款,全都是鸡肋型的生意。
文爱 胸 小熊饼干如果说大厂的订单是让智算中心赚不到钱,那其他大模子公司就是让智算中心作念损失买卖。
"跟国内排得上号的大模子公司互助,他们根柢不让你赢利,就让智算中心我方去拿政府的新能源方针补贴,或者让智算中心赚开辟租借后剩下的残值的钱。"张翔说,"模子公司还会指定智算中心的租借价钱、崎岖游的互助对象以及开辟起首,这卓毫不合适常理。"
李海示意,某家要作念视频模子的大模子公司由于对传输性能要求很高,A100 相关系列基本上都用成本相对较低的 RoCE 组网,但这个客户要求算力中心提供 IB(InfiniBand)组网,而况这部分红本还要算力中心承担,IB 组网开辟成本不竭占作事器开辟成本的 15%-20%,价钱卓绝立志。
但即等于残忍的算力消纳方,在 DeepSeek 出圈后,也运行退租。一位从业者告诉雷峰网,智算中心运行出现退租的气候,主如果大模子创业公司,因为他们靠融资谢世,莫得我方造血的才能,市集上几家著名的模子公司都有退租的情况。
李海显现,曾是他们公司要紧客户的某六小龙模子公司,近期虽连获多轮融资,互助领域却大幅缩水。
智算中心低上架率背后:供需错配、性能劣势及地域限度
当行业处在早期泡沫阶段,乱象的出现是必经阶段。智算中心的桎梏,从何而来?
供需结构性错配
" DeepSeek 出现之前,开辟选型是变成算力闲置的原因之一。"善想开悟东谈主工智能科技公司 CEO 余溢告诉雷峰网,"国产算力、PCIe 接口的 H100 和 H800,由于用于检会性价比较低,应用端需求又尚未起来,变成了较为严重的闲置气候。"
"不外,这些开辟不错用来作念推理,DeepSeek 出现后,算力闲置的气候有所改不雅。"余溢补充说。
算力资源和需求的错配变成了算力糜费,另一面是对口的算力用不了。
金亚东示意,大部分智算中心的领域都在 1000P(1P 算力每秒能够进行一千万亿次谋划)崎岖,由卓绝散布的社会老本和城市老本栽培,这些老本的特质是有钱但不懂行业,很难去找到合适的需求方。
而给大厂供算力,更是肃穆"天时、地利、东谈主和"。
"好多智算中心都无法倨傲大厂大领域检会的前置要求,比如高能耗方针、高功率机柜、高密度机柜以及集群的排布。"余溢示意。
硬件性能匹配难度大,让大厂习尚找我方的永远互助伙伴,因为两边磨合潜入,算力提供方能更懂大厂的需求,比喻滋润科技就拿了好多字节以及几家头部互联网公司的订单。
因此,第三方公司想要拿到订单就只可收拢大厂算力紧缺的窗口期,就像 H20 的短暂爆火带来的需求。不外,能流向市集的订单都比较迫切,比如要求三个月内算力就必须到位。
有从业者显现,好多拿到大厂订单的厂商会把订单拿到市集上"招标",我方不抓有开辟,纯赚差价。
而创业公司是数目很大的长尾客户,这部分公司的需求尚未起来亦然算力闲置的要紧原因。
" AI 应用需求是一个幂指数,现时在底部爬行,到了爆发的节点会飞腾好多,AI 应用爆发起来还要 1-2 年的时刻。"金亚东说,"现时,AI 应用的发展还濒临比较多的门槛,包括对技艺的倡导、成本的考量以及底层大模子才能尚有欠缺。"
找不到、用不起算力,亦然现时创业公司濒临的渊博问题。
"由于英伟达被禁,惩处算力需求比较受制于渠谈资源,供需匹配存在周折,是以算力市集有好多二谈街市。"余溢示意。
另外,对好多创业公司而言,还存在用不起算力的气候。李海示意,好多 AIGC 公司还但愿用一年前的预算来购买和租借现时的开辟。
国产算力性能欠缺
供需结构性错配除外,国产算力性能无法匹配市集需求,一样变成算力糜费。
"公司测试了国产芯片的性能,测试工程师反馈‘只安妥个东谈主用户玩一下,无法四肢产物作事去寄托’。"张翔说,"国产芯片部署模子,只消出错过一次,作事器就会挂掉,需要重启作事。"
据了解,不少国产芯片公司为了拿到智算中心的订单,会向智算中心应承包销算力,而况出资 10%-20% 去栽培智算中心,在明面上,将两边的利益系缚在一王人。
"事实上,对于包销应承,好多都是无疾而终,不外芯片厂商不终了应承,智算中心就不给尾款。"张翔说,"终末的结局就是一地鸡毛,开辟放着吃灰。"
现时,国产芯片公司都急于拿到智算中心的订单,原因在于智算中心的大单能给芯片公司作念"漂亮账",能不可用并不要紧,要紧的是有本色的订单数额。芯片行业资深从业者潘王人显现,有从大厂跳槽到芯片公司负责销售的东谈主,因为拿不到智算中心的订单下野了。
头部的国产 AI 芯片创业公司都已走到决胜 IPO 的阶段,产物才能、本色的订单数目以及大集群的栽培才能对于谁能胜出,有着要紧影响。
暴燥的竞争态势之下,为了拿到智算中心的订单,市集上繁殖出许多"卓绝规操作"。
据悉,包销应承让智算中默算力闲置的压力压到了芯片公司身上,除了跑路的顶点情况外,更体面的作念法是用钱雇算力消纳方去使用我方的算力。
"某国产芯片公司被逼得用钱买营收,找到大模子厂商和一些现实室谈互助,花一个亿换回三四千万的营收。"潘王人说。
而自己有算力需求业务板块的公司,则会让我方的业务去消纳算力,向智算中心保证使用率,但撑完 6 个月的验收期之后,就撤掉业务,导致算力愚弄率大幅下跌。
地域限度为算力消纳戴上桎梏
"大部分东部沿海地区的算力供给会因为夏天电力不及濒临挑战,西部地区电力资源丰富,但算力的使用场景不及。"电信辩论院一级分析师张小东示意,"以胡焕庸线为界,字据统计的收尾,东部地区 AI 崎岖游企业跨越 60 万家,西部地区仅 1 万家傍边,但惟有 30% 的智算中心能作念跨省的算力转机,算力孤岛的气候很严重。"
此外,一些县级市栽培的算力中心,主要方针是拿到省里的补贴,但县级市一般缺少不错作念后期珍惜的技艺团队,而况当地莫得消纳算力的企业,这就变成开辟的空置率卓绝高。不少从业者合计,地点政府应该把算力和应用系缚起来四肢智算中心栽培的侦察方针。
算力跨区域转机除了物理限度除外,还濒临"东谈主为限度"。
一位从业者示意,一些地区的算力补贴会收尾惟有当地的企业才能享用,这也会变成资源的错配。
而数据的秘籍性和安全性,也让算力的跨区域调配濒临制肘。
据了解,大部分机构都会把数据留在我方的手里,是以对智算中心的位置会有要求,此前,互联网大厂有黄金 10 公里的说法,要求算力部署在我方 10 公里的领域内,既不错保证数据安全,又能够缩短延时。
"数据不可能流动起来,基本照旧在当地的智算中心作念检会和推理。"一位从业者示意,"东数西算还莫得发达出其价值。"
算力需求将涨 10 倍,5000 万家中微型企业才是算力消纳主力
"泡沫期"是行业大领域发展的必经之路,这意味着资金、东谈主才和技艺的涌入,阵痛事后,智算中心将走上正轨。
"全社会对 AI 技艺认同进度不休提高,现时作念 AI 应用机遇弘远,大厂的温雅点更多落在平台和生态方面。"余溢说,"创业公司单个客户天然小,关联词数目好多,长尾客户占到 80%,会耐心把闲置的算力填满。"对于 AI 应用过甚对算力市集的影响,宽饶添加作家微信YONGGANLL6662疏浚磋磨。
金亚东则示意,智算中心获益是一个很要紧的方针,智算中心处在上游,其能盈利代表卑鄙的 AI 应用仍是被周转。
张小东合计,从数据产量和日均 Token 迫害量两个维度进行推理,都能高慢出对算力的需求量正在不休飞腾。
2024 年,中国数据产量同比增长 20%,数据流通量同比增长超 30%,好多数据都用于 AI,从数据使用量的角度倒推算力需求量的增长比例简略在 20%-30%。
从日均 Token 迫害数目统计,运营商里面估算的数据是 2024 年合座的 Token 迫害量简略在 5 万亿,2025 年底预测会翻十倍到 50 万亿,Token 用量代表对算力的迫害,从这个角度讲,算力的需求会增长 1000%。
需求量的飞腾将带动闲置算力的消纳,而行业也正在推出更活泼的销售模式以适合市集需求。
针对检会需求,智算中心会把脱落的算力构成合座售卖给头部客户。针对小客户的推理需求,智算中心会把算力打散,更正原先租整机的模式,将一台机器 8 张卡分红 24 小时售卖,活泼建树卡时给用户。而按照 Token 计数的算力收费模式,则通过最小的计费单元,实现最大化的算力消纳,提高算力的愚弄率。
"世界上莫得效不掉、差别适的算力,要点在于找到合适的应用。"金亚东说,"算力市集更要紧的是作念好‘散对散’之间的配对,100-1000P 算力供给方和简略 5000 万家中微型企业才是翌日市集的主角,仍是上线的天元智算算力转机平台就能为散对散的走动提供互助渠谈。"
而对于国产算力濒临的性能问题,也不休有新的技艺惩处决议进行算力优化。
"国产芯片比较像单项选手,合座的性能较弱但一些方针性能尚可。"潘王人合计,通过异构集群对国产芯片进行算力优化,并通过先进谋划迭代平台,推动软件带动硬件,能够形成一个合座优化的惩处决议。
国内北电数智、无问芯穹和澎峰科技等企业都在针对国产算力作念优化,通过不同的技艺惩处决议,擢升国产芯片在算力方面的性能和遵循。
政府补贴是撑抓国内智算产业发展的要紧力量,却在市集上饱受诟病。不少从业者合计,补贴引来了诸多逐利者,烦嚣了智算中心产业的平素发展。
金亚东说,"这是产业发展的法例性气候,在低级阶段,国度把钱投到智算中心并推动国产芯片的使用没什么问题,新能源电动车亦然这样补贴出来的,先补供给侧,供给量豪阔大的时候再补需求侧,终末让需求侧挑选供给侧,市集化的筛选能挑出最有竞争力的参与者。"
下个阶段,政府的支抓和补贴或将滚动到卑鄙的 AI 应用。跟着需求量的增多、供需匹配机制的完善以及拨乱归正的鼓吹,智算中心还值得期待。
作家将永远温雅智算中心产业变迁及出海布局相关动态,宽饶添加微信YONGGANLL6662疏浚磋磨。
注:张翔、李杰、李海、潘王人均为假名美国唐人社。