缺AI晶片!傳陸企拆NVIDIA遊戲顯卡GPU應急 專家:情急之舉
聯合新聞
美國緊縮晶片限制,據傳迫使陸企從輝達(NVIDIA)電玩顯示卡上拆下GPU,加以改造,以發展人工智慧(AI)工具;其中又以該公司最強大的遊戲顯卡GeForce RTX 4090最搶手。專家說,這是情急之舉,效果恐怕不大理想。
英國金融時報(FT)報導,知情人士說,拜登當局去年10月強化AI晶片的出口管制後,遊戲顯卡上的GPU過去一個月需求飆升。工廠經理說,員工上個月拆解4,000張以上的輝達遊戲顯卡,數量是去年11月的四倍以上。
工廠經理說,改造晶片的客戶,主要是上市公司和小型AI實驗室,他們沒在美國新出口管制生效前,囤積足夠的輝達伺服器晶片。
輝達最強大的遊戲顯卡GeForce RTX 4090,是用於改造的最熱門款式之一。但輝達指出,這款顯卡現在已禁止銷陸,該公司已另推降規的GeForce RTX 4090 D。工廠經理表示,降規的4090D與4090性能差距更加顯著,可能表示4090D未強大到能進行大型語言模式的訓練。
業界專家說,改造遊戲顯卡的晶片,是中國大陸解決高階處理器短缺的粗略變通之道。儘管輝達的電玩導向產品具備算力,但數據集更大的大型語言模型,訓練時需要高度精準運算,改裝晶片這方面的能力較弱。而且晶片間的連通速度受限,光是用更多晶片組成運算叢集,很難加以克服。
86Research分析師Charlie Chai說:「這是陸企在出口限制下的情急舉動。就像用廚刀創造藝術品,雖然可行,但效果不盡人意。」
儘管輝達針對中國推出三款降規晶片,以便遵循美國出口管制,並滿足中國的AI需求。但消息人士說,這些晶片表現遠不及以往在大陸販售的版本,並要到3月才能普遍取得。據傳輝達希望降規晶片的售價,與遭禁的舊款相近,大陸客戶也反對此點。
美國緊縮晶片限制,據傳迫使陸企從輝達(NVIDIA)電玩顯示卡上拆下GPU,加以改造,以發展人工智慧(AI)工具;其中又以該公司最強大的遊戲顯卡GeForce RTX 4090最搶手。專家說,這是情急之舉,效果恐怕不大理想。
英國金融時報(FT)報導,知情人士說,拜登當局去年10月強化AI晶片的出口管制後,遊戲顯卡上的GPU過去一個月需求飆升。工廠經理說,員工上個月拆解4,000張以上的輝達遊戲顯卡,數量是去年11月的四倍以上。
工廠經理說,改造晶片的客戶,主要是上市公司和小型AI實驗室,他們沒在美國新出口管制生效前,囤積足夠的輝達伺服器晶片。
輝達最強大的遊戲顯卡GeForce RTX 4090,是用於改造的最熱門款式之一。但輝達指出,這款顯卡現在已禁止銷陸,該公司已另推降規的GeForce RTX 4090 D。工廠經理表示,降規的4090D與4090性能差距更加顯著,可能表示4090D未強大到能進行大型語言模式的訓練。
業界專家說,改造遊戲顯卡的晶片,是中國大陸解決高階處理器短缺的粗略變通之道。儘管輝達的電玩導向產品具備算力,但數據集更大的大型語言模型,訓練時需要高度精準運算,改裝晶片這方面的能力較弱。而且晶片間的連通速度受限,光是用更多晶片組成運算叢集,很難加以克服。
86Research分析師Charlie Chai說:「這是陸企在出口限制下的情急舉動。就像用廚刀創造藝術品,雖然可行,但效果不盡人意。」
儘管輝達針對中國推出三款降規晶片,以便遵循美國出口管制,並滿足中國的AI需求。但消息人士說,這些晶片表現遠不及以往在大陸販售的版本,並要到3月才能普遍取得。據傳輝達希望降規晶片的售價,與遭禁的舊款相近,大陸客戶也反對此點。
75 个评论
原来这才是中国共产党弯道超车的手段,颇有以前贝利亚偷核弹的风采。听说,为了遥遥领先的麒麟芯片甚至颠覆人设当汉奸,全然不顾仇外的奴化教育,伤害一群奴隶的民族感情。
r弱智的问一句 那么amd的显卡怎么样 是否受到制裁?
我不懂
為啥美國還要放任矽谷這些科技公司資敵
難道是左派共產本一家的天性使然
為啥美國還要放任矽谷這些科技公司資敵
難道是左派共產本一家的天性使然
打臉了,打amd的臉
>>r弱智的问一句 那么amd的显卡怎么样 是否受到制裁?
AMD尚未禁售,可能是amd AI開發工具和庫較匱乏,amd很少用作ai相關運算,所以暫時逃過一劫。由於美國是按照算力密度來禁售產品的,AMD RX 7900系列顯示卡也很可能會步其後塵。尤其是日前戴爾發出通知,聲稱不會繼續在中國銷售RX 7900 XTX/XT、Pro W7900。
看了下, AMD Radeon RX 7900 XTX價格也貴
https://www.price.com.hk/product.php?p=570677
intel的卡
https://www.price.com.hk/product.php?p=565250
https://www.price.com.hk/product.php?p=570677
intel的卡
https://www.price.com.hk/product.php?p=565250
萨达姆当年也是拆playstation的芯片来做导弹
被sony公司拿来狠狠的宣传了一波
被sony公司拿来狠狠的宣传了一波
>> 我不懂 为啥美国还要放任硅谷这些科技公司资敌 难道是左派共产本一家的天性使然
不是那么回事,考虑问题不是那么简单,英伟达20%的收入来自中国市场,如果你把全部制程都砍了,英伟达损失惨重还是另说,低端制程中国也不是不能造,又白白损失了这一部分市场收入,更何况还有欧洲那一帮奇葩,都等着抢占美国企业撤出后的中国市场呢
>>AMD尚未禁售,可能是amd AI開發工具和庫較匱乏,amd很少用作ai相關運算,所以暫時逃過一劫。...
AMD显卡上面做开发难度较大,N卡上的开发有点像高级语言,并且开源资源丰富。A卡上面类似于C语言,难度大,并且开源资源少得多。
搞这些花招的「中国式技术脑」们,并不明白他们如今面对的现实:如今的「性能天花板」,将是十年、二十年乃至五十年后的性能天花板……
这种「活了今年就够了」的典型行为模式,就是上述论断的最佳证明。
------------------------------
似乎又到「忆往昔」的时间呢:https://pincong.rocks/question/item_id-551999
这人一上年纪呀,海马体就经常被现实发展拿出来玩儿「被动性酸软」。
这种「活了今年就够了」的典型行为模式,就是上述论断的最佳证明。
------------------------------
似乎又到「忆往昔」的时间呢:https://pincong.rocks/question/item_id-551999
这人一上年纪呀,海马体就经常被现实发展拿出来玩儿「被动性酸软」。
弱弱的问一句,AI用的计算芯片不就是4090吗?就是所谓消费级的高级显卡吧?还有专门提供给AI计算用的?
如果有,从4090上拆下GPU,就可以自己手搓成专门AI计算用的设备了??
如果有,从4090上拆下GPU,就可以自己手搓成专门AI计算用的设备了??
偷,抢,骗。 哈哈哈哈哈哈哈哈
>>弱弱的问一句,AI用的计算芯片不就是4090吗?就是所谓消费级的高级显卡吧?还有专门提供给AI计算用...
适用于服务器的 TESLA 数据中心 GPU
利用 NVIDIA® Tesla® GPU 更快速地处理要求最严格的高性能计算 (HPC) 和超大规模数据中心工作负载。现在,数据科学家和研究人员可以在能源勘探和深度学习等应用场合中解析 PB 级的数据,速度比使用传统 CPU 快几个数量级。Tesla 加速器亦有能力以前所未有的超快速度运行更大型的模拟。此外,Tesla 还能为虚拟桌面、应用程序和工作站提供超高性能和用户密度。
>>弱弱的问一句,AI用的计算芯片不就是4090吗?就是所谓消费级的高级显卡吧?还有专门提供给AI计算用...
英伟达给服务器做的AI芯片,一块要一万多美元,跟消费级的高端显卡是两回事。
>>英伟达给服务器做的AI芯片,一块要一万多美元,跟消费级的高端显卡是两回事。
其實沒有那麼玄乎
例如RTX 6000 ADA 和 RTX 4090 都是使用AD102核心,只是6000 ADA是完整版 4090是閹割版,而且專業卡會配置更大的VRAM。
重點是專業級顯示卡的驅動程式和消費級不一樣,某些生產力軟件在非專業級顯示卡運行環境下效率會較低。
但也無法令人接受數倍的售價差距,不能否認這裏有一點壟斷的原因。
而跑AI主要只看重算力和VRAM,不需要專業卡的特供驅動程式。個人猜測是因4090 已經不支持nvlink,重新組裝成一個並行算力更強VRAM更大的GPU更適合運行AI。但晶片間的連通速度有限,運算叢集方案不能真正和專門設計相比。
>>英伟达给服务器做的AI芯片,一块要一万多美元,跟消费级的高端显卡是两回事。
我查了查去年禁售的型号:A00,在亚马逊上有这个商品:NVIDIA Tesla A100 Ampere 40 GB Graphics Card - PCIe 4.0 - Dual Slot,本质上这还是一块显卡,说的很清楚,一块PCIE 4.0接口的显卡,只不过性能超高,价格超级贵。
这次禁售的4090在NVIDIA的官网也能用“4090”关键字查到,也是显卡,你说的“和高端显卡是两回事”的AI芯片,是什么型号?NVIDIA官网有介绍吗?
>>其實沒有那麼玄乎例如RTX 6000 ADA 和 RTX 4090 都是使用AD102核心,只是60...
不仅仅是VRAM大小和驱动的区别。用在数据中心上的芯片和个人电脑上的芯片,即使架构相同,微架构和制造工艺都可能不一样,因为前者对可靠性的要求比后者高多了。另外,商用芯片卖的不单单是芯片本身,售价里经常还包含技术支持和售后服务。Intel/AMD的CPU,用在服务器上的和个人电脑上的,价格差别也是这么大。
狂笑
然而写新闻的小编并不是业内人士,不会告诉你拆的,只是普通4090的散热器改涡轮。
为啥要改涡轮?因为只有这样才能在一台塔式服务器内装入多张4090。否则风道有问题散热会崩。
你们以为是直接拆焊gpu下来组成a100或者h100小型核弹?可能么?怎么,大陆有自己写vbios的能力,还会做不出显卡啊?
即使如此,多块4090因为没有SLI,用在测试和推理上的性能也远不如3090系列,人家好歹还有SLI。
换句话说,大陆买不到a100/h100小型核弹的结果不会是大陆去拆4090来个聚沙成塔,这是做不到的。
只会是全员切换自研fpga(比如华为鲲鹏)
而且这个切换,会彻底破坏nv cuda的布局,cuda的护城河确实很深,但中国最不缺的,难道不就是35岁开始失业的码农么?
然而写新闻的小编并不是业内人士,不会告诉你拆的,只是普通4090的散热器改涡轮。
为啥要改涡轮?因为只有这样才能在一台塔式服务器内装入多张4090。否则风道有问题散热会崩。
你们以为是直接拆焊gpu下来组成a100或者h100小型核弹?可能么?怎么,大陆有自己写vbios的能力,还会做不出显卡啊?
即使如此,多块4090因为没有SLI,用在测试和推理上的性能也远不如3090系列,人家好歹还有SLI。
换句话说,大陆买不到a100/h100小型核弹的结果不会是大陆去拆4090来个聚沙成塔,这是做不到的。
只会是全员切换自研fpga(比如华为鲲鹏)
而且这个切换,会彻底破坏nv cuda的布局,cuda的护城河确实很深,但中国最不缺的,难道不就是35岁开始失业的码农么?
>>我查了查去年禁售的型号:A00,在亚马逊上有这个商品:NVIDIA Tesla A100 Amper...
英伟达就是在显卡上实现AI的功能,所以英伟达的芯片,显卡和AI芯片就是一回事,商用和消费级有不同的产品线而已。不过现在也有很多不是基于显卡的AI芯片。
>>其實沒有那麼玄乎例如RTX 6000 ADA 和 RTX 4090 都是使用AD102核心,只是60...
然而数据中心一不会用4090 二也不会用rtx 6000 ada
数据中心都是直接部署dgx server的。
>>英伟达就是在显卡上实现AI的功能,所以英伟达的芯片,显卡和AI芯片就是一回事,商用和消费级有不同的产...
你说的“在显卡上实现AI的功能”是什么?我知道NVIDIA有CUDA计算框架,我的理解是利用CUDA这个框架,去驱动显卡,然后做AI所需要的大量计算。
商用和消费级有什么不同?商用级别在NVIDA的官网上没有介绍吗?都是什么型号?你的意思被禁售的是商用级别,消费级没有禁售?然后用消费级上的芯片拆下来可以手搓出商用级别的新的板卡?
>>弱弱的问一句,AI用的计算芯片不就是4090吗?就是所谓消费级的高级显卡吧?还有专门提供给AI计算用...
1,芯片是专供ai的,很多显示有关的电路可以不需要。发热低一点,对散热要求低。
2,见过拆卡视频,需要专门工厂,专门设备,手搓不行。
稍微给你们普及一下常识:
4090单卡,对于ai,只能用于小模型的推理,和最简单的研发测试。
没有SLI的情况下多卡通过pcie并联并不实用,因为pcie4.0(其实就算是pcie 5.0)带宽太小了。
双卡SLI唯一能增加的就是可以跑一些小模型的训练和稍微大一点模型的推理。
你真的要玩大的,请购买nv的DGX,整个上海交通大学的超算中心也就只有8台DGX server。
4090单卡,对于ai,只能用于小模型的推理,和最简单的研发测试。
没有SLI的情况下多卡通过pcie并联并不实用,因为pcie4.0(其实就算是pcie 5.0)带宽太小了。
双卡SLI唯一能增加的就是可以跑一些小模型的训练和稍微大一点模型的推理。
你真的要玩大的,请购买nv的DGX,整个上海交通大学的超算中心也就只有8台DGX server。
>>是的 我這裏是解釋中國如何用4090跑ai,數據中心而是另一種方案
没有人会用4090跑ai
因为4090单卡连跑大模型推理都做不到,最多跑个stable diffustion。
如果你觉得stable diffusion也算ai的话……
>>别,我真的不懂,我一直以为禁售的就是普通显卡,只不过性能超级高,价格超级贵。这个新闻看的我一头雾水。...
a6000和4090就是正好被线卡到的,换句话说就是误伤。
你看4090d不是又来了么……
>>别,我真的不懂,我一直以为禁售的就是普通显卡,只不过性能超级高,价格超级贵。这个新闻看的我一头雾水。...
真正的打击无非就是告诉土共“你不能用cuda了”
然后土共说:“amd会写Rocm,我就不会么?老子多的是35岁等下岗的码农,这就叫工程师红利”
>>没有人会用4090跑ai因为4090单卡连跑大模型推理都做不到,最多跑个stable diffust...
了解大模型的人都知道用4090和那些真正ai方案差遠了,我也只是在猜測意圖,就如文章描述:
這是陸企在出口限制下的情急舉動。就像用廚刀創造藝術品,雖然可行,但效果不盡人意。
小丑罷了
>>了解大模型的人都知道用4090和那些真正ai方案差遠了,我也只是在猜測意圖,就如文章描述:這是陸企在...
说得很清楚了,无非就是为了改散热能把4090多卡插到一台塔式服务器里去用。然而没有sli这个做法的实用性本身就很低,所以基本都是当测试机来用而已。
而且国内4090有多少销量?5万块都没有吧……
>>1,芯片是专供ai的,很多显示有关的电路可以不需要。发热低一点,对散热要求低。2,见过拆卡视频,需要...
神奇,可以只用里面的GPU部分,其他配套的板卡和集成电路可以不用NVIDIA的,然后还依然能支持CUDA,跑起来?这么神奇……
>>我就是想知道4090/4090d是消费者能买能用的显卡吗?CUDA不是个软件架构吗?也有授权什么的,...
是啊,jd上有啊
cuda是一个框架,你理解成轮子就好,cuda去调驱动(是的,用cuda还是会要调用驱动,驱动去调用cu/tensor core/rt core
不能用cuda就是要自己造轮子了
不是在线停用,cuda只能用n卡跑,你没n卡就只能换其他框架了。
>>他们并不拆焊cpu他们只是改散热,改成涡轮能多卡插在一台服务里跑……
我看NVIDIA有一些集成好的设备,比如四张4090(我瞎说的,打个比方)集成在一起,像个小机器一样,然后统一调配使用。你要说自己买四张4090,然后攒这么一台“小机器”,可能还有点可能。
但是我理解美国的禁售,是根本连消费级的4090显卡也禁止卖,应该可以从源头上解决这个问题吧?
>>我看NVIDIA有一些集成好的设备,比如四张4090(我瞎说的,打个比方)集成在一起,像个小机器一样...
你说的那个就是dgx(所谓的“小型核弹”)
然而里面装的并不是4090。
老美禁售的标准本质是“算力密度”,这次4090正好卡在线上了而已。
另外你不能自己搞4张4090自己组一个dgx,因为dgx里显卡用的是专门的总线,比你自己组的pcie快得多得多得多。
商务部这么玩,是因为上次nv搞特供,把上次的禁运直接玩废了。
>>你说的那个就是dgx(所谓的“小型核弹”)然而里面装的并不是4090。老美禁售的标准本质是“算力密度...
哦,涨知识……
如果不能自己装DGX,主楼说的到底是啥?买4090回来,拆什么,组装成什么?
>>哦,涨知识……如果不能自己装DGX,主楼说的到底是啥?买4090回来,拆什么,组装成什么?
拆散热器改,从下压式风扇改成涡轮式风扇,然后可以在一台台式机(塔式服务器)里多装几块。
4090几乎统一都是3槽卡,一台台式机能装2块很开心了。
改成涡轮以后,改善风道,而且可以改成2槽卡,可以装4块。
至于为什么想插4块,因为有些训练的数据量并不大,不需要大显存,也不需要高带宽(显卡间数据传送),只需要存粹的算力。
有些特殊的模型也是只吃算力,不吃显存的……
>>拆散热器改,从下压式风扇改成涡轮式风扇,然后可以在一台台式机(塔式服务器)里多装几块。4090几乎统...
所以DGX里的4块4090,和消费级的4090略有不同,打个比方,体积更小(可能DGX是统一散热?),然后中国是买不到DGX,买4块消费级的4090,装在消费级或者企业服务器主板上,达到能同时使用多块4090的效果,是吗?
但其实核心还是能不能拿到4090吧,我的理解是哪怕消费级的4090也不准许卖给中国了。
>>狂笑,改Vbios这种大陆最多也就是焊双倍显存。说过了“我来组成头部"这种玩法是不存在的,不存在自己...
我同意你改散热的说法。改rom的说法是因为10多年前的n卡可以那么玩,我想当然地提了一嘴。
>>狂笑然而写新闻的小编并不是业内人士,不会告诉你拆的,只是普通4090的散热器改涡轮。为啥要改涡轮?因...
Fpga 的问题是无法做通用计算,只能解决某些特定问题。如果用fpga 做AI,效率极低,那还不如低端显卡。显卡技术这一关,共匪绕不过去。
>>所以DGX里的4块4090,和消费级的4090略有不同,打个比方,体积更小(可能DGX是统一散热?)...
dgx里面装的是特斯拉,单卡性能远超4090了……只是因为它是计算卡,跑不了图形pipeline,所以不能打游戏而已(其实最早也是能打的后来改了)
另外dgs里显卡的互联总线比pcie块得多。
你以为的4卡4090=4*4090
实际上4卡4090大多数时候大概只有1.5*4090,只有一些特例是4*4090。
另外,nv并不直接卖核心,核心都是卖给aig(也就是板卡商的,比如华硕)
所以其实没有任何人能直接拿到核心。
另外,是的,4090现在不能卖了,改卖4090d 所有性能砍10%
>>Fpga 的问题是无法做通用计算,只能解决某些特定问题。如果用fpga 做AI,效率极低,那还不如低...
然而跑ai推理并不需要通用计算。
amd和intel下一代的npu本质(还有手机上已经有了的)上就是fpga。
至于gpgpu么……不是有鲲鹏了么。
我说得很清楚了,cuda的护城河是很深,但是这里最不缺的就是35岁开始失业的码农了……
>>“我来组成头部”这个玩法并不存在……
啊。。原文副標題
美國緊縮晶片限制,據傳迫使陸企從輝達(NVIDIA)的電玩顯示卡拆下GPU,加以改裝,以發展人工智慧(AI)工具。路透
原來是編輯錯了。是真的完全不可行? 看他的描述像是我來組成頭部。
>>dgx里面装的是特斯拉,单卡性能远超4090了……只是因为它是计算卡,跑不了图形pipeline,所...
谢谢。
我还是搞不懂,现在4090买不到了,楼主说的“从游戏显卡4090里拆GPU”到底是个什么操作。
>>然而跑ai推理并不需要通用计算。amd和intel下一代的npu本质(还有手机上已经有了的)上就是f...
现在的趋势是在发展通用AI啊…
从性能和通用性上看,fpga 只能是通用AI计算的一个特定补充,类似于CPU的数学协处理器。
中国码农离开美国各种框架,屁都不顶。
>>啊。。原文副標題美國緊縮晶片限制,據傳迫使陸企從輝達(NVIDIA)的電玩顯示卡拆下GPU,加以改裝...
拆游戏卡改风扇,有的
之前3080ti改24G,也有的,只要把1G的显存颗粒换成2G的颗粒,然后魔改vbios就好
直接拆焊gpu,没有的……
>>现在的趋势是在发展通用AI啊…从性能和通用性上看,fpga 只能是通用AI计算的一个特定补充,类似于...
笑了,于是amd和intel一起鄙视了咯,amd不是自己写了rocm么……
另外推理和训练是两回事
不就是重写一个pytorch和对应的库么……简单得很……
>>笑了,于是amd和intel一起鄙视了咯,amd不是自己写了rocm么……另外推理和训练是两回事不就...
OpenCL也是美国框架啊,并且还是Apple主持的。中国码农离开美国框架,立马回到原始社会,不足为虑。
>>那你又不能禁掉opencl对吧,毕竟和riscv一样开源的……
我觉得美国最厉害的就是组织和框架。中国是离不开的,被动的。即使中国将来花大代价把某个框架搞懂了搞通了,结果美国框架一变,换赛道了,中国又悲催了……
>>我觉得美国最厉害的就是组织和框架。中国是离不开的,被动的。即使中国将来花大代价把某个框架搞懂了搞通了...
并不用啊……
我举个例子,现在cuda用不了了,以后就不用回来了啊。
高性能计算这块,老美的优势是技术好,可以把密度做得好高
土共的玩法是,就好像神威一样,规模做得很大,能耗很高,但是性能并不差。无非老美一个节点能搞定的,土共两个节点咯,反正不差这点电费。
>>OpenCL这个破烂现在也没多少人用了,跟CUDA的差距大概相当于海马和宝马的差距。
cuda无非就是开发效率……
但这里有庞大的35岁工程师红利不是么?你给他们一口饭吃,他们会愿意996乃至007哪怕掉光头发一样帮你写出来。
>>哦,你的意思,搞AI的厂商,买不到商用4090,买消费者渠道里压的消费级4090?
你得看大小厂
对大厂来说,会开发自己的芯片和新的架构
对小厂来说,是的,买不到a6000特斯拉,4090拉过来一样用吧,就是有的时候慢点,有的时候模型要改。
所以才需要把多块4090插在一台机器里用,所以才需要改散热。
>>你得看大小厂对大厂来说,会开发自己的芯片和新的架构对小厂来说,是的,买不到a6000特斯拉,4090...
墙国的大厂更可能是换Intel或者AMD的凑活着用。自己开发芯片大概率是纯烧钱。
