中國的AI模型Deepseek V3在運算能力上甚至遠超ChatGPT 4o
Deepseek是大陸的某家AI公司,據我所知,通過訓練ChatGPT提供的答案和素材,在這個基礎之上,所訓練出來的模型
不僅訓練花費僅僅550萬美元,遠低於1個億的ChatGPT或者其他巨頭公司Google等所花費的幾千萬
同時性能層面上並駕齊驅甚至更好
還有模型是通過一堆英偉達的H800s,就是弱化版顯卡,僅僅花費2個月時間就訓練出來了
嚴格意義上講確實是抄襲
不過目前美國AI界和投資人是認為目前可以依靠極其低廉的價格和時間成本來訓練一個幾乎一樣的模型,這點讓人摸不著頭腦
其次,中國的這種IP抄襲,也沒法被告,因為在中國大陸
你們怎麼看?
UPDATE:
我提供一些參數吧
YouTube - Chinese start-up DeepSeek threatens American AI dominance

下圖為DeepSeek V3在英語、編程、數學和中文方面和其他AI的對比 (數值越大越好)

下圖,橫向為所花費的資金,縱向為性能
DeepSeek V3目前相當於站在了一個黃金點裡面,性價比吊打GPT, Claude, Gemini


UPDATE 2:
OpenAI 的CEO Sam Altman對於DeepSeek的看法
「複製那些你知道「已經行得通的」是相對比較容易的
但是如果你嘗試做一些全新的、冒險的、難度大的而且你不知道它會不會成功的事的時候,是極度困難的
·······」
不僅訓練花費僅僅550萬美元,遠低於1個億的ChatGPT或者其他巨頭公司Google等所花費的幾千萬
同時性能層面上並駕齊驅甚至更好
還有模型是通過一堆英偉達的H800s,就是弱化版顯卡,僅僅花費2個月時間就訓練出來了
嚴格意義上講確實是抄襲
不過目前美國AI界和投資人是認為目前可以依靠極其低廉的價格和時間成本來訓練一個幾乎一樣的模型,這點讓人摸不著頭腦
其次,中國的這種IP抄襲,也沒法被告,因為在中國大陸
你們怎麼看?
UPDATE:
我提供一些參數吧
YouTube - Chinese start-up DeepSeek threatens American AI dominance

下圖為DeepSeek V3在英語、編程、數學和中文方面和其他AI的對比 (數值越大越好)

下圖,橫向為所花費的資金,縱向為性能
DeepSeek V3目前相當於站在了一個黃金點裡面,性價比吊打GPT, Claude, Gemini


UPDATE 2:
OpenAI 的CEO Sam Altman對於DeepSeek的看法
「複製那些你知道「已經行得通的」是相對比較容易的
但是如果你嘗試做一些全新的、冒險的、難度大的而且你不知道它會不會成功的事的時候,是極度困難的
·······」
37 个评论
山姆奥特曼的原话不知道具体是什么意思,不过个人也觉得训练AI就像培养一个小孩,不依靠长期大量的教育和培训怎么可能掌握大量的知识和技能呢,这种事情也能走捷径的吗?总感觉在某些地方投机取巧了,也许就像你说的用了现成的语料数据吧,不过华尔街也不是傻子,股票下跌又是怎么回事?总之总感觉事情很蹊跷