怎么看待OpenAI:已掌握證據顯示DeepSeek盜用其訓練模型?

品葱的野鸡专家们,你们跟OpenAI比起来,谁比较权威
王匪沪宁 沉默的大多数
怎么看待?

答案就是意料之中。

难道还有人觉得匪党自己能搞出chatgpt吗?

芯片搞了半天还是抄袭台积电,一个道理
The19890604 戦争の悪魔近平脊髄剣
圖一樂,中文大語言模型我只能持悲觀態度,你不可能用屎熬出一鍋好粥的。
https://pomf2.lain.la/f/cwgav3hk.jpg?width=444&height=960
給看不懂的人:DeepSeek大語言模型投餵的資料集裡面有百度貼吧、微博等著名屎坑,在源頭就已經嚴重污染了。

大語言模型現今面臨的最大問題之一就是已經快把整個互聯網都爬完了,缺乏「高品質」的「人類對話」素材,偏偏這正是如今互聯網最缺乏的東西。

只看百億大數據去爬抖音、貼吧、微博老哥的互噴,你能指望這個大模型有什麼生產性應用?

但是嘴確實夠臭。
fish 周宇哲 We can be good friends if you let go of our people and land
https://pomf2.lain.la/f/u0yh1l3a.jpg?width=512&height=640
中国的大模型其实都是蒸馏出来的,Deepseek蒸馏的GPT数据,阿里Qwen蒸馏的Claude 3.5-Sonnet,甚至Qwen还是多源蒸馏,这在内业早就是心知肚明的事情,只不过这次出圈太高调了。
OpenAI 不是开源的 用distillation把OpenAI 的数据包装成自己的产品是违反使用协议的
橡果滾呀滾 來支疫苗?
最近因為deepseek炸出了不少五毛,實在太好笑了。二十二十二十
AntiCCP01 坚定反共
虽然我不好判断AI是否泡沫,
但我肯定知道中共是在说谎。
fb_china_today https://pincong.rocks/topic/反中国梦系列
这都可以预料, 其实考虑中国的制度, 应该不需要抱怨。

https://i.imgur.com/MtWQcRA.jpeg

他们用Llama distill了模型然后用OpenAI的API来校准, 把他免费提供同时还提高app和api服务,

这种事情别的国家公司不会做 (法律风险加无利可图)

习主席需要这玩意来维稳的心情都可以理解...


不由得想起了河北大学那位搞基因编辑的韩春雨, 有趣的是真正cripa的发明人之一也是出生河北的美籍华人(11岁去美国的张峰)

不同的制度带来不同的结果, 真是南橘北枳
badsnake6969 维尼熊
楼里有不少不像是帆船的,记住他们的id。申请标注他们就行了。

这事情中共真的做得很傻逼,本身偷偷弄就算了,现在搞到明面上大家不得不设防再加大制裁了。內宣一波搞来长期更严酷的设防。
应该没有抄袭源代码吧?
这个Deepseek还提供了源代码,可以自己下载到电脑上自己进行部署,应该是开放力度太大了,人人都能部署AI,同行坐不住了。
中国人入场的行业,都要卷到大家一起没饭吃。
RobotRepublic 独裁必败
有什么好讨论的,中国抄袭一切,偷一切不是公认的吗!有习近平在,中国能有什么创新啊,就他妈捅鼻子焊大门抓方舱是创新
还能怎么看待,丑国气急败坏抹黑国产大模型呗,敌人越是急了越是反对越说明我们做对了
抄袭是明摆的事。但是你拿一家在美国没有业务的公司也没什么办法。
属于正常人都知道的事,rse随便一看就知道
关键问题在于deepseek的效率提升,也就是RL奖励函数和浮点计算包括通道改进是不是真货
目前看起来很真。就算实际不是5m的成本他的效率提升也明显的。
32b,R17b看上去都不错
好事就是说到底还是moe,就那点前途。
统统提头来见 头上三尺有禁评
这下罪证确凿了,公知汉奸给敌对势力递刀子也就图一乐,真要递刀子还得看俺们党中央🤣🤣🤣这个deepseek的创始人可是参加过座谈会的
dabaichi1 黑名单
本来就是开源的,谈何盗用?
为什么别人不会盗用?
矫枉必须过正 主要关注日本政坛
顺便贴一下DeepSeek的回应,仅供参考:

好的,用户再次询问关于OpenAI指控DeepSeek盗用其训练模型的新闻,并提供了详细的新闻内容。首先,我需要确认用户的需求是什么。用户之前已经问过类似的问题,现在再次提供更多具体的新闻细节,可能希望得到更深入的分析,或者了解事件的最新进展。


用户提供的新闻中提到OpenAI声称掌握了证据,使用蒸馏技术,以及涉及H100芯片的问题。需要从多个角度分析这个事件,包括技术、法律、商业竞争和国际政治因素。用户可能对中美科技竞争、知识产权问题以及AI行业的合规性感兴趣。

首先,要验证新闻的真实性。新闻中提到多家媒体如金融时报、彭博社的报道,还有行业专家的评论。这些来源的可信度较高,但OpenAI尚未公开具体证据,因此需要谨慎处理指控的真实性。

接下来,技术层面,蒸馏技术本身是合法且常见的,但关键在于是否违反了OpenAI的服务条款。如果DeepSeek确实使用了OpenAI的输出训练竞争模型,可能构成违约。然而,证明这一点需要具体的证据,比如API使用记录或模型输出的相似性分析。

关于H100芯片的囤积,这涉及到美国对中国的出口管制。如果DeepSeek确实获得了大量H100芯片,可能通过灰色市场或其他途径绕过禁令,这不仅是法律问题,还可能引发更严厉的制裁,影响整个行业。

还要考虑商业竞争因素。OpenAI可能通过法律手段打压竞争对手,尤其是在AI领域竞争激烈的情况下。同时,中国科技公司常面临知识产权争议,需要区分合理竞争与侵权行为。

用户可能希望了解事件对行业的影响,比如开源与闭源的争论,数据合规性,以及国际合作的未来。此外,中国公司的应对策略,如加强自主创新和合规管理,也是关键点。

需要提醒用户,目前缺乏公开证据,指控可能涉及商业策略或政治因素。同时,技术取证的难度和法律管辖权的问题会影响事件的发展。建议用户持续关注官方声明和法律进展,以获得更准确的结论。

最后,总结时需要保持客观,强调多方因素的交织,并指出可能的行业影响,如推动透明度和国际合作,或加剧中美科技脱钩。确保回答结构清晰,涵盖技术、法律、商业和国际关系等多个维度,满足用户深入分析的需求。

关于OpenAI指控中国公司深度求索(DeepSeek)盗用其训练模型一事,结合新闻内容和行业背景,可从以下几个维度进行综合分析:

一、核心争议点与技术逻辑
蒸馏技术的合法性边界

技术本质:模型蒸馏(Model Distillation)是AI领域的常见技术,通常用于将大型模型的“知识”迁移到更小的模型中,以降低推理成本。该技术本身合法且被广泛使用(如Google的DistillBERT)。

OpenAI服务条款限制:争议焦点在于DeepSeek是否利用OpenAI的模型输出(如ChatGPT生成的结果)作为训练数据。根据OpenAI条款,用户不得“利用输出开发竞争性模型”。若指控属实,可能构成违约,但需证明两点:

直接证据:OpenAI需展示DeepSeek模型与自身输出的关联性(如特定错误模式或文本风格复现)。

数据链路:证明DeepSeek通过API大规模爬取输出数据(如新闻中提到的微软监测到异常API调用)。

H100芯片囤积的合规性质疑

美国出口管制漏洞:H100芯片被禁止向中国出口,但DeepSeek若通过第三方(如东南亚国家)或灰色市场获取,可能绕过禁令。

成本真实性争议:若DeepSeek声称仅用558万美元开发模型,但实际依赖大量H100芯片(单价约3万美元),则其宣称的“低成本路径”可能不实,或存在未披露的芯片来源。

二、事件背后的多重博弈
OpenAI的商业策略

打击竞争对手:DeepSeek的低成本路线(宣称“颠覆AI训练依赖高算力”的叙事)直接威胁OpenAI的商业模式。通过法律指控,可延缓对手发展并强化自身技术壁垒。

数据主权争夺:OpenAI试图通过条款限制模型输出的二次使用,本质是建立“数据护城河”,将用户生成内容(包括模型输出)纳入自身生态闭环。

中美科技对抗的缩影

芯片管制与反制:若DeepSeek确实囤积H100芯片,可能刺激美国进一步收紧对华AI算力限制(如限制A100/H800等替代型号的间接出口)。

中国AI企业的困境:中国公司在核心算力(芯片)、框架(CUDA生态)和基础模型(GPT-4级技术)上仍受制于美国,需通过技术创新(如优化算法效率)和供应链多元化(国产芯片+异构计算)破局。

三、行业影响与潜在后果
对开源生态的冲击

若OpenAI成功限制模型输出的使用,可能迫使更多企业转向完全开源模型(如LLaMA、Falcon),或推动制定新的数据使用协议(如“可商用但不可用于训练竞争模型”)。

法律判例的标杆意义

此案可能成为首例“模型输出知识产权归属”的跨国诉讼,其判决将定义:

模型输出是否属于“衍生作品”(受版权保护)。

使用公开API数据训练模型是否构成“合理使用”。

中美AI监管的连锁反应

美国:可能加速《AI出口管制法案》立法,将模型权重、训练数据纳入管制范围。

中国:或加强国产替代(如华为昇腾芯片+盘古大模型),同时推动数据合规审查(如要求企业证明训练数据合法性)。

四、关键疑点与待验证信息
OpenAI的证据可信度:目前仅通过媒体释放信息,未公开技术细节(如代码相似性分析或数据泄露日志),需警惕“舆论战”可能性。

DeepSeek的回应缺失:作为被指控方,其技术白皮书、训练数据溯源记录尚未披露,无法独立验证是否存在侵权行为。

芯片来源的核实:H100芯片是否通过合法途径获取(如禁令生效前的库存)?需第三方审计机构介入调查。

五、总结与建议
对事件的定性
当前阶段更倾向于商业竞争与地缘博弈的混合产物,而非单纯的技术侵权事件。OpenAI的指控需进一步证据支持,而DeepSeek的低成本叙事也可能存在选择性披露。

行业启示

企业合规:AI公司需建立训练数据溯源机制,避免使用受限制的模型输出。

技术备胎:中国AI产业需加速国产算力(如摩尔线程GPU)与框架(如MindSpore)的协同突破。

国际合作:推动建立跨国AI伦理与数据使用标准,避免技术割据。

后续观察重点

OpenAI是否正式起诉并公开证据。

美国商务部对DeepSeek芯片来源的调查结论。

中国政府对AI企业的支持政策(如算力补贴或数据开放)。

此事件折射出AI行业的核心矛盾:技术开放与商业垄断的冲突、全球创新与地缘壁垒的撕裂。无论结果如何,都可能成为重塑AI竞争格局的关键节点。
DKChan無言101 DKChan無言101
很快小粉紅是不是要準備抵制微軟,並且說拒用Windows?! :-)
pcfun 毛病不改,积恶成习。 学习强国,习惯毛病。
再多来几次,各种各样的公司可以冒出来了,我继续加仓nvda avgo😄😄😄😄😄😄😄😄
小春日和 噢,船长
ai一直都在相互抄襲,你問deepseek我是誰它會回答我是ChatGPT。其他的ai也有幾個回答我是ChatGPT。問Google的gemini我是誰它居然回答我是文心一言。然後剛剛微軟宣佈在自己的ai上採用deepseek。小粉紅高興也好哭也好根本無所謂,他們又不能左右什麼。先不說老共怎麼樣,中國人真的很聰明,最近10年的國際數學奧林匹亞中國拿了6冠,美國拿了5冠(其中一次美中平分秋色),而且美國的ai研究者4成都是華裔。
近卫院御宇 放弃指望美国进行政权更迭的幻想
回旋镖属于是
纽约时报诉OpenAI的案子还没结束呢
当初部署爬虫违背纽约时报的使用条款,爬下来纽约时报版权所有文章时候说“合理使用(fair use),不侵犯人家知识产权,怎么现在幻方用同样的办法就知道要嚷嚷了?

要发言请先登录注册

发起人

支持习主席称帝

状态

  • 最新活动: 2025-01-30
  • 浏览: 7117