DeepSeek是怎么实现政治立场审核的?
这是一个我很诧异的问题。
有人会对其回答政治问题上的立场过于保守以及官方化而指责其是垃圾,是没有水平。
但对我来说,我是很惊诧它为什么能实现这一点。我觉得AI能实现自我审查是一种非常了不起的功能。
因为大家都知道,ai的智能主要来自于语料的投放。而语料是怎么样的,你是很难控制的。它总不可能是由人工搜集语料来给它投放吧?那工程量多大,而且也无法提高其智能啊。
我非常厌恶的就是品葱有一帮非常愚蠢的人类。总想以意识形态先行,而不是从物质形态的本质去看待问题。这种思考方式和40年前的共产党并没有差别。我非常希望共产党继续回到那种僵化唯政治正确的老路上,因为那样做,就一定会削弱共产党本身的能力和水平。然后我看到有那么一群傻逼反贼,也在沿着共产党的这条老路在走,实在让人痛心疾首。你以为你天天喊几句民主自由,这天下就能民主自由了?民主自由本身肯定没有错,但这个东西不是你天天喊口号喊出来的,是干出来的。
我还没有怎么使用过DeepSeek,所以我对其水平暂时还不能发表结论。但是我看到有些海外的自媒体有对其评价,似乎评价很高。(人家是在拿数据说话,不是你那傻乎乎的用一些敏感问题去测试,然后得到结论说它不行。)
品葱有一帮人真的是太愚蠢了!我不知道他们是共产党放出来的故意搅局的文章,还是真的有这么一群脑子不发达的反贼。不懂的用脖子上这个东西进行思考的吗?
有人会对其回答政治问题上的立场过于保守以及官方化而指责其是垃圾,是没有水平。
但对我来说,我是很惊诧它为什么能实现这一点。我觉得AI能实现自我审查是一种非常了不起的功能。
因为大家都知道,ai的智能主要来自于语料的投放。而语料是怎么样的,你是很难控制的。它总不可能是由人工搜集语料来给它投放吧?那工程量多大,而且也无法提高其智能啊。
我非常厌恶的就是品葱有一帮非常愚蠢的人类。总想以意识形态先行,而不是从物质形态的本质去看待问题。这种思考方式和40年前的共产党并没有差别。我非常希望共产党继续回到那种僵化唯政治正确的老路上,因为那样做,就一定会削弱共产党本身的能力和水平。然后我看到有那么一群傻逼反贼,也在沿着共产党的这条老路在走,实在让人痛心疾首。你以为你天天喊几句民主自由,这天下就能民主自由了?民主自由本身肯定没有错,但这个东西不是你天天喊口号喊出来的,是干出来的。
我还没有怎么使用过DeepSeek,所以我对其水平暂时还不能发表结论。但是我看到有些海外的自媒体有对其评价,似乎评价很高。(人家是在拿数据说话,不是你那傻乎乎的用一些敏感问题去测试,然后得到结论说它不行。)
品葱有一帮人真的是太愚蠢了!我不知道他们是共产党放出来的故意搅局的文章,还是真的有这么一群脑子不发达的反贼。不懂的用脖子上这个东西进行思考的吗?
这倒不需要什么特别高深的技术,加个filter规则就能实现。硅谷大公司做的模型,很多也是无比政治正确。
中共国在很多新领域的追赶的确值得整个文明世界警惕,美国已经有不止一次的官员提到中共带来的威胁在各个方面远远胜过苏联,反而是有些反贼天天在那无脑喷中共干什么都是垃圾,独裁专制不代表科技一定不行,二战时的纳粹德国的科技强不强?它们反而因为做事情可以不计代价不计成本追赶的速度可以很快,有些人只要一听到是中共的东西就无脑贬低随便给人扣帽子,感觉像是五毛粉红来反串低级黑愚蠢反贼的,中国人到哪都少不了搞身份政治那一套,立场先行,说话先质疑动机也是笑死
同志們有興趣可以透露一點細節
所有的語言模型應用都會加個guiderail
技術上是decoder的時候選字會有額外的penalty
這樣softmax概率排序就不會選那些會觸發銘感內容的回答
比訓練模型本身要門檻低 關鍵是肯花功夫人工矯正
你說的這些都是早已實現的技術
deepseek號稱的可以在某些方面超越o1的“邏輯推理”都和這些無關 黨國在各種忽悠中國人的宣傳裡面也沒有看到實例 大概你們搞宣傳的不懂這些門道 吹牛找不到重點
所有的語言模型應用都會加個guiderail
技術上是decoder的時候選字會有額外的penalty
這樣softmax概率排序就不會選那些會觸發銘感內容的回答
比訓練模型本身要門檻低 關鍵是肯花功夫人工矯正
你說的這些都是早已實現的技術
deepseek號稱的可以在某些方面超越o1的“邏輯推理”都和這些無關 黨國在各種忽悠中國人的宣傳裡面也沒有看到實例 大概你們搞宣傳的不懂這些門道 吹牛找不到重點
先不说政治审核
Deepseek用的英伟达h100芯片是大量走私绕过监管进入中国的
核心开发人员几乎全是美国海龟.
美国有必要好好反思一下对华的技术泄露和援助
Deepseek用的英伟达h100芯片是大量走私绕过监管进入中国的
核心开发人员几乎全是美国海龟.
美国有必要好好反思一下对华的技术泄露和援助
这些年来中国的遥遥领先每次都被证明是骗人的玩意
DeepSeek作为开源开放权重的大语言模型,其自我阉割并不能通过API服务端过滤规则来实现,因为你完全可以用自己的资源来部署这个模型,也可以通过第三方平台(如DeepInfra、Together.ai)使用这个模型。
它的自我阉割是在模型内部的,然而作为语言模型,做到这点并不难,甚至可以说恰恰是它的强项。
一是在训练数据上预先阉割,在输入训练数据中把某些内容过滤掉,比如天安门事件,你完全不输入这样的数据,模型自然也不知道这回事。但这很难过滤所有数据,因为数据来源的语言类型很多,小语种同样会包含这些信息。
第二点,也是更重要的一点,是针对敏感问题的训练,在模型训练后期,DeepSeek可以生成大量"敏感问题的变体-->拒绝性回答"的语料来训练这个模型,让最终模型循序这样的模式。这里的“敏感问题的变体”语料可以借助语言模型加上提示词来生成。
对于这样做的原因我觉得没必要想太多,毕竟一个中国公司如果发布的开放模型会说出反共的回答,那后果可想而知。DeepSeek的成功没必要和国家联系起来,开源项目/开放模型的成功的受益方是所有普通人。DeepSeek和很多其他中国企业把高质量模型给所有人使用(修改),倒不如说是美国自由价值观成功感化了一些中国人和企业。
根据我的个人对DeepSeek API的使用经验,DeepSeek在政治话题以外是比较开放的,使用非常有限的提示词技巧就可以让它创作黄文,实际使用上限制小于OpenAI 和 Llama 3.1-3.3。
它的自我阉割是在模型内部的,然而作为语言模型,做到这点并不难,甚至可以说恰恰是它的强项。
一是在训练数据上预先阉割,在输入训练数据中把某些内容过滤掉,比如天安门事件,你完全不输入这样的数据,模型自然也不知道这回事。但这很难过滤所有数据,因为数据来源的语言类型很多,小语种同样会包含这些信息。
第二点,也是更重要的一点,是针对敏感问题的训练,在模型训练后期,DeepSeek可以生成大量"敏感问题的变体-->拒绝性回答"的语料来训练这个模型,让最终模型循序这样的模式。这里的“敏感问题的变体”语料可以借助语言模型加上提示词来生成。
对于这样做的原因我觉得没必要想太多,毕竟一个中国公司如果发布的开放模型会说出反共的回答,那后果可想而知。DeepSeek的成功没必要和国家联系起来,开源项目/开放模型的成功的受益方是所有普通人。DeepSeek和很多其他中国企业把高质量模型给所有人使用(修改),倒不如说是美国自由价值观成功感化了一些中国人和企业。
根据我的个人对DeepSeek API的使用经验,DeepSeek在政治话题以外是比较开放的,使用非常有限的提示词技巧就可以让它创作黄文,实际使用上限制小于OpenAI 和 Llama 3.1-3.3。