字节跳动的智能推荐算法是原创的吗?
YouTube2000年初就创立了,按理说智能推荐算法应该是比西瓜视频早才对,现在好像是搞得字节跳动原创似的,已经被墙内人说的与支付宝齐名了
而且西瓜视频连logo都直接抄YouTube的
西瓜视频,抖音,今日头条这些东西有懂行的朋友吗,请指教!
而且西瓜视频连logo都直接抄YouTube的
西瓜视频,抖音,今日头条这些东西有懂行的朋友吗,请指教!
所谓的算法,说白了就是传统统计学换个壳子,可实现的方法很多,比如协同过滤模型,Logistic Regression,LASSO,PCA,神经网络这些基于深度学习的模型,Factorization Machine和GBDT等等,这些东西都是西方上世纪甚至上上世纪搞出来的理论了,全黑纸白字发表成论文,甚至把开源的机器学习和大数据平台都给你搭好了,例如大名鼎鼎的Kafka,MapReduce,TensorFlow这些工具,这些轮子也无一例外是西方人搞出来的。你可以说字节跳动的商业化做的比较好,但我觉得最主要的是在支国,有9亿+无所事事的血汗奴隶费拉,支国给他们一个奶头(抖音),在他们面前挂个胡萝卜,他们就可以日复一日地被剥削。这种大数据下,任何模型都会被train的置信度极高,然后抖音再把在支国train出来的模型投放到其他国家,这其实也是一种降维打击,劣币驱除良币的过程。
现在的推荐算法一般都是基于深度学习模型,字节跳动这么大个公司基于深度学习设计几个适合自己用的推荐算法那真不是个事,但是原创性有多高就很难说了:深度学习又不是它发明的,这方面公开的研究论文也是大把大把的。
机器学习有成熟的现成的模型,模型中有大量的参数(比方说是百万级)。模型需要数据来确定其中的参数,那么就要有大量的数据。中国在数据获取方面比较方便,欧洲的GDPR就不利于科技公司获取数据。有了数据,就能train模型,也就是一些优化的问题,最后确定出参数的值。
当然是原创。Youtube好歹根据内容和你的兴趣来推送,今日头条直接就搞标题党,不管内容如何,只要标题吸引眼球就推给你;抖音无非是按人气来推广
不是原创,但是字节也不是第一个把数据推送(基于推荐算法)应用于新闻端的。
第一个用的是facebook
扎克伯格和张一鸣这两个人,坏事做绝,劣币驱逐良币,不会有好下场的。
第一个用的是facebook
扎克伯格和张一鸣这两个人,坏事做绝,劣币驱逐良币,不会有好下场的。
抖音算法是有大量人工参与的,语音识别后人工修正
字节技术方面主要厉害的地方在于 技术本地化的工程落地能力,
它把舶来算法很成功应用在墙内这么大规模的数据上了,而且能把业务对接的得很精。
说白了就是墙国韭菜再不行,干脏活干苦活的本事还有。
它把舶来算法很成功应用在墙内这么大规模的数据上了,而且能把业务对接的得很精。
说白了就是墙国韭菜再不行,干脏活干苦活的本事还有。
YouTube2000年初就创立了,按理说智能推荐算法应该是比西瓜视频早才对
同樣是智能推薦也能有不同的算法啊?使用不同的實現方式就算原創了
抖音的算法有多原創應該看他碼怎麽寫的
但這種東西原創不原創其實不重要
如果是深度學習的話,其實樓主自己網上找一點攻略,下載幾個訓練用的dataset,自己都能做自己的推薦算法,不難的
dataset越大,精準度就越高。中國通過侵犯個人隱私權和埋木馬,能得到的數據量是世界一流的大
當然實際證明人類的喜好不是那麽容易可以預測的,你今天可能想聽搖滾,但你昨天聽的卻是古典,除非他數據收集到連你早飯吃什麽會如何影響你的腸道菌進而讓你今天想聼什麽都知道的程度否則就是個Artificial Idiot
听说(比如最近在海外接受访问的那位微博审查员), 他们有一个封闭的办公楼专门雇佣大量的人员做(手工)内容推荐。这种方法虽然外国公司也用但是规模大概没有字节那样(以量取胜是中国的独特优势)
人工是实在的, 智能就不知道有多少技术含量了。
人工是实在的, 智能就不知道有多少技术含量了。