20章 、娱乐圈国民男神3(1/2)
薛明🙭🍤庐山瀑布汗,心说咱们是🉐白嫖人家的啊喂,搞得升米恩斗米仇的至于的吗?
其实他培训《乱世出山》的剧情ai过程中已经抓了gpt-1里面很多结构了,这个ai是无人监督培训,非常节约人力,给🅮薛明省了很大的力气,因此他💍🐡在情节编纂方面极大仰仗了openai的成果,当然自己的成果也很多。
openai是硅谷许多大佬联合组织起来的一股ai研究力量🚩,可以说是集中了ai领域的顶级资源,而且因为是非营利组织,所以非常大方,基本上研究出来的东西♷🍄🅧都是大大方方开源的,非常nice。
但是这次不一般,因🂧为这次的研究成果gpt-2实在是太秀了,如果用来造谣,整个互联网都能被毁掉。
这个ai如果敞开了编,是绝对可以以假乱真的,因为各种写作要点了然于胸,套路非常娴熟,而且出🞇货特别快,配上一个自动分发消息的自媒体登录发布脚本,无敌了!它能把假消息编成连续剧,逻辑极度完备的那种,给🄕♆它一个开头它就能编出一整套谣言来,越是成熟有理智的人越容易信。
它甚至还能跟人辩♙🈳论,因为具备📉阅读理解的功能,至于问答都是小case,这也是gpt-2比较容易改造成翻译ai的原因。
所以openai不发布完整的预训练模型,也不发布经过训练的模型,开发者只能从github里拿到阉割版。即使是阉割版的,也比海外🌕⚠💷版《乱世出山》使用的商业化翻译的质量好了很多,这一点是让😪周敏溪亲自体验过的。
这算一个阉割过的好消息。但楚垣许不爽啊,如果没有好🖀的也就算了,有好的但是只能用一个没鸡鸡的,这算怎么回事?
“哎薛明,你说这算是算是openai给了题目又给了答案?咱们能🂽🔍⚼不能逆向工程把解题过程给推导出来?咱把他解出来,然后往github上一放,你说多酷?全♷🍄🅧世界的攻城狮都知道咱们牛逼了。再说也不能惯着openai啊,不能给他们开这个敝帚自珍的口子你说是不是?”
薛明面🝵色一变:“呃……能是肯定能,但是需要时间!”
“需要多久?”
“这个…🌣…咱们没有算力,需要很久很久很久。”
“这🙭🍤怎么会没算力呢?国内云计算资源这么充足,咱花钱买算力不就得了?”
薛明为难的说:“不是,咱们买不到tpu的云资源啊,这个a🚩i训练靠普通的cpu是非常低效的,gpu也差点,最好🖯是tpu。但是国内没有。”
“tp🝵u不是谷歌那套张量流的专用处理器吗?你训练深度学习模型用的也是张量流模型?”
“对对对,国内是有一些可以🉐作为替代的开源库,不过我用的张量流,所以最好是用tpu的算力,不然太费劲。”他说完,又找补一句:“国内用张量流的💍🐡人是最多的啊。”
“有没可能向谷歌申请🅧🈺算🃨力?我记得谷歌是有相关算力对外供应的吧?而且完全免费。”
“有,但是🍿🍲🌁不会给咱们,那是给非商🃦🚄🐲业化用户进行研究的,咱们这个♆吧,虽然也算研究,但是……”
“卧槽!”楚垣夕一拍大腿,为这事对谷歌谎报研究计划,伪装一个个人的身份对薛明来说倒也不是不可以,但是一旦🍕爆出来,巴人的估值会大受影响,甚至要赔钱,这风险是楚垣夕不可能承担的。
但是谷歌早早就退出天朝了,国内买不到谷歌的服务。而🖀薛明使用人家的架构,自己培训个ai没问题,但是涉及到逆向工程这种会遇到算力瓶颈的就没辙了。
换言之,楚垣夕终于亲🅧🈺身感🉤觉到技术上被人卡脖子的状况了,享受了一把科技前沿企业才能享受到的待遇!
“这样我就更想把它搞出来了!”楚垣夕拍完大腿直接把小康的c🆡to和cs🖬o给找了过来,简单说了一下情况,然后问:“咱们有没可能保证技术独立?”
其实他培训《乱世出山》的剧情ai过程中已经抓了gpt-1里面很多结构了,这个ai是无人监督培训,非常节约人力,给🅮薛明省了很大的力气,因此他💍🐡在情节编纂方面极大仰仗了openai的成果,当然自己的成果也很多。
openai是硅谷许多大佬联合组织起来的一股ai研究力量🚩,可以说是集中了ai领域的顶级资源,而且因为是非营利组织,所以非常大方,基本上研究出来的东西♷🍄🅧都是大大方方开源的,非常nice。
但是这次不一般,因🂧为这次的研究成果gpt-2实在是太秀了,如果用来造谣,整个互联网都能被毁掉。
这个ai如果敞开了编,是绝对可以以假乱真的,因为各种写作要点了然于胸,套路非常娴熟,而且出🞇货特别快,配上一个自动分发消息的自媒体登录发布脚本,无敌了!它能把假消息编成连续剧,逻辑极度完备的那种,给🄕♆它一个开头它就能编出一整套谣言来,越是成熟有理智的人越容易信。
它甚至还能跟人辩♙🈳论,因为具备📉阅读理解的功能,至于问答都是小case,这也是gpt-2比较容易改造成翻译ai的原因。
所以openai不发布完整的预训练模型,也不发布经过训练的模型,开发者只能从github里拿到阉割版。即使是阉割版的,也比海外🌕⚠💷版《乱世出山》使用的商业化翻译的质量好了很多,这一点是让😪周敏溪亲自体验过的。
这算一个阉割过的好消息。但楚垣许不爽啊,如果没有好🖀的也就算了,有好的但是只能用一个没鸡鸡的,这算怎么回事?
“哎薛明,你说这算是算是openai给了题目又给了答案?咱们能🂽🔍⚼不能逆向工程把解题过程给推导出来?咱把他解出来,然后往github上一放,你说多酷?全♷🍄🅧世界的攻城狮都知道咱们牛逼了。再说也不能惯着openai啊,不能给他们开这个敝帚自珍的口子你说是不是?”
薛明面🝵色一变:“呃……能是肯定能,但是需要时间!”
“需要多久?”
“这个…🌣…咱们没有算力,需要很久很久很久。”
“这🙭🍤怎么会没算力呢?国内云计算资源这么充足,咱花钱买算力不就得了?”
薛明为难的说:“不是,咱们买不到tpu的云资源啊,这个a🚩i训练靠普通的cpu是非常低效的,gpu也差点,最好🖯是tpu。但是国内没有。”
“tp🝵u不是谷歌那套张量流的专用处理器吗?你训练深度学习模型用的也是张量流模型?”
“对对对,国内是有一些可以🉐作为替代的开源库,不过我用的张量流,所以最好是用tpu的算力,不然太费劲。”他说完,又找补一句:“国内用张量流的💍🐡人是最多的啊。”
“有没可能向谷歌申请🅧🈺算🃨力?我记得谷歌是有相关算力对外供应的吧?而且完全免费。”
“有,但是🍿🍲🌁不会给咱们,那是给非商🃦🚄🐲业化用户进行研究的,咱们这个♆吧,虽然也算研究,但是……”
“卧槽!”楚垣夕一拍大腿,为这事对谷歌谎报研究计划,伪装一个个人的身份对薛明来说倒也不是不可以,但是一旦🍕爆出来,巴人的估值会大受影响,甚至要赔钱,这风险是楚垣夕不可能承担的。
但是谷歌早早就退出天朝了,国内买不到谷歌的服务。而🖀薛明使用人家的架构,自己培训个ai没问题,但是涉及到逆向工程这种会遇到算力瓶颈的就没辙了。
换言之,楚垣夕终于亲🅧🈺身感🉤觉到技术上被人卡脖子的状况了,享受了一把科技前沿企业才能享受到的待遇!
“这样我就更想把它搞出来了!”楚垣夕拍完大腿直接把小康的c🆡to和cs🖬o给找了过来,简单说了一下情况,然后问:“咱们有没可能保证技术独立?”