主笔 / 村口有牛
文章架构师 / 毛自聪
出品 / 巨头财经
5月至今,人间躁动,各路大模型你方唱罢我登场,VC圈互联网圈媒体圈已近癫狂。
谁也没想到,今日,360再度刷屏,老牌互联网巨头展现了All in的决心,以及更加务实落地的商业理解。
巨头财经带来几个全新视角解读,仅供一阅。
先来欣赏一下段子手的金句:
数字永生这个概念离我们并不遥远,我们可能模拟出来一个伊隆·马斯克,一个爱因斯坦一个周鸿神,数字人模拟他们的说话口吻、思维方式、知识和积累,使得我们可以跟他们去交流。
在友商面前,最惭愧的是不善于吹牛。周鸿祎数字人则很自信:对于360集团发展人工智能“充满信心”!
人工智能,还是以人为本,有史以来人类最好的工具,工具赋能,为每个人每个公司每个政府机构每个行业每个国家,提高它的劳动生产率。
360智脑重新定义数字人:有人设、有记忆、有经历、好玩、好用、可定制。
大模型引领新工业革命,大模型+重塑生产生活,不亚于PC互联网iPhone的机会。
大模型出来前,所有自动驾驶都只是辅助驾驶。
GPT不是玩具,不是搜索引擎、不是聊天机器人、这些都是它亲民推广的伪装,背后强大的超级大脑代表着超级人工智能时代的来临。
大模型真正想象力,在于通用化垂直化,不同业务场景需求深度的融合。才刚刚开始,未来有10年红利期,所有的APP,所有的网站,都值得重塑一遍。
我来说国内大模型跟国外差距两年,我收回这句话,今天已经接近国际水平。
GPT有很多缺点,幻觉、知识模糊、解数学题能力偏弱,但是它是人类第一次找到一条路,不仅是指明了方向,而且探索出来了,使得我们能够真正地把这个世界的模型能力在电脑里建立起来。
2018年如果有员工找我提建议发展AGI,别管李总还是马总都会说滚一边去,感谢openai,给行业指明了方向,把搜索能力搬运过来。这是人类第一次,探索出来,把世界的知识模型,在电脑里建立起来。
周鸿祎果然还是那个人间诚实的周鸿祎,该感谢就感谢,该直言不讳就直言不讳。
这些金句来自360集团6月13日举办的360智脑大模型应用发布会。
自2023年3月29日以来,360智脑已从1.0迭代至4.0版本,应用成果持续落地,刷新了大模型的“中国速度”
360集团创始人周鸿祎介绍,360大模型研发落地拥有“八大天然优势”,完整覆盖训练全程。同时,360智脑的生成与创作、多轮对话、代码能力、阅读理解、逻辑与推理、多模态等十大核心能力可覆盖大模型全部应用场景。
这个速度和优势的背后,也是360在AI大模型的积累由来已久:
2015年成立AI研究院;2018年为了提高智能音频视觉技术,开始研究多模态;2022年在知识图谱领域世界杯比赛中,战胜图灵战队,夺得冠军……从2015年到现在也有8年时间。
360智脑4.0已具备了生成与创作、多轮对话、代码能力、文本分类、文本改写、阅读理解、逻辑与推理、知识问答、多模态、翻译等十大核心能力,维度涵盖数百项细分功能,可覆盖大模型全部应用场景。
工信部信通院、SuperCLUE等也对360智脑进行了评测:
在工信部信通院评测中,360智脑是国内首个通过信通院AIGC大语言模型功能评测的大模型,10个部分,36项基础能力全部都通过了评测;
03 360智脑:已具备跨模态生成能力
再进一步来说,与国外相比,中国自研大模型弯道超车的关键是什么?
多模态。
一个完整的人工智能大模型有四大能力:文字处理、图像处理、语音处理、视频处理。
过去Chat GPT的发展路线,更多是围绕文字把参数做大,在GPT4.0发布的时候,才漏了一手多模态的能力。
目前中国的大模型在文字能力上,已经赶上了GPT3.5,对GPT4.0的差距也在以肉眼可见的速度缩小差距,剩下要做的就是通过大量的训练来不断优化。
所以,AI大模型下一步竞争的焦点就在于谁能真正运营好多模态的能力。
那么又怎样才算多模态呢?
最基础的便是基于多模态衍生出来的八大功能:文生文、文生图、文生表、图生图、图生文、视频理解、文生视频、文本剪视频。
而在多模态能力的运用上,360智脑无疑交出了一份高质量的“答卷”:
比如,360智脑的“文生视频”多模态功能国内首发,任何文字脚本都可生成视频,不受专业技能和素材限制。
这一多模态能力的运用也宣告着,视频内容也迈入AIGC时代!
目前,国内已有百度的CreateLab,但本质上是图文到视频的智能合成,并非“无中生有”;阿里达摩院的“文本生成视频大模型”,则仍在内测中。
国外方面,除了谷歌的Imagen和Meta的做个视频(Make-A-Video)。近日,被誉为视频版Midjourney的Runway,其开发的AI视频编辑工具Gen,也已经从2月份的第一代升级到了第二代,并且从内测转为正式发布。
随着竞争的加剧,AI大模型的竞争分化现象会更加明显,企业实力的不同,强者与强者之间也同样要在AI大模型研发速度和产品质量上分个高低,这个优胜劣汰的过程没有止境。
但有一点十分明确,AI大模型浪潮将卷走弱者,实力更强者也将从中脱颖而出。
除了多模态能力的亮相,在360智脑发布会上还值得称道的是:
360重新定义了数字人概念。
如果说传统的数字人更多是一个数字“躯壳”,是一个2D、3D的生成形象,只是主播的向下平替,只能按照既定的脚本输出内容的话。
那么在像360智脑这种AI大模型支持下生成的“AI数字人”,则在于有记忆、有人设和性格,能够复刻思维方式和人生经历。
我简单介绍几点在现场看到的内容:
1.360AI数字人目前分为名人IP、数字助理两大类,拥有200多个角色,以360智脑为支撑,数字人形象可模仿声音、思维等。
2.现场还演示了诸葛亮、孙悟空、马斯克等AI数字人的对话,得体风趣。
3.AI数字人可上传知识库,自建角色,如周鸿祎数字人,现场演示回答效果较好。
4.未来数字人将具有长期记忆,有自己的目标和规划,可自主分解任务。
5.在彩蛋部分还展示下一版本数字人功能,包括数字人群聊讨论问题、工作组事务处理等,下一代还将以插件版本形式来进行能力的延展。
总结起来,这种“AI数字人”体现了三大特征:更好玩、更好用、可定制。
05 360智脑:八大天然优势
19世纪的生物学家达尔文在《进化论》中有句名言:
“能够生存下来的物种,并不是那些最强壮的,也不是那些最聪明的,而是那些对变化作出快速反应的。”
这句话放在AI大模型领域同样适用。
AI大模型是科技企业的“新造梦场”,也是神仙打架现场,没有技术积淀也没有资金实力的玩家终会被淘汰,并还市场一个更加明朗的格局。
那么哪些玩家最有可能胜出,谁也无法预测。
但在发布会现场看到了360大模型战略,我就意识到最起码是360这样的玩家才有机会上牌桌,跟国内外的其他实力友商们掰掰手腕。
06巨头财经的思考
没有思想包袱,轻装上阵的背水一战
最后我想再把视角拉回到360的发布会来看,这样一场发布会,来了大量的大咖嘉宾,整个发布会现场里里外外坐满了人,至于线上更是成百上千万人关注着这场发布会。
鼎沸的人气背后,是人们站在科技爆发的前夜,对即将到来的新机遇、新曙光的渴望。
可能许多年以后,大多数人才能真正切实地感受到AI大模型给我们每一个人带来的影响。
正如曾经的互联网,定义下一个时代的竞赛已经开始,并且已肉眼可见地“加速”跑起来了。
好在,与国外相比,以360智脑、百度、科大讯飞等国内的AI大模型玩家没有落后太多,甚至在有些方面已经开始尝试弯道超车了。
“真正的勇敢,并非骁勇善战,而是无论何时何地都不忘初心,坚守信仰,并秉持自己始终不会放弃的那份纯粹。”
突然想到周鸿祎新书《超越好奇》中的一句话,我想这句话,对于所有致力于把国内AI大模型带到世界领先水平的企业都是适用的。
刘慈欣在《三体》里写到:生存,从来不是一件理所当然的事情。的确,没有什么东西是理所当然。
衰落的伏笔总是埋在黄金时代,鼎盛的主体会在倾泻的颓势中逐渐式微。但新的时代总是不可避免地来到。
我们所能做的只有忘记昨日的世界,抛却旧时的经验,丢掉思想的包袱,轻装上阵、背水一战。
本文链接:http://www.28at.com/showinfo-40-18-0.html人间诚实周鸿祎:360 All in 大模型的六个解读
声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。