昆仑万维方汉:Sora时代,紧抓SOTA红利

发布时间:2024-11-18 21:38:47 来源: sp20241118

  2024年春节期间,由OpenAI发布的AI视频工具Sora就震撼了世界,其逼真的画面细节,以及远超同类水平的物理理解力、画面连贯性、主体稳定性,使得Sora瞬间引爆了全球。

  首当其冲的是内容行业。

  Sora一经发布,创意软件巨头Adobe股价应声暴跌7.41%,市值瞬间蒸发超百亿美元,创下500天内最大跌幅,网络上处处充斥着“插画师失业”“剪辑师失业”“作者失业”的焦虑气氛。

  可另一方面,海量AI辅助创作的文案、图像、视频却又如雨后春笋般疯狂涌现:三天出版AI绘本、1小时速成AI有声书、一周手搓AI《西游记》……无数人通过AI辅助内容生成挖到了AIGC第一桶金。就在2月26日,CCTV-1正式开播了中国首部文生视频AI动画片——《千秋诗颂》。

  Sora对于内容产业意味着什么?中美的AI差距究竟有多大?AI产业的红利在哪?面对OpenAI,中国AI从业者还有机会吗?

  “AI不仅是一个技术密集型行业,更是一个资金密集型的行业,投入非常大。OpenAI有了五年以上的工程积累,让其他公司在追赶的时候非常吃力,而且它不开源。”昆仑万维董事长兼CEO方汉说。

  “但是,任何先进的技术,想长久保守机密非常困难。技术一定会随着时间推进而加速普及。技术上的门槛和工程上的经验,很快会被抹平。”方汉补充道。

昆仑万维董事长兼CEO方汉

  在这场AI浪潮中,昆仑万维的角色无疑是特殊的。

  与大量“拿着锤子找钉子”、业务难以落地的AI创业公司不同,作为一家业务覆盖全球一百多个国家和地区,全球平均月活跃用户近4亿,手握AGI与AIGC、信息分发、社交娱乐及游戏等大量应用场景的上市公司,昆仑万维有着足够多的“钉子”亟待被解决,也有足够多的数据、用户、资源、以及GPU。

  2023年8月,昆仑万维推出国内第一款AI搜索引擎“天工AI搜索”,奠定了中国AI搜索鼻祖的地位。

  可另一方面,无论是社交、音乐、游戏、还是内容平台,这些昆仑万维赖以生存的主营业务,正是受到AI冲击最大的赛道。

  对于昆仑万维而言,AI不是一场口头的“转型”,而是一场“Go Big or Go Home”的存亡之战。

  一、“当创作门槛降低1倍,内容数量增加10倍”

  “我不认同Sora就是AGI(通用人工智能),Sora跟AGI没关系。但这是文生视频的重要节点,它把这条路跑通了。很快,视频生产的成本将会大幅降低。”方汉说。

  在内容生产行业,有这么一条规律:如果内容制作门槛降低1倍,那么内容创作者的创作数量将会增加10倍。

  这是一条被产业多次验证过的定律。以短视频举例,随着通信技术从3G、4G迈向5G,再配合上手机处理器、摄像头、以及OS、触摸屏等一系列的技术创新,视频拍摄的门槛不断降低,短视频内容行业迎来惊人的爆发。

  “一旦把(视频制作)门槛降下来,全民都在创作视频,UGC内容创作平台上的海量内容就会把PGC平台给淹没”方汉说。

  同样的故事正在AIGC领域悄然上演。

  200元一张的淘宝模特图变成了0.02元的AI生成图片;经过专业调校的AI有声书足以以假乱真;在小红书上买4.9元的AI壁纸,半年涨粉大几万;AI孙燕姿一度成为B站上的“流量密码”……

  甚至就在最近,李一舟《每个人的人工智能课》一年内卖出约25万套、网红艺术家“曾bobi”被指使用AI作画冒充原创等事件,都从侧面证实了AI生成内容的火爆。

  2024年1月5日,昆仑万维发布了公司全新使命——“实现通用人工智能(AGI),让每个人更好地塑造和表达自我。”

图片来源:“天工AI智能助手”APP生成

  这其中,“塑造自我”指的是通过AI实现个性化的终身学习、“表达自我”指的则是通过AI把人类创作门槛降得足够低,让人们更充分地实现自我表达。

  “此前做视频的成本太高了。Sora出现之后,所有传统视频工作流上的人都会受到比较大的冲击。而且对内容行业的冲击最大,包括短视频、广告、影视等等。”方汉判断道。

  随着AI的发展,内容行业将首先重塑、随即UGC的内容生产量迎来大爆发、而且会有AI时代的新型创作平台涌现。

  “AI时代的终极应用一定是免费的To C内容创作平台。谁能最先跑通这个商业模式,谁就是下一个Tiktok。”方汉说。

  二、“SOTA红利”有多大?

  一个困扰国内外几乎所有AI创业者的问题是,OpenAI似乎没有“边界”。

  一直以来,OpenAI在AI文本领域始终“遥遥领先”。ChatGPT与GPT-4的推出让OpenAI在文本领域始终保持着SOTA地位,无人可出其右(SOTA,State of the art,常用于表示特定机器学习领域表现最好的模型或方法)。

  在AI图像领域却不尽然。此前,Midjourney一直是OpenAI的有力竞争对手,谷歌Gemini更是直逼GPT-4V的领先地位。

  这一直被外界认为是OpenAI的“边界”所在,也是各大创业公司的机会所在。

  然而,Sora的推出让OpenAI绕过图像,一举夺下了AI视频的SOTA“圣杯”,再次向资本与看客强调了自身垄断性的领先地位,并通过“7万亿美元筹资AI芯片”计划赚足了人们的注意力。

  SOTA带来的不仅是资源,还有对顶尖AI人才的吸引。

  “OpenAI现在能招到硅谷最好的人。所有人都要先去试一把,然后再考虑其他公司。”方汉感叹地说。

  方汉将这种在人才与资源上的垄断性地位概括为“SOTA红利期”。

  SOTA红利期,指的是在核心技术或细分领域达到SOTA地位,从而能以近乎“收割”的姿态吃到最大的市场红利。

  所有巨头都有过SOTA红利期,曾经最好的人才在微软、之后在谷歌、后来在Mata……如今在OpenAI。

  没有人能永远SOTA,但永远有人成为SOTA。

  当前,OpenAI凭借着在基础模型的突破性跃迁,吃下了全球最大的AI红利。

  在昂贵的“烧钱运营”与密集的融资需求之间,OpenAI在短期内不能出现任何掉队的迹象,必须在几乎所有基础模型领域保持SOTA,才能坐稳“神坛”。

  不过,OpenAI并非无所不能,人类历史上也没有任何一家企业能够永远保持高速发展。当前,在语音、图片、具身智能、小样本模型等算法领域,以及AI音乐、漫画、社交、自动驾驶等应用领域,还存在着大量空白生态位,等待着不同企业收获“垂类SOTA红利”。

  大SOTA有大红利,垂类SOTA也有垂类红利。在尚未被超越的这段时间,SOTA企业必须像OpenAI一样,紧紧抓住红利窗口。

  当前,昆仑万维已经构建了AI大模型、AI搜索、AI音乐、AI Story、AI游戏几大业务矩阵:是国内模型技术与工程能力最强、布局最全面的人工智能大模型企业之一。

  “作为一家中等体量的科技公司,我们入局大模型早,目前基座模型能够做到全国前五。但是,在AI音乐、AI漫画技术领域,我们一直是国内的SOTA。”方汉说。

  当前,昆仑万维面向国内市场推出了“天工AI智能助手”APP,面向海外市场则手握AI漫画、AI音乐、AI游戏Club Koala等多款面向C端用户的AI产品。

  虽然公司极少在国内宣传海外业务,但其在海外已经取得了不俗的成绩。2023年前三季度,昆仑万维海外业务收入占比84%,业务已覆盖全球100多个国家和地区,全球平均月活跃用户近4亿人。

昆仑万维自研AI游戏Club Koala

  昆仑万维旗下的AI游戏Club Koala是一款加入了UGC体系的派对游戏,玩家可以在其中自由设计游戏地图、关卡、虚拟形象。最吸引人的是,玩家可以在游戏中与拥有“自我意识与记忆”的AI NPC角色互动。这些AI NPC通过Atom系统控制行为,各自拥有不同的性格、愿望、回忆。该款游戏将在今年3月面向海外市场推出Beta测试版本。在海外,昆仑万维依托旗下信息分发及元宇宙业务Opera原生浏览器AI助手Aria,推出了一系列前沿AI功能,帮助海外用户提高效率并释放创造力。Aria已在包括欧盟在内的180多个国家和地区上线,用户突破百万大关。

  三、All in AGI与AIGC

  在过去的一年里,昆仑万维的AI业务用“紧锣密鼓、如火如荼”来形容已经不足够了。

  2023年4月,昆仑万维推出自研千亿级天工大模型;8月,昆仑万维推出国内第一款AI搜索引擎——天工AI搜索,成为国内AI搜索鼻祖;10月,开源天工Skywork-13B系列大模型;12月,发布AI Agent开发平台天工SkyAgents;2024年2月,发布新版MoE大模型“天工2.0”。

  在此期间,昆仑万维的算法与产品都以周为单位飞速迭代,AI团队的规模迅速扩张到近千人规模,办公楼里人满为患,大半数会议室都被改成了工位,产研团队的楼层时常半夜里仍灯火通明,“每天都有新人入职”。

  这种强烈的紧迫感一方面源自大模型技术的日新月异,另一方面也源自对行业的判断。

  “2024年,大模型的窗口期就会关闭。如果做不到,就会出局。2025年行业格局会变得非常清楚。最大的变量就在2024年。”——在一次公司内部分享会中,昆仑万维创始人周亚辉曾经这样说过。

  当前,基础模型赛道越来越“卷”,准入门槛也越来越高。正如前文所言,AI是一个资金密集型的行业,企业的前期投入非常大。当前,亿元投资、千卡储备,都只能勉强摸到基础模型的门边。在这个算力比黄金还要昂贵的时代,没有提前入局的企业,在GPU全球紧缺的大背景下,拿着钱都买不到卡。

  昆仑万维是属于最早入局的那一批。

  在23年Q3财报中,昆仑万维透露,截至季度末,公司此前采购及租赁芯片已到货约6000张,另外还有约3000张芯片待交付;同时,公司已投资了AI算力芯片公司北京艾捷科芯,完成“算力基础设施—大模型算法—AI应用”全产业链布局。

  除了产品团队、研发团队、算力储备的不断扩张外,2023年期间,昆仑万维武汉建立起了一个庞大的数据团队;并力邀AI知名学者颜水成教授加入,创建了总部位于新加坡的2050全球研究院。

  对于昆仑万维而言,“All in AGI与AIGC”,做基于大模型的UGC平台,这是一场必须打赢的战役。

  四、“后GPT时代”

  从Transformer、到Stable Diffusion、到RAG与MoE;从ChatGPT、到LLaMa、到Midjourney与Sora。在人类历史上,科技从未像今天这样,以一种令人眼花缭乱的速度刷新着个人认知,颠覆着每个行业。

  最近在硅谷,一个称呼悄然流行——“后GPT时代(Post-GPT World)”。

  后GPT时代,代表着人类对AI技术的探索、审视与反思;代表着人机关系底层逻辑的颠覆与重塑;也代表着新一代生产力的崛起。

  也许,它还将代表着文明与冲突的范式发生改变。

  在风靡全球的科幻作品《星际迷航》中,作者构建了这样一个世界,在遥远的未来,爱好和平的人类同众多外星种族一同战胜疾病、种族差异、贫穷、偏执与战争。跨越种族的生物通过万能翻译器相互交流与理解,人们携手探索宇宙,再弱小的文明也能够守护住自己的语言、文化与信仰。

  “AIGC内容算法跑通、内容创作门槛降低之后,小众文化可能会更容易守住自己的信仰。”方汉说:“以前小语种是很难有自己文化传承的,因为创作者的人数少导致内容产能不够,慢慢就会被遗忘。但是AIGC内容创作工具出现之后,内容生产力迎来质的改变,少量创作者也可以用自己的语言、自己的文化去创造大量内容。我想看制作精良的电影大片,不会只能看英文的,我可以选择我自己文化的内容。”(中国网)

【编辑:邵婉云】