声明:本文来自于微信公众号科技新知(ID:kejixinzhi),作者:王思原,授权站长之家转载发布。
这届WAIC世界人工智能大会上,每家AI企业似乎都找了自己的PMF(产品市场契合点)。
2023年是国产大模型元年,腾讯、字节、百度等众多大模型进入市场,正式开启对外服务,月之暗面、智谱AI等创业公司也形成“五小虎”的格局。迭代发展一年后,大模型选手们都已走向台前,给了AI行业更多的机会和答案。
不同于去年大模型的“重在参与”,今年WAIC的重头戏聚焦在更实际的应用、更颠覆性的技术和更普惠的模型。简单来说,往年 WAIC 上厂商们是大模型性能展示和比拼,如今更聚焦的向行业展示实际的最新落地成果和应用方向,比的是大模型落地能力。
从百度、阿里、腾讯,到商汤、智谱、百川、Minimax,从参数到技术,从多模态到端云协同,从价格到应用落地,各家在大模型的方向上似乎愈加清晰,也愈加务实。
而透过本次WAIC大会,一个对于整个行业都较为清晰的信号则是,虽然技术依旧青涩,焦虑也依然存在,但一个个在产业侧落地的AI应用的确在真实地发生,只是聚光灯之外,这些AI加持下的产品应用也没想象中那么亮眼。
Part.1
AI应用“卷上”舞台
如果说去年的WAIC是企业的狂欢,那么今年的WAIC便是用户的狂欢。
从远离用户的模型层面来看,除了字节、月之暗面、零一万物等主要面对C端市场的企业缺席外,其余中国Tier1与Tier2的大模型团队几乎全部到场展出,包括BAT、智谱AI、面壁智能、百川智能、阶跃星辰等等;但除此之外,会内会外也再无新增的中国大模型公司。而WAIC官方披露的的八大“镇馆之宝”中,模型层成果只占1/4。
而应用层,阿里云、华为云、无问芯穹、壁仞、遂原等中国企业不断展出围绕大模型训练与推理的新成果,AI模型在千行百业的应用也呈现愈加井喷之势。
例如阿里不光展示了智能编码助手“通义灵码”,更是通过“通义十二时辰——体验AI助手陪伴的一天”,全方位通义千问大模型背后的对话、效率、智能体、视觉四大核心能力,让用户感知AI助手在生活、学习和工作中的实际作用。此外,钉钉和支付宝在办公以及生活助手场景下,也是阿里AI能力落地上的重要一面。
腾讯的元宝APP覆盖工作提效、生活娱乐两大场景,除了提供AI搜索、AI总结、AI写作等核心功能,还提供创意绘画、口语陪练、百变AI头像等有趣好玩的特色应用,以及更多用户创建的智能体。
商汤展示了可控人物视频生成大模型Vimi,Vimi基于商汤日日新大模型的强大能力,仅通过一张任意风格的照片就能生成和目标动作一致的人物类视频,并支持多种驱动方式,可通过已有人物视频、动画、声音、文字等多种元素进行驱动。
类似提高效率的落地应用还有许多,从金山办公的WPS AI,到智谱AI的数字人直播平台,再到集体亮相的十八金刚人形机器人等等,涵盖医疗、教育、办公等各个场景,并且这些应用不再是概念性的演示,而是已经深入到了各行各业的核心业务流程之中,成为了提高效率、降低成本、创造价值的关键驱动力。
从技术竞赛到应用落地的全面进化,无论是一线科技巨头BAT(百度、阿里巴巴、腾讯),还是智谱AI、百川智能、阶跃星辰、商汤等二线厂商,都将目光投向了AI的实际应用与商业化成果,而非仅仅局限于模型性能的展示。但繁荣的同时,同质化问题也逐渐显露。
Part.2
路线割裂,产品却一致
一个事实是,AI应用的落地要比预想的更快、更深,范围更广,只是从结果上来看,无论是发展逻辑、路线,以及用户对产品的预期都有一定出入。
先说各家商业模式上的路线,百度的CEO李彦宏这段时间,甚至在WAIC现场都还在反复强调,商业化的闭源模型是最能打的;而隔壁的阿里云则是在力挺开源,至于另一家腾讯,则喊着“通用大模型不是模型应用的唯一方向”。
大厂都做不到路线统一,小厂更是五花八门。智谱AI走B端路线,用户群体却是C端;百川智能将企业应用的MaaS化产品作为重点展品;MiniMax同时坚持To B与To C业务并重的发展策略。
研发方向的不同,也意味着各家都有不同的顾虑。例如腾讯,腾讯在大模型上发布上算是慢了一步,但根据腾讯混元大模型负责人刘煜宏最新透露,腾讯内部有接近700个业务接入混元,包括腾讯会议、文档,微信读书的AI助手等,这也使得过去半年腾讯在大模型上的新产品、新版本发布的频率越来越高,这本质是因为不探索原生AI大模型应用,不知道怎么跟业务更好合作。
不过过去一年无论大家走怎样的路径,一年后给到用户的结果十分相似。最简单的就是,在这次大会之前,无数用户可以说是拉满期待,就想看着国内的大厂们,能不能拿出什么点新鲜玩意儿来让大家开开眼。
但结果其实是有些失望。一句话概况就说,即便不去参展,也基本能猜出每个厂商摆出的主要产品是什么。例如百度的基本围绕文心一言做落地,阿里围绕通义千问,智谱AI围绕智谱大模型,从娱乐社交到办公学习,大模型的主要作用十分明显。
看似高大上的落地应用,本质还是集中在各类对话助手、文生图、文生视频产品。行业发展到今天,这些产品的新鲜感早已褪去,以至于现场有观众参展下来表示,每一家的产品都大差不差。
当然,确实也有一些剑走偏锋的落地思路,但仔细来看也只是特定行业特调的,基本也没什么新意。
如果说去年的WAIC让人感觉AI有盼头,大家疯狂期待大厂商们争奇斗艳能卷出哪些五花八门的产品,结果短短一年,齐刷刷地长成了一个模子刻出来的样子。
不过相比BAT这样的大厂可以用大模型服务内部业务生态,以及用内部生态为AI业务输血,快手、B站、阶跃星辰、Minimax、智谱AI这些设计大模型不久的公司算是第一次登场,他们更焦虑于如何站稳脚跟后茁壮成长。
Part.3
中小厂焦虑尽显
这一波AI落地潮,对于中小厂来说并不算友好。
比如,展台紧靠阿里的阶跃星辰,虽然入场虽晚,但极力想挤入“大模型五小虎”的战队中,在营销上试图把格局改变为“六小强”。
在WAIC上发布了三个大模型,其中包括 Step-2:万亿参数的 MoE 模型,目前还需要申请才能体验;Step-1.5V:千亿参数多模态模型,除了图片理解能力提升外,也支持视频理解;Step-1X:图像生成模型,DiT 架构,600M、2B、8B 三种不同的参数量。
不过一个疑问是,靠这三个模型还有出路吗?去年的百模大战造成了社会资源的巨大浪费,尤其是算力浪费,行业不卷模型,卷应用,已经成了共识,没有落地应用已经很难出圈,甚至很难拿到融资。
快手也是今年WAIC上的新面孔,从快手大模型家族来看,其着力点更具有落地属性,重点是通过大模型打开商业化的空间,以及通过视频生成技术给自身的视频业务注入新生机。
这里值得一提的是快手可灵,在文生视频领域上,号称比肩Sora,但目前试用范围依旧无法完全匹配市场需求,即便是快手内部的人想试用都很困难。并且当下使用的结论,是基于内测视频得出,这也就意味着对于可灵的模型能力可能是高估的。更为关键的是虽然目前国内市场尚无对手,但更多的竞争对手正在赶来的路上。
另外一些像智谱AI这些纯AI创业公司,在巨头环绕的市场环境下,需要迫切找到自身的市场定位。以智谱AI为例,尽管在B端市场有所布局,但用户群体的模糊边界使得其在市场定位上面临困惑。企业必须在产品和服务中融入独特的价值主张,以区别于竞争对手,而这在技术趋同的背景下显得尤为困难。
新兴AI企业大多处于初创或成长阶段,资本运作的不确定性增加了财务压力。一方面,高昂的研发成本和市场开拓费用需要持续的资本注入;另一方面,投资者对回报的期待与企业成长周期的矛盾,使得财务规划变得异常复杂。
而做特展的公司,参加一趟WAIC,成本最少也要几十万。对于这些小企业来说,这些钱花出去要“掷地有声”,要么收获订单,要么打响品牌。对于智谱AI,以及云服务厂商等重视企业服务的公司来说,花几十万“买”最终客户资源,性价比并不高。只是展会之后,如何保障对B端用户的继续跟踪及成交,十分考验企业的售后能力。
构建开放的生态系统,与行业伙伴建立合作关系,对于新兴AI企业至关重要。但如何在短时间内建立起有效的生态链,实现资源共享和价值共创,是摆在这些企业面前的现实难题。
一年前,AI行业还在普及大模型的路上,把大模型的概念传播给普通人。而如今AIGC、大模型起码在行业上已经有了广泛的应用,和不错的商业前景。所谓的千篇一律也可以理解为当下行业的最优解,在这个现实与虚拟交互的临界点,现在的平静或许是为了未来的爆发,毕竟在AI时代,每一天都变得值得期待。