撰文:李信马
(资料图)
图源:WAIC
为期3天的世界人工智能大会(WAIC)落下了帷幕,据官方统计,截止到7月8日下午3点,大会的专业观众到场总人次达到17.7万,全网曝光量达到64.1亿次,项目投资总额达到288亿元。
相比去年,今年的WAIC到场人数大幅增长(去年线下仅有3 万人参会),这其中也有场地增加的原因,今年WAIC在上海世博中心和世博展览馆之外,还新设了徐汇、张江、闵行以及上海世博酒店等分会场,有超过400家企业参展,几乎是去年参展企业数量的两倍。
而在生成式AI的热度持续近半年后,观众们的热情也被彻底引燃,会场外,排着长达百米的队伍,会场内,也是摩肩接踵。甚至连会场周边的咖啡馆,都挤满了聊天的参会者。
如果找一个词来概括这届WAIC大会,那一定是“大模型”,本届WAIC的主题就是“智联世界 生成未来”。
走在大会的展区中,每个人都能明显感受到,人工智能发展趋势的变化。比如上一届,WAIC的主题是“智联世界 元生无界”,但是当时的热点趋势“元宇宙”,在本届WAIC上,风头已经完全被大模型抢走;另一个稍显落寞的趋势就是“自动驾驶”,2021年的WAIC上,图森未来、嬴彻科技和小马智行来三家自动驾驶企业,曾在H1馆相邻的展区上,各自摆上自家的大型卡车,而在今年的H1馆中,三家中却只剩下图森未来了,和自动驾驶相关的演讲和论坛,也基本转移到了张江分会场;至于机器视觉,早在2021年,被称为“AI四小龙”的商汤、旷视、依图和云从,就只有商汤还在参会。
相对来说还坚挺的是“机器人”,开幕式上,受邀演讲的马斯克大谈特斯拉机器人的进展,会场中特斯拉展位上的机器人,也受到了观众的欢迎,参展企业中,带着人型机器人、机器狗、清洁机器人、物流机器人来参会的也不在少数。
图片来源:WAIC
除了参展企业的变化,企业所努力展示的内容,也都在明显向大模型靠拢。比如机器视觉起家的商汤,本次大会上最重要的发布,是宣布“日日新”大模型全面升级;在多个人工智能领域都有所建树的百度,在其参会的全体论坛和五个分论坛中,五个与大模型内容强相关,只有最后一个是智能驾驶分论坛;专注于AI决策领域的第四范式,也在WAIC上带来了他们的“式说”大模型,并首次公开展示。
此外,本次WAIC还出现了为数不少的芯片和算力展区,比如华为云、燧原科技、还有百度的昆仑芯,同样是和大模型紧密相连。
据统计,本届WAIC,企业带来的大模型总数已经超过了30个,不久前发布的《中国人工智能大模型地图研究报告》曾统计中国参数在 10 亿规模以上的大模型已发布了 79 个,以这个速度推测,破百就在不久后。
如此多的大模型同台竞技,很难不让人产生“乱花渐欲迷人眼”的感觉,而且参展企业,也是不约而同地展示了与AI聊天对话或是“文生图”这些大模型基操,不禁让人觉得有些审美疲劳,久违地回忆起了曾经中国互联网的“野蛮生长”。考虑到目前还没有规模化应用的大模型,眼下的情形,就像是几十个车厂都推出了概念车,却没有一个能量产的。
在7月7日,中国信通院发布了《2023大模型和AIGC产业图谱》,将大模型和AIGC产业链上下游进行了梳理,分成了行业应用、产品服务、模型与工具和基础层四个主要部分。
图片来源:中国信通院
而具体到大模型(算法模型),则分成了两大类:通用大模型和垂类大模型。简单来理解,通用大模型是具有大规模参数体量的大模型,是基础设施,但不解决行业具体问题;而垂类大模型是在开源大模型的基础上,针对垂直行业进行大模型建设和应用。
图片来源:中国信通院
但即使在同一大类中,大模型也是有各自的路线和特点。本届WAIC评选出了9大“镇馆之宝”,唯一入选的大模型就是百度的文心一言。作为国产大模型的领头羊,目前文心大模型已经升级到3.5版本,百度首席技术官王海峰表示,相比之前模型的效果提升了50%,训练速度提升2倍,推理速度提升30倍,未来还将发布更多的百度官方和第三方插件,同时逐步开放插件生态。
有趣的是,百度还特意将总部的专利墙在展台复制了一面,仿佛在宣示“我的技术最强”,考虑到百度已经连续五年AI专利申请和授予量全国第一,似乎也没什么不对。
同样受到热捧的还有阿里云的通义千问,会上,阿里云发布了AI绘画创作大模型通义万相,并开启定向邀测。不过,更多被提到的是MaaS(Model as a Service,模型即服务)理念,在开发者生态层,阿里发起的大模型开源社区——魔搭,目前集聚了180多万AI开发者和900多个优质AI模型。这个社区,就像一个开源的大模型集市,据阿里云称,目前模型贡献者基本覆盖国内大模型赛道核心玩家,如百川智能、哔哩哔哩、IDEA研究院、兰丁股份、澜舟科技等,贡献了30多个10亿以上参数规模大模型。用阿里云CTO周靖人的话来说:“把促进中国大模型生态的繁荣作为首要目标。”
图片来源:阿里云
大模型领域的另一个重要玩家——华为云,在发布盘古大模型3.0的同时,仿佛群嘲一般喊出了“盘古大模型不作诗、只做事”。而且与其他大模型不同,盘古大模型3.0包括“5+N+X”三层架构,L0层包括自然语言、视觉、多模态、预测、科学计算五个基础大模型;L1层是N个行业大模型,既可以提供使用行业公开数据训练的行业通用大模型,也可以基于行业客户的自有数据训练专有大模型;L2层则提供了更多细化场景的模型,比如政务热线、网点助手、先导药物筛选、传送带异物检测等。
不难发现,盘古大模型既包涵通用大模型,也包含垂类大模型,甚至中小模型也囊括在内。而另一重要发布——昇腾AI云服务,单集群提供2000P Flops算力,明显是想做大模型的“卖水人”。华为可能不想写诗,但大模型ToB(企业级服务)的钱,却很想赚到。
同样作为国内顶级的互联网公司,腾讯的大模型却被划分到了垂类大模型中,似乎有点“不思进取”。不过,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生在演讲中明确表示,对企业来说,基于行业大模型,构建自己的专属模型,是更优的选项。
“通用大模型可以在100个场景中,解决70%-80%的问题,但未必能100%满足企业某个场景的需求。”汤道生说。和阿里云类似,腾讯云最近也公布了MaaS服务全景图,推出了基于腾讯云TI平台的行业大模型精选商店,提供10大行业,50多个解决方案,还有行业大模型精调解决方案。
比起聊天、作图等应用,ToB的钱显然更吸引大模型厂商。虽然技术还在不断迭代中,但厂商已经做好了行业化和商业化的准备。这一机会,即使体量较小的厂商也不肯放过,只是大厂有实力做通用大模型,乃至像华为一样上下游通吃,而有的厂商更倾向于直接做垂类的行业大模型。比如第四范式的“式说”,同样是定位为ToB领域的多模态大模型,在零售门店管理、房产中介、等细分场景已经有了初步的落地。
不过,目前还有两个问题在限制大模型的发展,其一是成本,即使是行业或专属大模型,也需要至少千万以往的预算,大模型距离普及还有较远的距离。其次,对大模型安全性的担忧,正如清华大学人工智能研究院名誉院长、中国科学院院士张钹在WAIC论坛上时表示的,现在的人工智能技术是不安全的,不可靠的,也是不可信的。
如何保证大模型安全、好用,成本还低廉,这是近百个大模型未来真正需要解决的问题。希望明年的WAIC上,我们能看到大模型发展的答案,而不是变成又一个“黯淡的旧趋势”。