
在“百模大战”主席卷硬科技之后,基于不同场景的应用成为大模型竞争的又一发力点,这一次,拥有庞大用户基数的头部手机厂商也扣动了扳机。
今年8月起,华为、小米、vivo、OPPO、荣耀均公开了该机型的相关信息,并表示新一代旗舰手机将率先接入模组。
据《深网》统计,华米OV的语音助手将具备端侧大模型能力,语音助手在不联网情况下也具有语言理解、图片生成等功能。
在大模型备案审核通过后,各家的语音助手也将拥有类似ChatGPT的深度对话、编程等能力。
与文心一言等以App形式存在的大模型不同,接入端侧大模型的手机语音助手交互形式更多,例如vivo的蓝心小V不仅可以语音生成图片,还可以直接转发至朋友圈。
当然,自研大模型是个“无限烧钱”的竞争,创业行动将达到吨起。创业大模型需要雄厚的资金储备做后盾,以大模型驱动手机软、硬件的一次每一次进化背后都是“钞票”能力”。
但无可否认,在智能手机出货量接下来的行业压力下,大模型或许会成为手机行业突破自身创新困境和模式持续受限的一个挑战。

把大模型装进手机的两个路径
手机厂商部署大模型主要有两种路径,一是做轻定制和本地部署的手机端侧大模型;二是采用云、端良好的架构设计,即在云端部署百亿、千亿级别的大模型训练模型,在手机端部署十亿级别的大模型,推出大模型矩阵。
主攻手机侧大模型的手机厂商以小米和荣耀为主。
今年4月,小米团队组建了AI大模型,并训练出了13亿和60亿参数规模的大模型。“小米大模型技术的主力突破方向为轻量化、本地化部署,小米考虑的重点是在手机上实现端侧跑通,让每个人都能更好地在手机上使用大模型。”小米董事长雷军在年度演讲上透露。
目前,小米手机智能语音助理小爱同学已经升级了大模型版本,并开启了邀请测试。
与小米相比,荣耀自研大厂主要搭载了骁龙8Gen3这款快车。
2023年10月25日,高通发布新一代移动处理平台骁龙8 Gen3。与上一代产品骁龙8Gen2相比,龙8 Gen3不仅GPU、NPU性能大幅提升,更重要的是,它可以在终端侧向运行100亿参数的模型。
荣耀CEO赵明在高通骁龙峰会上透露,荣耀自研的端侧大模型参数规模达到70亿。“荣耀通过自研70亿参数的端侧大模型可以很好地划分个人隐私与人类知识库房的边界,让用户隐私得到更好的保护,这也是荣耀未来重点的创新方向,荣耀Magic6将接入自研大模型。”
与小米、荣耀主攻端侧大模型不同,华为、vivo、OPPO自研大模型采用“云、端和谐”路径,其推出的大模型矩阵覆盖十亿、百亿、千亿多个参数量级。
与ChatGPT等通用人工智能大模型不同,华为的盘古大模型是一个面向垂直行业的大模型系列,目前已经迭代到3.0版本。据公开数据显示,盘古3.0可以为客户提供100亿参数、380亿参数、710亿参数和1000亿参数的系列化基础大模型。
在手机层面,华为P60和Mate60系列手机的小艺智慧助手已经接入盘古大模型,并开启了公测。
同样采用大模型矩阵的,还有vivo自研的蓝心大模型(BlueLM)和OPPO自主训练的安第斯大模型(AndesGPT)。其中,蓝心大模型覆盖10亿、70亿、700亿、1300亿、1750亿模型参数5个版本;安第斯大模型包含十亿至千亿以上多种不同参数规模的模型规格。

图为蓝心大模型矩阵

图为安第斯大模型(AndesGPT)架构
对于为何要推出大模型矩阵的原因,vivo副总裁、AI全球研究院周边在接受采访时透露,“主要受大模型形态、用户需求及算力成本的影响”。一个是矩阵模式解决方案可以多模态大模型不同研发阶段的需求;二是可以让用户在云上使用大模型的同时在端侧本地化运行关键数据,满足隐私及安全需求;三是可以有效平衡云端力算成本过高的问题。
无法停止的烧钱游戏
虽然大模型的训练、推理和逻辑能力受模型框架、数据质量、训练方法等锁定因素的影响,但现有大模型的智能水平主要取决于算力投入程度。
公认的一种说法是,完备的AI模型的算力是1万枚英伟达A100芯片。
有行业人士给《深网》开了一笔帐,搭建算一个力资源的成本就在几十亿元。“阿联酋一台计算服务器的成本大约在5万块钱左右,现在算满配的GPU服务器价格在100万-200万元之间,一个算力集群一般要配备500台服务器。”
购买AI芯片只是手机厂商自研大模型训练的成本。由于大模型一次训练的成本极高(例如GPT4次训练成本就要6300万美元),所以在模型训练之前,手机厂商需要对原始数据进行错了、价值观把控等,数据清洗也是一笔不小的开支。
“现在每天应用一次云端大模型的成本大概在1.2-1.5分左右,vivo国内3亿用户用十次,一年算下来也有百亿左右的支出。”vivo副总裁对此表示。
周边表示,数据和算力成本仅占自研大模型投入的一半,人员成本占了一半。自2017年组建AI全球研究院至今,vivo每年在人工智能上的投入产出估计在20到30吨。
算力、数据、人员成本只是vivo等头部手机厂商部署云端大模型的必要成本之一。与百度、阿里巴巴等互联网公司主要在云端部署大模型不同,头部手机厂商自研大模型的必要成本之一。最终目的是服务用户,让手机拥有大模型能力。
但在手机端侧运行大模型受手机存储空间、耗电等一系列技术的影响,参数量较大,大模型在手机端越跑难以通。
“10亿模型要占用手机1GB内存,70亿占有4GB,130亿占用7GB,所以我们优先考虑慢慢10亿模型好好做起来,再把其他功能做起来。”vivo AI解决方案中心总监谢伟钦对《深网》解释道。
大参数要占用大量的存储空间,这意味着要在手机上运行通大模型就要同步升级内存、SoC芯片等硬件,这对手机厂商来说又是一笔不菲的投入。
手机行业急需创新性的创新
在ChatGPT开启人工智能之前的很长一段时间里,手机行业的创新集中在通讯、摄影、屏幕大小和形态等老生常谈的领域。
在消费电子寒冬下,手机厂商“挤牙膏式”的改变很难激发用户的购买欲望,换机周期从2021年的28个月延长到现在的43个月。而大模型的护理智能能力恰逢巧合手机行业看到了颠覆性创新的可能性。
“大模型是创新性的技术范式转变,和蒸汽机、电力及计算机一样,对人类进步具有里程碑的意义。”多位手机品牌的创始人都曾在公司内部如此给大模型定调。
一加创始人、OPPO首席产品官刘作虎表示,AIGC将为移动生活的体验带来革命性的变化,未来的手机将成为用户的超级助手。
“我们在2017年部署大模型时,沉巍(vivo创始人)就要求我们投入高技术,以抓住这个百年难遇的趋势。”周围清楚。
在vivo、OPPO等手机厂商的预期里,接入大模型的手机将会打造成全新的智能体,成为用户的专属私人助理。
曾有行业人士对《深网》表示,“100亿-150亿参数级别的模型可以覆盖全部生成式AI的例子。如果终端可以支持这个参数级别,那么攻击可全部在终端上进行,崛起于云端处理困境,届时手机会成为真正的个人助手。”
华为、vivo、OPPO自研模型的最高参数级别已经达到千亿级别,但目前在端侧可以实现语言理解、文本创作、图片生成等简单的操作,涉及到订票、APP交互、设备控制等操作还是要调动云端大模型能力。
眼下,头部手机厂商处于大模型的探索还处于起步阶段。后续,随着模型迭代、创新应用和产品的推出,以大模型为竞争原点的时代正式开启。