强强联合背后,国产大模型迎来“WIntel时刻”?
【摘要】随着更多产业生态的建立和完善,国产AI大模型或将迎来属于自己的“Wintel时刻”,届时作为核心企业的科大讯飞,也将受益于整个产业的进步构建起更强大的生态壁垒。
在ChatGPT持续引爆行业通用大模型之后,国内诸多互联网巨头、AI企业,也都选择纷纷跟进,参与到国产通用大模型的角力之中。值得注意的是,与上半年“热闹非凡”的行业境遇不同,具备实力且具备满腔“产业抱负”的巨头玩家,正在为大模型的大规模落地创造机会。
其中,以科大讯飞为代表的科技公司,正在积极与包括华为等在内的国内合作伙伴一起通力合作,为构建人工智能时代的中国“Wintel联盟”做准备。而随着越来越多的实力型玩家大踏步入场,“大模型+”的应用拐点正在加速到来。
大模型迈入产业“落地”加速期
从国内大模型的发展状况来看,随着各路技术企业的纷纷参与,无论是通用大模型还是垂直行业大模型,国内企业均有涉足。一波接一波的行业浪潮席卷而来,正在推动整个“大模型+”应用时代的来临。
首先,大模型不再局限于聊天、答题、内容生产等C端应用,而是转向更偏重实体领域的B端应用,以“实用”为导向的大模型日渐成为行业趋势。
在上半年的持续“爆火”之后,进入下半年大模型的风向明显变了。市面上越来越多的“面向B端”的应用开始出现,这种“实用主义”的风向,大大加速了生成式AI产业化的进程。从上半年以来,陆续有京东、携程、网易有道、用友等不同领域的巨头,发布相关的行业大模型应用,包括腾讯、华为等在内的巨头,也将“实用”作为大模型应用的重点,推动大模型渗入产业实体之中。
其次,具备通用能力的大型企业,正在加强与各行业大模型企业的合作,新的大模型生产机制正在成型。
目前来说,业内通用的做法是,通过开放自身的大模型能力,为行业大模型开发提供必要条件。比如,讯飞星火大模型采用了“1+N”的整体布局,即借助讯飞星火大模型平台的7大通用能力,将其文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等赋能给其他行业场景,形成在教育、医疗、汽车、法律等诸多领域的行业大模型应用的生产机制。依托这种生产机制,各行业的大模型厂商,都不再需要“重复造轮子”,只需要专注应用开发,即可推动行业的大模型场景落地,这些条件的具备,为大规模的大模型场景落地奠定了很好的基础。
“实用”大模型并非一蹴而就
如前文所述,随着国内大模型逐步深入产业,以及通用大模型厂商逐步对外开放自身能力,“实用”大模型的难度已经大大降低,但这并不意味着做“实用”大模型可以一蹴而就,甚至可以说与之恰恰相反。
其一,“实用”的大模型,通常需要企业具备很深厚的行业经验和专业数据积累,以确保数据的精准性和专业性,而这通常需要大模型企业对行业有很深的了解。就拿本次1024开发者节上科大讯飞发布的智能编程助手iFlyCode2.0来说,其自发布以来就持续升级,目前已成为行业重要的提效工具(内测数据,在编程的设计阶段提效50%、编码阶段提效37%、测试阶段提效44%)。然而,这样的能力很多企业并不具备,就如同射箭比赛,它们可能还不具备“画靶子”的能力。
以教育行业为例,大模型中关于“小学生英语学习”的版块,首先需要了解小学英语的学习目标,还要定义小学生英语学习的范围,不能超纲(比如词汇量范围、语句类型、语句长度等等),并要找到适合孩子学习习惯和学习阶段的方法——这些标准,都要先定义,这就是“画靶子的能力”。相比之下,从2004年至今,科大讯飞已经在智慧教育领域深耕19年了,多年来其深度参与了中国的教育信息化整个进程,从中小学到高等教育,从教学过程到教学结果诸多场景,系统积累了诸多从0到1的关键性技术,这使其积累了其他厂商难以企及的专业经验和专业数据,而这正是其他厂商短时间难以企及的。
在本次发布会上,搭载了星火大模型V3.0 讯飞AI学习机再度升级,首次发布启发互动式英语AI答疑辅学功能,实现个性化解决、启发引导式提问、互动探究式学习。同时,基于讯飞星火打造的AI心理伙伴正式发布,它具备多模态情感识别、共情表达、寻因式提问、个性化心理指导四大核心能力,全方位呵护孩子的心理健康。
实际上,科大讯飞在细分行业领域积累的经验不仅限于教育,包括医疗、智慧城市、金融、法律、工业等诸多领域,科大讯飞也均有丰富的经验,而这正是其可以面向诸多垂直行业推出“大模型+”的底气所在。比如,在此次科大讯飞1024开发者节上,科大讯飞推出了医疗大模型和讯飞晓医APP,为每个家庭提供健康助手,正是基于科大讯飞在智慧医疗行业的多年积累,科大讯飞的智医助理在2017年就以456分(合格线360分)通过了国家临床执业医师资格考试,目前已覆盖426个覆盖区县,累计辅助诊断次数6.9亿次。
此外,为了进一步加速大模型行业落地,科大讯飞联合行业龙头共同发布12个行业大模型,包含金融、汽车、运营商、工业、住建、物业、法律等行业,加速产业升级。
其二,行业大模型本身的门槛,使得它对大模型企业提出了很高的战略要求。从大模型技术密集、资金密集、技术迭代快的特点来看,任何不具备超强研发实力的企业,都很难经得起市场的考验。但从国内人工智能行业发展现状来看,目前我国“人工智能+行业”的投入最多不过10来年时间,专业的人工智能人才成长起来,则至少需要5年以上的技术和行业经验,但当下很多行业内的人员,远远达不到这一水平。而作为国内最早做人工智能的科技企业,讯飞在该领域深耕已经25年了,人才基础好、团队信任度高,高中腰部人才梯队完备,这使其具备很强的研发实力,因而在大模型上它更够实现有效转化,对市场风向的预测也更加精准,更容易推陈出新、加速技术迭代。
其三,大模型本身的复杂性,使得大模型的落地并不能仅仅依靠一家企业的能力,而是需要有号召力的科技巨头来发挥牵引作用,推动整个产业生态的完善和壮大。作为一家有影响力的技术巨头,科大讯飞具备强大的产业协作能力,这是其能够实现技术成果“井喷”的重要因素。
比如,在本次科大讯飞1024开发者节上,其不仅展示了为数众多的各种大模型产品,还展示了庞大的产业生态,这里汇集了几十种展品,更有搭载星火认知大模型的开放平台,联合550多万开发者,共同打造技术、场景、服务多元赋能的共创共荣的AI生态。也正是基于以上诸多优势,科大讯飞才能够在推动大模型落地行业方面先人一步。
抢占算力制高点已成破局关键
从行业来看,大模型的复杂性要求厂商必须做到“十项全能”,算力、算法、数据、资金、人才,团队都必须足够优秀,缺一个都不行,可见AI大模型本质上是一场赢家通吃的游戏。而在诸多因素之中,抢占高性能算力,已经成为当下国产厂商突破技术瓶颈的核心关键。
一方面,是中国AI算力需求呈现出高速增长的态势。另一方面,随着国内大模型的蓬勃发展,支撑AI核心算力的高性能算力面临短缺,算力吃紧的局面日益凸显。硬件层面,由于国内高端GPU芯片的缺乏,使得国外发布的高性能算力芯片一经发布就遭到了哄抢,产品价格也水涨船高,还时刻面临“缺货”的风险。软件层面,AI时代大量使用的张量计算也跟传统计算机时代的方式不同,AI算力需求的迅速增长,要求国产大模型厂商不仅要注重算力芯片的硬件建设,还需要注重基础软件的创新。也就是说,想要做好大模型训练,不仅要做到硬件层面的更新换代,还需要软件层面的持续创新。
目前来看,想要发展大模型要么发力自研,要么高价购买外国芯片承担风险,而科大讯飞选择了第三条路,与华为展开合作,共同致力于国产AI大模型的自主创新。作为当前国产自主算力的代表作之一,华为昇腾平台凭借华为自研的达芬奇架构技术,实现了业界最佳性能与能效,支持云边端全栈全场景应用。目前华为昇腾的AI集群已经全面升级,已经从最初的4000卡集群扩展到16000卡集群,是业界首个万卡集群,拥有更快的训练速度和30天以上的稳定训练周期。
早在今年7月份,就有报道介绍,在充分利用昇腾这样的国产化算力平台基础上,讯飞搭建了自研的火石平台。该平台突破了大模型数据的系数化,低精度的量化以及高效适配等问题,加速了AI大模型的落地。同时讯飞星火也实现了训练和数据闭环的全流程设计,大模型训练和推理的一体化设计等等创新工作。在10月24日的开发者节上,科大讯飞更是宣布将联合昇腾AI打造算力底座“飞星一号”,进一步将双方的合作提升到一个新的高度。
自主算力和自研平台的结合,对于国产大模型来说有着深远的意义。
据预计,借助双方不断升级的算力基础设施,科大讯飞将参与到更大规模的参数训练之中去,为赶上乃至超越GPT-4奠定基础。同时,借助高效、稳定、安全可控的国产算力基础设施,更多普惠行业的国产AI应用成果或将迎来“大爆发”。比如,在本次开发者节上,科大讯飞就展示了包含金融、汽车、运营商、工业、住建、物业、法律等诸多行业大模型,这些技术成果的集中涌现,充分说明了底层原生技术的重要性。
国产AI大模型“Wintel时刻”已至
从业内来看,目前业界对于大模型落地的探索,已经初步分化出了不同的路线。具体可分为三种类型:第一种是按照使用量收费模式,就是通过AI公司研发大模型并对外提供应用产品或API;第二种是谷歌模式,即从底层TPU芯片,到云基础设施再到大模型产品全部自研;第三种则是“OpenAI+微软”模式,双方各自发挥自身的优势相互配合,共同助力大模型产业的发展,有点类似PC时代的“Wintel联盟”,这和科大讯飞与华为的合作有异曲同工之妙。
作为个人计算机历史上的一大里程碑,Wintel联盟无疑是史上最成功的产业联盟之一,其成功之处在于,通过将微软Windows操作系统和英特尔硬件融合,使之达到了三个方面的效果:第一,软硬件的兼容性,极大地降低了产业成本提高了行业效率;第二,微软的软件和英特尔的硬件相互配合、优势互补,各自将自身优势发挥到最大;第三,软硬件相互推动,加速产业迭代和创新。比如,微软软件的创新,会推动英特尔加速硬件的性能提升;而英特尔硬件性能的提升,也会加速微软软件的迭代,由此形成不断强化的产业飞轮,同时成就了微软和英特尔两大PC霸主。
如今,同样的事情也在人工智能领域开始上演了。比如,全球云巨头亚马逊就与HuggingFace等开源新势力展开了合作,大数据巨头Databricks豪掷13亿美元收购大模型初创公司MosaicML,微软和OpenAI的合作等都是这一思路的延伸。
而从目前国内大模型企业的发展情况来看,围绕做产业生态的思路,已经有越来越多的产业联盟开始在大模型领域渐次铺开,科大讯飞与华为的牵手,无疑是一个很好的行业示范。作为整个产业链、生态链中的核心企业,它们的牵手可以起到“牵一发而动全身”的作用,带动整个产业生态迅速完善起来,从而为更高质量的大模型发展铺平道路。
科大讯飞董事长刘庆峰在1024开发者节的主论坛演讲中说,2014年上半年,讯飞星火将对标ChatGPT4:“这绝不仅仅是一个简单的技术对标问题,我们要走出自己的技术路线,走出自己的产业方向,形成自己完整的生态。从这个角度来说,大模型时代的序幕才刚刚拉开!”
相信随着更多产业生态的建立和完善,国产AI大模型或将迎来属于自己的“Wintel时刻”,届时作为核心企业的科大讯飞,也将受益于整个产业的进步构建起更强大的生态壁垒。