阿里云,在大型模型的时代中,致力于将云计算技术进行到底。
大模型与云计算正成为新时代的探索者和领跑者。自ChatGPT引起轰动后数月,微软Azure与OpenAI的示范效应已传播至全球。许多能够开发大型模型的厂商都跃跃欲试,云厂商成为一股重要的力量。云计算技术天然适合大规模的AI任务,同时云厂商具备人才、资源等优势,能很好地匹配大模型这类技术密集型工作。
如同淘金热初期总是混乱无序,竞争迅速变得激烈。成功的淘金者总是少数,这与当前的大模型产业非常相似。云厂商同时扮演着淘金者和卖铲人的角色,如何平衡这两者的关系,考验着云厂商的战略意识。
在2023年的云栖大会上,阿里云CTO周靖人表示:“面向智能时代,阿里云将通过从底层算力到AI平台再到模型服务的全栈技术创新,升级云计算体系,打造一朵AI时代最开放的云。”在现场,他发布了具有千亿级参数的通义千问2.0,但更多的时间则用于公布云计算基础能力的进展,包括AI基础设施的全面升级、模型应用开发平台阿里云百炼以及更加自动化的云等。他宣布阿里云已初步建成AI时代全栈的云计算体系。
阿里云传达出了清晰的战略定位,最终将重点放在云服务上,而不是大模型。阿里云要做的是卖铲人,为千万淘金者提供服务。
首先,我们需要探讨云优先还是大模型优先的问题。观察国内外云厂商的布局,虽然看似所有云厂商都涉及到了大模型链条上的各个环节,但实际上,他们的出发点不同,导致了不同的战略选择。国外头部云厂商如AWS和微软Azure更注重务实,以云服务为优先,而国内云厂商则仍在观望。
在ChatGPT火爆之后,AWS并没有主推自研的大模型,而是推出了基于Transformer架构的语言生成模型Turing NLG。然而,微软则选择了深度绑定GPT的方式,直接基于GPT对外提供服务。在最新一季财报中,微软收入同比增长了13%至565亿美元,净利润同比增长了27%,至222亿美元。微软表示,主要得益于对消费者和商业产品中大型AI模型的不断增长需求,推动了云消费的增加。
结合产业现实来看,站在云计算的出发点做大模型有足够的理由。大模型是技术驱动型创新,而非场景驱动型创新。这意味着大模型没有现成的应用场景,虽然具有无限可能,但从零开始进行研发也可能会面临困难。相比之下,云计算是一条确定且广阔的赛道,商业模式清晰,赛道规模足够大。仅就计算力资源来看,未来AI算力取代通用算力充满确定性。因此,以大模型算力为云的基本盘是云厂商必须抓住的大生意。
除了算力之外,大模型还能提高云计算的附加值,直接提升毛利。传统数据中心难以应对大模型的训练任务,因为这需要涵盖算力底座、网络、存储、大数据、AI框架和AI模型等多个复杂技术的系统性工程。而经历过大规模任务考验的云平台更适合承载大模型。因此,云平台通过提供更好的基础设施来支持大模型的发展也能带来更高的价值。
从某种意义上说,阿里云自己下场做大模型更像是“打样”。通过自己先行探索,阿里云能够积累经验并将这些经验和能力应用到其云平台上,从而更好地服务客户。此外,阿里云还通过发布千亿级参数的通义千问2.0以及8个可以直接面向消费者的行业大模型等产品来展示其在AI领域的实力和创新能力。
在阿里云的表态中,我们可以看到其在大模型时代的“三板斧”。首先是通过持续创新升级云计算体系来打造AI时代最开放的云平台。其次是通过提供全栈的AI基础设施来支持大模型的训练和应用。最后是通过构建AI生态来吸引更多的客户和合作伙伴共同参与大模型的应用和发展。
综上所述,阿里云的战略定位非常清晰:以云计算为基础、以AI为引领、以生态为支撑,全面升级其产品和服务以适应大模型时代的挑战和机遇。这一战略定位不仅有助于阿里云在激烈的市场竞争中保持领先地位,也将推动整个云计算和AI产业的发展。
在令人眼花缭乱的发布背后,阿里云面向AI时代其实已经做出了坚定选择——做AI时代的基础设施、开源路线、开放平台。
阿里云已将AI基础设施作为其核心战略之一。在这个背景下,大模型成为了AI基础设施的呈现结果。实际上,阿里云内部早已开始对AI基础设施进行持续迭代和升级。每一次模型的发布都代表着阿里云整个AI基础设施的升级。这背后离不开高带宽网络的连接、大规模资源的管理、高效弹性的多种算力以及数以万计的服务器构成的开发者界面的一台计算机。
以阿里云本次云栖大会发布为例,全新升级的阿里云人工智能平台PAI底层采用HPN7.0新一代AI集群网络架构,可高效协同调度各类芯片,支持高达10万卡量级的集群可扩展规模,让超大集群像一台计算机般高效运转。PAI可支撑多个万亿参数大模型同时训练,超大规模分布式训练加速比高达96%,远超行业水平。在大模型训练任务中,PAI更可节省超过50%算力资源,性能全球领先。
阿里云PAI通过复杂的系统优化,实现了算力的高效利用和线性增长。这使得大模型训练过程中的等待时间大幅减少,有效训练时间得到显著提高。而且,随着大模型规模的扩大和卡数的增加,出故障的概率也会随之增大。但是,通过阿里云PAI的优化,大模型训练任务可以实现高效的并行处理和资源调度,从而避免了许多无效的等待和资源浪费。
阿里云并不代表不做大模型,相反,阿里云通过不断研发和推出大模型来更好地服务于云平台。因此,阿里云将大模型逐步开源出来,并坚定地走开放路线。
今年4月,阿里云推出自研大模型通义千问,并先后开源70亿及140亿参数规模的大模型版本。通义千问2.0在复杂指令理解、文学创作能力、通用数学能力、知识记忆、幻觉抵御等能力维度上表现优异,超越了GPT-3.5的水平并接近GPT-4的得分。此外,阿里云还“打样”了8大垂直领域模型——通义听悟、通义晓蜜、通义智文、通义星尘、通义灵码、通义法睿、通义仁心、通义点金。这些模型将通过网页嵌入、API与SDK调用等方式集成进各行各业,并还将通过全新发布的一站式大模型应用开发平台——阿里云百炼对外开放。这些举措是阿里云降低大模型门槛的重要措施之一。
综上所述,阿里云在面向AI时代的基础设施、开源路线和开放平台上已经做出了坚定的选择。通过持续迭代和升级其AI基础设施,推出自研大模型并逐步开源,以及发布一站式大模型应用开发平台等举措,阿里云正致力于成为AI时代的领导者之一。
周靖人在介绍中指出,阿里云百炼集成了国内外主流的优质大模型,包括阿里云自研的大模型以及Llama2、Baichuan等第三方大模型。通过阿里云百炼,开发者可以在5分钟内开发出一款大模型应用,几小时内就能“提炼”出一个专属模型。这大大降低了大模型的门槛。
在2023年的云栖大会上,周靖人透露,模型社区阿里云魔搭已经聚集了2300多款AI模型,吸引了280万名AI开发者。魔搭社区上线仅一年,AI模型的下载量就已经突破了1亿。这表明阿里云在推动AI技术的普及和应用方面取得了显著的成果。
阿里云魔搭已经成为国内规模最大、开发者最活跃的开放模型社区。其中,通义千问开源版本的下载量已经超过百万次。一些业界顶级玩家,如百川智能、智谱AI、上海人工智能实验室和IDEA研究院,都已经将他们的核心大模型在魔搭上首发,并将Baichuan2系列模型、MathGLM系列模型、书生-浦语200B模型InternLM-20B、Ziya2-13B等系列模型开源。
在云栖大会上,阿里巴巴集团董事会主席蔡崇信发表了致辞,他强调最多的词是“开放”。蔡崇信说:“我们坚信,不开放就没有生态,没有生态就没有未来。同时,我们要始终攀登技术高峰,只有站在更先进、更稳定的技术能力之上,才有更大的开放底气。”这些话语凸显了阿里云对于构建健康、开放的云生态的决心和信心。
技术从来不是护城河,阿里云正在构建大模型时代的云生态。2022年底,周靖人首次提出MaaS(Model as a Service,模型即服务)理念,这标志着阿里云已经设想好了未来的蓝图。
阿里云通过提供工具与服务,降低使用门槛,为创业公司提供全方位服务。越多元的模型、越繁荣的应用,中国大模型生态意义上就更繁荣,阿里云的机会也就越大。
阿里云在AI基础设施方面具备一系列能力,包括IaaS和PaaS等,这些能力朝着更适合跑大模型的方向演进。在应用层面,阿里云树立了标杆,为客户趟路。开源和开放是为了让客户、开发者、创业公司、ISV等角色聚拢在一起,降低沟通成本,快速推出面向市场的创新。
以开源为例,尽管国外厂商已经开源了许多大模型,但阿里巴巴是唯一一个开源大模型的国内头部云厂商。这是阿里云与其他厂商的根本区别。因此,当其他云厂商纷纷喊着做大模型生态时,魔搭社区早已种下了种子,并逐渐成长为中国大模型生态的森林。
阿里云的生态开放策略赢得了客户信任。周靖人介绍说,中国一半的大模型公司都在阿里云上运行。百川智能、智谱AI、零一万物、昆仑万维、vivo、复旦大学等大批头部企业及机构都在阿里云上训练大模型。
截至目前,中国众多头部主流大模型都已通过阿里云对外提供API服务,包括通义系列、Baichuan系列、智谱AIChatGLM系列、姜子牙通用大模型等。大模型厂商与阿里云一同面向客户。
百川智能是中国最头部的大模型创业公司之一,曾创下平均28天迭代一版大模型的纪录。王小川介绍说,百川智能的快速迭代和部署离不开云计算的支撑。百川智能与阿里云作为紧密的合作伙伴进行了深入合作。在双方的共同努力下,百川很好地完成了千卡大模型训练任务。
大模型也在反哺阿里云,使其成为一朵走向“自动驾驶”的云。周靖人表示,“基于阿里云的通义大模型,我们对云上产品也进行了AI化改造,超过30款云产品具备了大模型的能力,带来了开发效率的大幅提升。”
例如,阿里云的大数据治理平台DataWorks新增了全新的交互形态——Copilot。用户只需用自然语言输入即可生成SQL,整体开发与分析可提效30%以上。阿里云的容器和数据库等产品上也提供了类似的开发体验。未来,这些能力还将集成到阿里云的其他产品上。
阿里云用大模型驱动云计算进化。云平台加持大模型并不依靠大模型本身赚钱。更重要的是找到自己的生态角色。开源开放的大模型与AI基础设施不断迭代为其提供了循环往复的动力。
在全新的大模型时代,阿里云又踏上了新的起点。
阿里云
网站开发
小程序开发
阅读排行
-
1. 几行代码就能实现Html大转盘抽奖
大转盘抽奖是网络互动营销的一种常见形式,其通过简单易懂的界面设计,让用户在游戏中体验到乐趣,同时也能增加商家与用户之间的互动。本文将详细介绍如何使用HTML,CSS和JavaScript来实现大转盘抽奖的功能。
查看详情 -
2. 浙江省同区域公司地址变更详细流程
提前准备好所有需要的资料,包含:房屋租赁合同、房产证、营业执照正副本、代理人身份证正反面、承诺书(由于我们公司其中一区域已有注册另外一公司,所以必须需要承诺书)
查看详情 -
3. 微信支付商户申请接入流程
微信支付,是微信向有出售物品/提供服务需求的商家提供推广销售、支付收款、经营分析的整套解决方案,包括多种支付方式,如JSAPI支付、小程序支付、APP支付H5支付等支付方式接入。
查看详情 -
4. 阿里云域名ICP网络备案流程
根据《互联网信息服务管理办法》以及《非经营性互联网信息服务备案管理办法》,国家对非经营性互联网信息服务实行备案制度,对经营性互联网信息服务实行许可制度。
查看详情 -
5. 微信小程序申请注册流程
微信小程序注册流程与微信公众号较为相似,同时微信小程序支持通过已认证的微信公众号进行注册申请,无需进行单独认证即可使用,同一个已认证微信公众号可同时绑定注册多个小程序。
查看详情