腾讯云生成式AI产业应用峰会现场,图片来源:时代财经记者摄
自去年9月发布混元大模型后,腾讯大模型迎来最大一次升级。
5月17日,在“腾讯云生成式AI产业应用峰会”上,腾讯披露混元大模型的一系列新的进展,包括智能体平台“腾讯元器”、三款PaaS工具引擎,以及行业大模型的最新能力升级。
2024年被普遍认为是国产AI大模型全面商业落地的元年,各大互联网厂商的落地之战打响,竞争日渐白热化,甚至打起了价格战。最近一个月时间内,国内外大厂以及智谱AI、零一万物等创业企业都接连推出和迭代重磅AI大模型版本,字节跳动、阿里、百度加入了价格战。
在落地路径上,腾讯与其他大模型厂商稍显不同——与单个的C端大模型应用相比,腾讯更重视B端即产业应用的落地。
2023年6月,腾讯云率先发布行业大模型,让市场看到了这家互联网大厂对大模型在产业落地的思考:通过聚焦产业场景,以解决痛点为目标,推动前沿创新加速落地,助力企业降本增效。
3个月后,直接面向C端用户使用的混元大模型才正式发布,腾讯进一步强调“大模型的打造只是起点,把技术落地到产业场景、创造价值才是目标。”
腾讯集团高级执行副总裁、CISG(云与智慧产业事业群)CEO 汤道生在此次会上指出,腾讯始终以“产业实用”作为公司发展大模型的核心战略。目前,腾讯推出的行业大模型已在金融、医疗、教育、汽车、能源等20多个行业落地。
同时,混元大模型也在加速落地。据悉,混元已经在腾讯内部600多个业务和场景中落地测试。汤道生以腾讯会议为例,基于混元的AI小助手上线后,用户只需要简单的指令,就可以完成发言提醒、观点总结、会议纪要等能力,大幅度提升会议效率,且过去四个月,用户日调用量增长了20倍。
在大模型落地的过程之中,场景选择、需求匹配、结果准确性、数据保密、落地成本、技术门槛的挑战仍在不断涌现。汤道生总结道,腾将通过打造高性能的模型、高效率的工具平台、高敏捷的场景应用、高可用的算力基础设施,以及强安全的模型环境,构建离产业最近的AI。
腾讯混元应用加速
讨论大模型落地前提,必须保证基础模型能力的领先。跟大部分厂商一样,腾讯也在持续升级混元的技术实力。
一方面,腾讯通过率先采用MoE(Mixture of Experts)架构,将混元大模型扩展至万亿级参数规模。升级过后,混元的总体性能相比上一代提升了50%,部分中文能力已追平GPT-4,在“时新”问题的回答表现上也有较大提升。
混元亦在多模态方面取得一定进展。据腾讯集团副总裁蒋杰透露,在AI生图领域,腾讯混元文生图基础架构已全面升级至Sora同款的DiT架构,具备了多轮绘图能力。
在视频生成领域,蒋杰指出,腾讯混元支持文生视频、图生视频、图文生视频、视频生视频等多种视频生成能力,视频生成长度可达16秒。预计在三季度推出的下一代文生视频模型,有望能够生成30秒以上视频。
为进一步降低应用门槛,让大模型变得更为“实用”,腾讯开始加快对外输出大模型能力的脚步。
如腾讯混元发布了智能体平台“腾讯元器”,帮助用户以极低的门槛创建专属AI智能体,并支持一键分发至QQ、微信客服、腾讯云等渠道。这被普遍视为腾讯版的“GPTs”。
今年1月,OpenAI发布GPTs时,市场曾一度将其视为人工智能领域的“iPhone时刻”,有望帮助大模型技术真正实现破圈。但如今回看,它的进展并未如预期般奏效。
腾讯混元模型应用负责人张锋指出,智能体仍是时代前沿产品,市场的接受需要一个过程。同时,智能体的流行与否和模型基础能力息息相关。“伴随着基础模型能力的提升,智能体的构建也会更加满足用户需要。”
腾讯云这次还发布了PaaS层的三个新引擎工具。腾讯云副总裁、腾讯云智能负责人吴运声表示,通过PaaS接入大模型,可实现数据工程、模型精调、应用开发的流程简化,进而助力企业更高效、简单地将大模型能力应用于生产、销售和服务等场景。
以大模型知识引擎为例,这是一款基于大语言模型的知识应用开发平台。通过腾讯打造的“模块化”应用模板,基层人员只需要用自然语言,在5分钟内就可以开发出一款知识服务应用,快速在客服营销、企业知识社区等各种与人连接的业务场景落地。
而图像、视频创作引擎,将通过大模型全面提高素材生成效率。如“图像创作引擎”可为企业客户提供AI写真、线稿生图、图像风格化等能力;“视频创作引擎”可提供视频转译、视频风格化、画布拓展等多种功能。
此外,算力基础亦是市场能否更大规模运营大模型能力的关键。腾讯云通过自研星脉网络3.2T通信带宽和统一的接入层能力,打造了一个可以支持超过10万张卡并行计算,并且能够兼容多种GPU生态的算力集群。
吴运声透露,通过自研的星脉高性能计算网络,腾讯算力成本低于外购的相关网络设备,叠加使用Angel训练推理平台,使训练和推理过程中资源可更高效利用。
另据时代财经获悉,包括MiniMax、百川等在内,90%的头部大模型企业都已在腾讯云上打造大模型。
蒋杰还在会上透露,面向C端的助手App“腾讯元宝”将于5月底上线,首批上线功能包括AI搜索、翻译、文档总结、口语陪练等,但更多的消息暂未披露。
在此之前,混元的C端入口只有小程序“混元助手”和网站,缺乏统一的移动端入口。坐拥腾讯系强大的流量池,“腾讯元宝”有望为大模型的C端应用带来新的突破。
回应价格战:更关注技术能力发展
5月15日,字节发布豆包大模型,其主力模型在企业市场的定价为0.0008元/千tokens(文本单位),较行业平均价格便宜99.3%。以此计算,用户仅需一块钱就能买到主力大模型的125万tokens。
字节激进的举动引发了市场对于大模型“价格战”开打的猜想,在此之前已有多家厂商宣布下调模型调用成本。
5月13日,OpenAI发布GPT-4o,价格仅为GPT-4 Turbo的一半,输入、输出每百万 tokens收费5美元、15美元。差不多是同一时间,智谱也在大模型开放平台上线新的价格体系,入门级产品 GLM-3 Turbo 模型调用价格下调80%,每百万tokens只需一元。
5月21日,阿里云旗下的通义千问同样选择跟进,其主力模型API输入价格从0.02元/千tokens降至0.0005元/千tokens,直降97%。这意味着,1块钱可以买200万tokens,甚至低过字节的豆包。
同日,百度智能云官微宣布,文心大模型两大主力模型全面免费,立即生效。据悉,百度宣布免费的两款大模型分别为今年3月推出的两款轻量级大模型ERNIE Speed、ERNIE Lite,支持8K、128k上下文长度。
竞争对手纷纷降价,腾讯不免也会被拉来比较。
对此,吴运声对时代财经等媒体回应指出,腾讯大模型的底层能力和构建工具链仍在快速迭代过程中。未来腾讯会把核心精力放在产品和技术能力发展上,致力于为客户创造价值,让大模型能够在生产环境中实际应用起来。
“相信我们一定能为客户提供有竞争力的模型和产品。”吴运声说。
有大模型行业从业者向时代财经分析称,“当下国产大模型仍以快速迭代自身能力为主,并同步推进产业应用的逐渐落地。在这个阶段降成本优化价格有些为时过早,待到大模型能力和应用场景皆已逐渐成熟的时候,再打价格战更为合适。”
从这个角度来看,大模型厂商们持续迭代模型能力,并开拓更多应用场景或许更为重要。
而在谈及大模型推广难题时,吴运声指出,过去一年,大模型在落地过程中遇到的一个重要挑战,是需求和能力匹配的问题。“很多客户对于大模型有很高的预期,业务的很多需求想通过大模型一下子全部解决,这个在现阶段较难实现,还是需要在场景快速验证、分阶段推进。”
此外,还有技术使用门槛过高的挑战以及安全合规的挑战。在吴运声看来,只有帮助企业减少对技术人才及专业技术能力依赖,让一线生产、经营人员也能“零门槛”用上大模型,才能加速生产经验与模型技术的融合。
从智能体到PaaS引擎工具,再到C端App,强调“产业实用”的腾讯正在做出诸多探索,试图通过各类创新产品推动大模型在各行各业更广泛的运用。但现阶段,大模型最好的商业路径是什么,腾讯等大厂们仍需探索。
当谈及相关应用和大模型结合的ROI时,张锋指出当前腾讯大模型应用仍在探索阶段,相关业务场景以创新技术为主。
“现在最关键的问题还是怎么将生成式AI技术跟客户需求做更好的结合,其他的东西才会被带动起来。”在回应团队KPI的问题时,吴运声如是说。
(责任编辑:王治强 HF013) 专业股票配资公司排名