股票之声

 找回密码
 注册

QQ登录

只需一步,快速开始

股票之声 首页 行业分析 查看内容

科技行业 :多模态大模型和应用奇点将至

2025-7-10 12:09| 发布者: 神童股手| 查看: 104| 评论: 0

摘要: 我们认为,多模态大模型和应用发展的奇点将至。判断依据包括:1)技术进步方面:原生多模态模型架构得到业界认可,OpenAI 和Google 的原生多模态模
我们认为,多模态大模型和应用发展的奇点将至。判断依据包括:1)技术进步方面:原生多模态模型架构得到业界认可,OpenAI 和Google 的原生多模态模型已经在性能、延时、部署上展现出了优势。2)商业化进展方面:

    全球维度看,除了最头部的OpenAI 和Anthropic 依靠模型“智能”实现商业化,相当一部分AI 应用公司的商业化产品依赖多模态能力。国内维度看,国内公司在视频生成赛道已经实现了较成熟的全球化和商业化之路。与市场不同的观点在于,1)更早认识到原生多模态架构将成为主流;2)AI 商业化不能仅聚焦在二级公司,更要关注全球维度一级公司的进展。

    多模态是大语言模型(LLM)发展的必然趋势

    借助Scaling Law 和强化学**,LLM 已经在很多领域获得了超过普通人类的智能,但是其处理的核心信息仅是文本。为了拓展更广泛的使用场景,研究者将其他模态的能力“加入”到LLM 中,多模态大型语言模型(MLLM)问世。架构上看,MLLM 可以分为模块化架构和原生架构,前者通常分别训练不同模态然后实现模块“拼接”,而后者则直接在全部模态数据上从头开始同步训练的模型。效果上看,原生MLLM 在性能、延时、部署上均有优势,但是对算力和Know-How 的需求较高,通常只有头部模型大厂在做,OpenAI和Google 领先。无论架构如何,MLLM 已经成为行业共识的必然趋势。

    从大模型到多模态:商业化的必由之路

    从全球AI 公司的商业化进展看,无论是基于LLM 的文本类产品,还是基于MLLM 的多模态产品,呈现出以下大趋势:1)海外商业化进展快于国内。2)全球维度,一级公司进展快于二级。3)整体多模态为主的产品商业化快于文本产品。4)Chatbot 为代表的文本类产品国内外商业化分歧明显,据非凡产研数据,截至25 年5 月,在海外能够实现10 亿美金以上的ARR(如OpenAI、Anthropic),而国内Chatbot 还未实现很好的商业化。国内AI产品年化收入超过1 亿美金的有3 家公司,分别为美图(1357 HK)、快手(1024 HK)和睿琪软件(非上市),其AI 产品均为多模态产品。

    国内的视频生成是全球化、商业化最成熟的AI 应用赛道主流的多模态产品,大致分为图像生成、视频生成和其他多模态交互三类。

    其中,国内厂商在视频生成赛道的全球化和商业化最成熟。1)模型/产品成熟:据Artificial **ysis 数据,在文生视频、图生视频排行榜单上,字节Seedance 1.0 均为Top 1,快手可灵(Kling)、MiniMax Hailuo 02 名列前茅。2)商业化成熟:以快手可灵为典型的代表,上线9 个月累计收入超1亿人民币,25Q1(上线10 个月左右)ARR 突破1 亿美金大关。可灵的成功,或意味着国内视频生成领域商业化单点突破到多点突破的开始。

    投资建议

    我们认为,多模态有望在算力和应用两方面带来相关投资机会。1)算力侧,供给端原生多模态模型需要比非原生模型更多的算力,需求端视频的推理算力需求远大于文字,视频Agent 的落地进一步催生推理算力需求。2)应用侧,供给端国内的视频生成模型领先,需求端广告、零售、创作、教育等领域均有AI 化需求。推荐1)国产算力链:沪电股份、生益科技。2)应用产业链:微软、奥多比、金山办公、福昕软件、泛微网络、鼎捷数智、用友网络、虹软科技、网宿科技。

    风险提示:宏观经济波动,技术进步不及预期,中美竞争加剧。研报中涉及到未上市公司或未覆盖个股内容,均系对其客观**息的整理,并不代表本研究团队对该公司、该股票的推荐或覆盖。

鲜花

握手

雷人

路过

鸡蛋
【2024年5月31日最新敬告:文明发帖】

Archiver|手机版|小黑屋|股票之声 ( 京ICP备09051785号 )

GMT+8, 2025-7-16 15:20 , Processed in 0.046132 second(s), 7 queries , MemCache On.

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

返回顶部