2025视觉大模型TOP25

2025-06-12 DBC 德本咨询

2025视觉大模型TOP25
RK	企业	备注
1	华为	盘古CV
2	百度	文心UFO 2.0、智能云一见5.0
3	商汤科技	日日新SenseNova V6
4	阿里巴巴	Qwen2.5-VL系列
5	腾讯	混元T1-Vision
6	字节跳动	豆包
7	DeepSeek	DeepSeek-Vision
8	云从科技	从容大模型
9	旷视科技	vary
10	海康威视	观澜大模型
11	智谱AI	GLM-4V-Flash
12	依图科技	天问大模型
13	月之暗面	Kimi k1
14	MiniMax	MiniMax-VL-01
15	零一万物	Yi-Vision
16	瑞为技术	蜻豚视觉大模型
17	中国移动	九天智绘视觉大模型
18	格灵深瞳	Unicom
19	熵基科技	BioCV视觉大模型
20	萤石网络	萤石蓝海大模型
21	虹软科技	ArcMuse 2025 V1.1
22	当虹科技	BlackEye
23	阶跃星辰	Step-1o Vision
24	大华股份	星汉大模型
25	面壁智能	MiniCPM-V
2025.06 DBC/CIW/CIS

视觉革命的“黄金眼”

在人工智能的浪潮中，视觉大模型宛如科技星河里的“黄金眼”，以其敏锐的洞察力和强大的处理能力，开启了视觉领域的一场深刻革命。2025年，这一革命正以前所未有的速度和规模推进，从智能安防到自动驾驶，从医疗影像到工业质检，视觉大模型正成为科技巨头、初创企业乃至国家战略布局的焦点。

政策护航，为视觉大模型产业筑牢根基

近年来，中国政府将人工智能视为国家战略发展的重要方向，出台了一系列针对性政策，为视觉大模型产业的发展保驾护航。在战略规划层面，《新一代人工智能发展规划》将计算机视觉技术列为重点发展领域，明确提出要加强关键技术研发和应用推广，为产业发展指明了清晰的方向。

在产业扶持政策上，《关于加快新一代人工智能产业发展的若干政策》为符合条件的计算机视觉企业提供了税收优惠、研发费用加计扣除等实实在在的支持，降低了企业的运营成本，激发了企业的创新活力。同时，政府还积极推动人工智能产业园区建设，为企业提供良好的发展环境和基础设施。

人才培养和引进也是政策关注的重点。《关于实施国家新一代人工智能创新发展战略的意见》强调要加强人工智能学科建设，培养高素质的专业人才。《关于进一步加强人工智能教育工作的意见》则提出要将人工智能教育纳入国民教育体系，从基础教育阶段开始培养学生对人工智能的兴趣和素养，为产业发展储备了源源不断的人才。这些政策的实施，为视觉大模型产业的发展营造了良好的政策环境，奠定了坚实的基础。

从通用范式跨越，至垂直赛道领航

2025年的中国视觉大模型市场已形成清晰的梯队格局，头部企业聚焦通用能力，而中小厂商则在细分领域寻求突破。

华为盘古CV凭借30亿参数的纯视觉架构，成为工业质检领域的领跑者。其在比亚迪工厂的电路板缺陷检测准确率超过99%，展现了国产化硬件的强大性能。商汤日日新SenseNova V6则以6000亿参数的MoE架构，实现多模态能力的领先。其10分钟长视频解析技术已应用于金融风控、医疗影像和自动驾驶场景。阿里Qwen2.5-VL凭借开源生态与电商场景的深度结合，成为AIGC领域的标杆，双11期间，该模型生成3000万条商品描述，人工审核通过率高达99.2%，彰显其在商业落地上的成熟度。

众多新兴企业也在视觉大模型领域崭露头角，通过技术创新和差异化竞争，为产业注入了新的活力。

多模态融合，应用创新加速度

技术融合成为产业发展的重要方向，多模态与生成式AI的深度耦合成为主流趋势。多模态大模型不再局限于单一模态的处理，而是支持图像、文本、语音的联合推理，并逐步向视频、3D点云扩展。在工业质检中，多模态大模型可同时处理图像、温度、振动数据，实现设备故障的根因分析，大大提高了质检的准确性和效率。生成式AI在视觉领域的应用也从内容创作拓展到工业设计、医学影像合成等领域。例如，汽车制造商利用生成式AI设计车身外观，缩短了研发周期50%；医学机构通过生成对抗网络（GAN）合成病理切片，解决了罕见病数据稀缺的问题，为医学研究和临床诊断提供了有力支持。

硬件创新也为视觉大模型的发展提供了新的动力。类脑芯片和光子计算等新兴技术逐渐崭露头角。类脑芯片通过模拟人脑神经元与突触，实现了低功耗、高并发的视觉处理，2025年在边缘设备中的渗透率已达15%，主要用于无人机、机器人等场景，提升了设备的智能化水平。光子计算利用光的并行性与低延迟特性，将视觉模型的推理速度提升100倍，能耗降低90%，目前已在安防监控、自动驾驶等领域试点应用，有望为视觉大模型的发展带来新的突破。

结语在应用层面，视觉大模型将在更多领域得到广泛应用。在工业领域，视觉大模型将贯穿制造全流程，从检测向智能装配、柔性生产延伸，推动工业4.0的深入发展。通过实时监测生产过程中的各个环节，视觉大模型可以及时发现质量问题并进行调整，提高生产效率和产品质量。在医疗领域，视觉大模型将助力精准医疗的发展，为疾病的诊断和治疗提供更准确的支持。通过对医学影像的深度分析，视觉大模型可以发现早期病变，为患者争取最佳的治疗时机。在智慧城市领域，视觉大模型将与物联网、5G等技术深度融合，实现城市的智能化管理和服务。通过实时监测城市交通、环境、能源等方面的情况，视觉大模型可以优化城市资源配置，提高城市的运行效率和生活的幸福指数。

视觉大模型不仅是算法的比拼，更是生态的竞争。谁能在技术、数据、场景三者间找到最佳平衡点，谁将定义下一个AI时代。

（文/墨之）