我国公司除了深度求索(DeepSeek)之外,月之暗面(Kimi)、MiniMax海螺和字节豆包在2025年也推出了新的大模型,且这些公司在模型优化和成本控制上有创新。
虽然DeepSeek、月之暗面、MiniMax和字节豆包都有新品发布,但只有其中DeepSeek的R1模型在性能和成本上有显著优势。
但如论我国在AI人才方面的优势,则必须要看到这些公司的技术优势,比如模型瘦身、成本效益、技术创新等。我国公司在技术创新上的实际进展,如通过剪枝、量化等技术降低模型成本,推动技术普惠化。
如果分为技术创新型、应用驱动型、生态构建型等类别,则更需要强调AI公司的潜力以及未来的发展方向,如模型优化、跨领域应用等,以预测公司的长期价值。
在AI大模型领域,尽管部分企业存在短期逐利现象,但相信仍有一些企业在技术创新、成本优化和应用场景探索上将展现出真正的“硬核”潜力。并相信这些企业不仅突破技术瓶颈,更以高效、普惠的路径推动行业变革。
以下仅从技术突破、应用落地和生态构建三个维度,对比着看看情况如何。
技术创新
没有在正确方向上的技术创新,一切都是白扯。
企业 | 备注 |
---|---|
深度求索(DeepSeek) | 2025年1月发布的DeepSeek-R1模型,性能对标OpenAI o1,但训练成本仅为后者的三十分之一。其通过剪枝、量化和知识蒸馏技术实现大模型“瘦身”,显著降低硬件门槛和能源消耗,为AI普惠化铺路4。这种“小而强”的路径打破了对参数规模的盲目崇拜,被外媒视为中国技术自力更生的典范。 |
月之暗面(Kimi) | 推出的k1.5多模态思考模型,强调多模态融合与实时推理能力,尤其注重在工业场景的垂直应用。其技术路线避开通用模型的同质化竞争,聚焦细分领域的高效适配,例如通过轻量化模型支持边缘端设备的实时决策。 |
MiniMax海螺 | 上线语音功能,对标OpenAI实时语音技术,但通过本地化部署优化延迟问题。其创新点在于将大模型能力嵌入传统制造业的质检环节,结合声纹分析提升故障检测效率,实现从“实验室技术”到“产线工具”的转化。 |
但,技术创新型需要突破的也包括“军备竞赛”陷阱。
应用驱动
所谓应用,不外乎要在垂直领域深耕。
企业 | 备注 |
---|---|
字节豆包 | 实时语音大模型不仅服务于消费级应用(如直播互动),更深入医疗问诊和教育辅导场景。例如,在偏远地区通过低带宽环境下的语音模型实现远程医疗咨询,技术落地兼顾商业价值与社会效益。 |
蜜度 | (未直接引用但隐含潜力)蜜度在政务数字化转型中表现突出,其大模型通过语义理解优化政府服务流程,例如智能审批和舆情分析,成为“数字政府”建设的核心支撑。 |
但,同样要深受寂寞和时间的考验。
生态构建
所谓生态构建,其它各行各业的有些企业也都在说。
企业 | 备注 |
---|---|
华为盘古大模型 | 其工业领域应用(如矿山安全监测、气象预测)已形成“模型+硬件+解决方案”的闭环生态,通过开放平台吸引开发者共建行业应用生态,降低中小企业接入门槛。 |
科大讯飞 | 依托教育、医疗等领域的数据积累,构建行业专用模型库,例如其医疗大模型已覆盖3000多种罕见病辅助诊断,通过“模型即服务”(MaaS)模式向基层医院输出能力,推动资源均衡分配。 |
但,从单点突破到产业链协同,也是一个漫长的过程。
值得期待的方面,从技术路径创新方面看,正从“参数竞赛”转向“效率优先”,例如DeepSeek通过工程优化实现成本革命,这种务实路线更符合商业化需求;从场景落地能力方面看,字节豆包、MiniMax等企业将大模型嵌入具体场景(如医疗、制造),解决传统行业痛点,避免技术空转;从人才与政策红利方面看,我国每年培养超8万名STEM领域博士,为AI研发提供持续动力。
功利主义是人类的天敌,绝大多数人质疑的“功利性”问题确实存在,例如部分企业为抢占风口盲目堆砌参数,或通过政策套利获取补贴。但行业整体趋势已显现分化:一是劣汰,依赖资本烧钱、缺乏核心技术的企业正被淘汰(如部分亏损扩大的通用模型厂商),二是优胜,深耕垂直领域、具备工程化能力的企业逐步崛起(如DeepSeek、Kimi)。
未来,技术融合方面,多模态与边缘计算结合,推动大模型从云端向终端渗透(如工业机器人、智能家居);成本革命方面,训练成本降至当前1/10以下时,AI将像电力一样成为基础设施;伦理与治理方面,随着技术普及,数据安全与算法公平性将成为企业竞争力的新维度。
AI大模型的未来应不属于“庞然大物”,而应属于“精而强”的创新者,就像现在的DS。但DS变大了以后呢?会不会重蹈覆辙?
谁都在喊长期主义,但真正的长期主义者,少之又少。
但也因为少,所以谁都可以成功,只要你真想。
(文/本该,2025年2月)
e-Mail:lab@enet16.com