登录
首页 > 写作技巧 > 昆仑万维发布Skywork R1V4-Lite:30B多模态模型胜Gemini 2.5 Pro,速度还快19倍

昆仑万维发布Skywork R1V4-Lite:30B多模态模型胜Gemini 2.5 Pro,速度还快19倍

发布时间:2025-11-19 16:02:57

2025 年几乎被一致包装成 AI Agent之年。从大模型到Agent转向,行业讲述的故事是,AI 不再只是一个会聊天、会生成文本的工具,而要变成能理解目标、拆解任务、自动调用各种服务的“数字执行者”。在 PPT 和发布会上,这听起来是一次从会说话到会干活的范式转变。

但第一批把这一愿景装进硬件里的产品,很快给了现实的一记耳光。Rabbit R1 带着 “Large Action Model” 的叙事亮相,号称能像真人一样在各类 App 里订机票、点外卖、完成整条流程。然而真正到用户手里,它更多像是一台性能有限、响应迟缓、依赖云端的一部功能不完善的手机,宣传中的自动化场景要么不可用,要么极不稳定,交互体验也并未跳出传统语音助手的框架,最终被普遍视为一场高调开局、低质量收场的失败实验。

这并不意味着Agent本身是伪命题,而是提醒我们把Agent做成一台独立硬件,可能一开始就选错了战场。与其再造一块昂贵却鸡肋的设备,不如把“能看、能想、能行动”的能力压缩成一个可以嵌入任意应用的轻量模型。

在这一背景下,昆仑万维最新发布的Skywork R1V4-Lite(以下简称“R1V4-Lite”),试图成为那个“能行动”的Agent。它不标榜自己是巨无霸,反而强调“轻量级”(Lite),其核心定位是,首次在轻量级架构下,统一了主动图像操作、外部工具调用和多模态深度研究三大能力。

抛开噱头,只讨论感知—推理—行动这条链路本身时,今天的技术到底已经走到了哪一步。

我们设计了一系列高难度的真实场景,来看看R1V4-Lite的表现。

Copyright 2016-2025 商媒体 版权所有  京ICP备20241218号-1