![]()
新智元报道
![]()
光有强大的模型本身还不够,从脏数据到分析报告到汇报PPT,中间那条自动化链路谁来跑?GitHub上刚开源的SenseNova-Skills给出了一个答案,我们实测了四个真实场景,效果有点超出预期。
就在最近,第三方榜单Claw-Eval上出现了一个有意思的名字。
SenseNova 6.7 Flash-Lite,一个轻量级模型,冲进了前十。
紧跟DeepSeek V4 Pro和GPT-5.4,压过了Gemini 3.1 Pro和DeepSeek V4 Flash。
![]()
有趣的是,行业巨头们也在同一周有了新动作。
ChatGPT for Excel全球上线,GPT-5.5驱动,直接在Excel里嵌了一个侧边栏。
两天后,Claude把Excel、Word、PowerPoint三件套转正GA,Outlook同步开了公测。跨四个Office应用保持对话上下文不断,从邮件到表格到PPT一路跟着你走。
两大巨头都急着把大模型塞进办公套件,为什么?
![]()
实际上,要真正解决你工作的问题,只靠模型是不够的。
如果你想做到跨环节、全链路的办公自动化——从一堆脏数据,到分析报告,到汇报PPT ——得有专门的Agent和Skills来实现。让大模型从「会聊天」变成「会交作业」,靠的就是这一层。
最近GitHub上出了一套开源的办公Skills跟的就是这波趋势,并且迅速斩获了4位数的Star。
抱着试试看的心态,我们亲自实测了一波,发现效果有点超出预期。
![]()
项目地址:https://github.com/OpenSenseNova/SenseNova-Skills
一句话出一张图,零乱码
第一次出国旅游,面对签证、机票、海关、转机一堆流程,大多数人的第一反应是上小红书翻攻略。
现在换个思路。
把需求扔给装了Skills的Agent,它自动生成一张完整的流程图解。
步骤清晰,层级分明,中文排版零乱码,风格直接对标小红书爆款。
![]()
一句提示词,一遍成,不抽卡。
![]()
![]()
![]()
![]()
![]()
左右滑动查看
客户端点开大图后点击下一张(>)
从数据到报告到PPT,三个真实办公场景
开胃菜吃完,上硬菜。
6家厂商13种品类混着来,抗噪才是真本事
下一个测试任务:存储芯片价格分析。
做过采购和分析的朋友肯定懂这种烂账,7个月的报价记录,6家厂商,从DDR4到HBM3e到企业级SSD,13种细分品类全搅在一张表里,厂商名大小写不统一,空值东一个西一个,离群值占了13%。
![]()
不光是数据多,更恼人的是数据杂。
品类之间价格量级差了几十倍,你要是不分层处理,一算均价直接就是垃圾。
换作真人,洗数据加写报告,起码熬一天半。
对于这套内容,Agent的处理堪称老手。
它首先跑了一轮「数据审计」,把厂商命名不规范的、报价空值的,全部清理了一遍。
光厂商名就揪出4个问题,什么「 sk hynix」前面多个空格、「 samsung」大小写乱飞,这种脏数据你不清,后面按厂商聚合的时候同一家会被拆成两条线。
尤其值得一提的,是它对离群值的处理。
110条数据被标记为离群值,占了13%,比例不小。
但Agent没有一刀切全删。
它分析了一下发现,其中一部分对应的是真实业务场景,比如渠道清库存促销带来的低价,以及HBM现货紧缺时的溢价,然后果断选择保留数据并单独做了标记,后续分析里分层处理。
数据审计完,紧接着是多维拆解。
按「品类×应用场景×厂商」交叉分析,准确捕捉到2026年2月下旬的价格拐点。HBM3e和企业级SSD周涨幅明显抬升,消费类DDR4与eMMC只是温和跟涨。
最终结论很犀利:本轮上涨是AI服务器需求带动的结构性修复,不是普涨。
![]()
数据分析能跑通了,更长的链路呢?
给Agent一个行业名,它交回一份调研报告
低空经济行业调研。
只给了一个题目,没有提供任何参考资料。
![]()
Agent先锚定了一个核心判断,2025到2026年是中国低空经济商业化的关键窗口期。
然后,它开始自主检索国内外主流厂商的最新进展,逐一比对机型、适航进展和订单数据。
这里有个细节。面对大量口径不一的公关稿和重复信息源,Agent精准提取出了UAM落地节奏、eVTOL核心零部件国产化率和关键环节成本占比。
随后,它又在此基础上自动生成了产业链结构图、成本占比饼图,并用TAM/SAM/SOM框架测算2025、2027、2030年市场规模。
最终给出的调研报告,有判断框架、有数据支撑、有可视化图表,远超「网上搜一圈拼在一起」的信息堆砌。
![]()
整个过程是sn-deep-research这个Skill在编排。
规划→分维度取证→综合→成稿,支持断点续跑。
23页PPT,连配色都替你想好了
城市新能源汽车充电基础设施布局与运营方案。
首先,内容结构上搭建了完整的七段式框架,行业背景、需求测算、选址模型、技术方案、运营模式、投资测算、政策建议。
最终交付的是一份23页的完整 PPT。
其次,每一部分都匹配了对应的视觉表达。选址模型页自动配置GIS热力示意图,运营模式页生成三种模式的对比矩阵,投资测算页给出利用率与回收期之间的敏感性分析图。
最后一页还给出了3条具体到行动主体和时间节点的落地建议。
生成即交付,打开就能编辑。
![]()
重点来了。
这份PPT不仅在OpenClaw里跑通了,同样的Skill拖进ChatGPT也能用。
把SenseNova-Skills仓库克隆到本地,通过ChatGPT的Skills入口导入,搭配GPT的原生能力,同样能跑出高质量的PPT。
![]()
![]()
四大类任务,不挑模型
到这里该揭底牌了。
前面四个场景背后跑的,是同一套东西,SenseNova-Skills。
来自商汤的团队把办公场景里最高频的能力拆成了四大类任务入口,每个入口底下挂着一串具体的Skills各司其职,刚在GitHub开源,MIT协议,覆盖了办公场景里最高频的需求。
1. 数据分析,sn-da-excel-workflow,多表读取、大文件超过1万行自动触发Parquet优化、清洗聚合导出,全流程编排。还有专门处理图片表格OCR的sn-da-image-caption。
![]()
2. 深度研究,sn-deep-research,下面挂了6个子Skills分别负责规划、取证、综合、成稿、格式发现、HTML转换,中间产物持久化,断点可续。
![]()
3. PPT生成,从sn-ppt-entry统一入口进入,支持标准模式和创意模式。标准模式的链路是大纲→逐页HTML→逐页VLM评审(不合格自动重写)→PPTX导出。
![]()
4. 搜索,聚合了arXiv、Semantic Scholar、PubMed、GitHub、Stack Overflow、Hacker News、HuggingFace、Reddit、Twitter、YouTube、B站、知乎、抖音,学术+开发者+中英文社交全覆盖。
![]()
另外,SenseNova-Skills还能通过调用SenseNova U1模型,完成高密度复杂的信息图生成,包含自动提示词扩写+VLM质检+质量排序。
![]()
每个Skill都是独立目录,通过SKILL.md声明什么时候触发、什么时候不触发。
Agent会根据指令自动选择和编排,不需要手动指定调哪个。
这套Skills在Claude Code、Codex CLI、ChatGPT、OpenClaw、Hermes Agent等常见Agent工具里都能跑。
Skills提供流程知识和工具链编排,模型提供推理和决策。
怎么用,怎么装
模型搭子:SenseNova 6.7 Flash-Lite
虽说有了好用的Skills搭什么模型都可以,但最简单的还是日日新SenseNova 6.7 Flash-Lite——同量级第一,专门为Agent场景优化的轻量多模态模型。
Flash-Lite采用原生多模态架构,视觉信号和文本放在统一的感知链路中,看懂网页布局、文档结构、图表关系之后一步到位做决策,中间不经过文字转译。
![]()
这个架构带来两个直接结果。
1.Token消耗在信息搜索等场景中直降60%。任务越长省得越多,对于需要跑完整工作流的Agent来说,这是实打实的成本优势。
2. Agent基准测试成绩也很能打。PinchBench 92分同量级第一,Deep Planning 66分同量级第一,NovaPPTBench 92.4分第一,还在τ²-bench、GPQA-diamond、AA-LCR、MathVision、OCRBenchV2等多个维度领先同级别国内外模型。
![]()
项目地址:https://github.com/OpenSenseNova/SenseNova6.7
模型API接入时,还有一个限时福利可以薅。
商汤通过SenseNova平台发放的Token Plan,活动首月可享每5小时1500次免费调用配额,相当于零成本上手。
![]()
https://www.sensenova.cn/
模型选好了,接下来是部署。
两种方式,看你更喜欢哪种
想用这套Skills,两条路。
第一条,本地安装,自己配。
Skills仓库MIT协议开源,你可以用Agent Pack一键装,它集成了Hermes Agent和OpenClaw框架加全套Skills,配合免费Token Plan,装完就能跑。
![]()
项目地址:https://github.com/OpenSenseNova/agent_pack
也可以更灵活一点,直接克隆Skills仓库,把Skills目录拷进你自己的Agent框架就行。
甚至可以让Agent自己装,跟它说:
请帮我把https://github.com/OpenSenseNova/SenseNova-Skills安装到你的Skills目录。
它自己就能克隆、拷贝、加载。
API兼容OpenAI格式,主流开源Agent框架平滑接入。
第二条,云端产品,开箱即用。
商汤的办公小浣熊目前已经把商汤全系SenseNova-Skills和U1信息图生成打包好了,1500万个人用户、数千家企业客户在用。
![]()
https://xiaohuanxiong.com/
本地的好处是自由度高,想怎么魔改怎么魔改,适合折腾型选手。
云端的好处是省心,不用碰代码不用配环境,适合想直接用的人。
大模型竞争,回到交付
真实的未来不是「Agent取代人」,而是周一早晨:
分析师打开电脑,上周840条新报价已经清洗完毕;产品经理刚定完选题,调研报告草稿已经在桌面;总监还在路上,下午的汇报PPT已经生成,配色都替你想好了。
让这件事发生的,不是更大的模型,而是模型背后那套已经被打磨过的Skills。
代码在GitHub,MIT协议,我们先装上了。
SenseNova-Skills GitHub仓库:
https://github.com/OpenSenseNova/SenseNova-Skills





京公网安备 11011402013531号