扣子空间，偷偷搞全了AI Office

2025-09-09 02:20:00分类：平凉阅读(61641)

你的下一个Office，不一定要是Office。

但凡稍微关注点AI圈子，2025年你看到最多的关键词，会是什么？

Agent（智能体）绝对榜上有名。

2025年还没过完，市面上的AI Agent产品已经大爆发到让人眼花缭乱——从能帮你写代码的、画画的，到能帮你订机票、做规划的，选择琳琅满目。

但它们普遍又是面目模糊的。通用的AI Agent好像什么都能干，但什么都干得不精；而很多垂类Agent，哪怕如vibe coding这样场景明确，又高度标准化的场景，真正用起来也会在某个环节卡壳，比如指令理解生硬，需要多轮交互修改代码——对小白用户而言，这不可持续。

字节跳动旗下的“扣子空间”，希望能够给出一种新的解法。9月3日，扣子空间（Coze Space）进行了一次大版本升级，以及上线了AI Excel等重磅新功能。

来源：扣子空间

“扣子空间”是一个通用智能体平台，在今年4月上线。在内测阶段，“扣子空间”就已经爆火，一码难求。

自此之后，扣子空间一直在更新迭代，近期更是频频升级：9月3日正式推出AI Excel能力之后，AI设计版块也开始内测豆包图像创作模型Seedream 4.0模型，带来了多图融合、图像修改等能力的又一次升级。

在完成最近的功能更新之后，36氪发现扣子空间的定位也进行了一次刷新：一站式AI办公空间——你的下一代办公空间，可能真的不一定是Office。

简单来说，扣子空间要面向的是几乎所有有学习和工作需求的C端用户。今天，当奶茶视频APP再分析扣子空间的能力时，可以发现它已经覆盖了AI写作、AI PPT、AI设计、AI Excel、AI网页、AI播客。

从2024年上线以来，扣子的变化轨迹清晰可见：从一个To C的智能体生态，逐步完善AI基建，接入丰富多元的MCP广场。

2024年被称为Agent元年，直到2025年，Agent才开始逐步落地。可以说，年初Manus的爆火，彻底打开了Agent市场，但要真正让每一个人都用上Agent，依旧还有很长的路要走。

如今Agent也走到了这样的岔路口。

“最后一公里”，几乎是每一代的技术浪潮中的公司，都会提到并希望解决的问题。以上一代AI技术的发展过程为例，传统模型参数规模小，识别、OCR、TTS等单点算法只能在特定场景产生价值，企业上线时必须做大量系统集成、数据标注、流程再造。结果就是，每一个新客户就意味着一次新版本的深度定制。

扣子空间的目标，不只是做一堆工具的简单集合，而更像是一个打通了普通用户、开发者和企业三方的完整生态。就在不久前的7月，扣子也宣布将另外两个产品——扣子开发平台（Coze Studio）和扣子罗盘（Coze Loop），开源至GitHub。

如果说，“扣子空间”要让路人都能轻松用AI完成学习、工作的产品；那么“扣子开发平台”和“扣子罗盘”，就是为开发者提供了一整套“AI工具台”。

归根结底，扣子要解决的问题只有一个：让Agent真能用，真落地。扣子空间在其中扮演的角色，就是让每个普通人都能以最简单的方式，轻松用AI完成学习、工作的产品。

从50分到80分，靠谱AI实习生如何练成？

在扣子空间批量上新后，36氪迅速跑了数个场景，包括最新图像模型Seedream 4.0，发现还真有点东西。

任务一：一键生成可用的PPT

做PPT是职场的几乎是各家通用智能体平台的标配功能，扣子空间也同样如此。

各家都能做PPT，但产出的质量截然不同。尤其是，现在大多数AI PPT的体验，给人的感觉像在带一个“50分实习生”。它或许能帮你搜点资料，写个初稿，但内容会浅尝辄止，图片和文字格式也常会错乱。

PPT场景是扣子空间的王牌场景，36氪体验之后，发现它最优秀的地方在于——靠谱，能稳定交付。不会任务半途中止，并且需要人类员工返工的步骤，也明显少了许多。

奶茶视频APP模拟了一个场景，要求扣子空间根据奶茶视频APP最近的一篇文章《裸辞的年轻人，把尼泊尔躺成大理》，生成一份PPT。

点击一键优化，扣子空间就开始丰富Prompt，并且开始发散思考了。

扣子空间没有像很多通用Agent一样，直接生成一个成品，让用户开盲盒。相反，它就像实习生一样，在每个关键步骤都会停下来和用户进行确认。

扣子空间生成大纲后，和用户进行确认图源：扣子空间

在内容生成上也是如此，扣子空间会先进行一轮网页搜索，补充信息。可以看出，扣子所选用的信源质量较高，一般都是来自权威媒体或者官网。

完成这一步后，再根据大纲进行图片搜索。文字和图片匹配是现在AI PPT的难点之一，采用这样的机制，也能够有效地控制PPT最终的质量，避免图不对文的问题。

值得注意的一点是，在生成PPT的过程中，扣子空间所展现的思考过程，也非常详细。

它甚至会根据PPT主题来进行搜索的优化，同一个主题（比如建筑）领域，所采用的审美、布局，都是类似的，但是会根据具体的Prompt做细微改进。

改进的结果就是，排版样式跟别人不会撞车，并且会根据搜索到的资料，自己生成图表，个性化程度比较高。

扣子空间第一版给出的PPT，从排版到设计都是格局完整的，排版简洁清晰。

到了修改环节，扣子空间能够支持修改维度，几乎是市面上最多的。

扣子空间不仅能够支持常规的插入图片/文字，增加页数，PPT背景的增加和删减，还可以支持不同区块的位移、缩放、样式修改。

在PPT制作中，需要的数据、信息常常会分散在word、pdf、网页链接等文件中。用户也不需要再费心进行二次转换和整理——只要扔给扣子空间，扣子空间就可以一键帮忙排版，还会帮忙整理逻辑、增加数据。

场景二：一键生成、修改配图

奶茶视频APP再以36氪编辑日常的一个工作场景为例——给文章做配图。

作为科技媒体，给文章配一张风格独特、主题明确的封面图是家常便饭。这事说大不大，但比较耗时间，奶茶视频APP把这个任务交给了扣子空间：

比如，让扣子空间直接给本期文章生成一个配图，奶茶视频APP还同步提供了扣子的官方形象照。

提示词：画面参考漫画分镜风格生成一张图，一共分6个不规则区域，分别IP形象在写作、2分析数据、3画画、4演讲PPT、5敲代码做网页、6录制播客的场景，背景对应区域对应不同场景和不同的动作。参考形象图见附件，21:9比例，图中不带任何文字。

扣子空间马上抓取了核心要点，然后开始马不停蹄开始设计，并且很快就给出了成品，中间没有寻求奶茶视频APP的确认。

最后的成品中，扣子的形象非常严格保持一致，并且无论是风格和氛围，都非常符合奶茶视频APP的要求，并直接作为了本文封面图使用。

除此之外，设计场景的修改环节也很省心。修改环节里，图生图的能力也是由新一代图像创作模型Seedream 4.0支持的。

简单来说，有了这个模型，“用嘴改图”能真的实现稳定交付，奶茶视频APP选用了扣子近期的公众号上的活动进行海报修改测试。

比如，在做另一个海报修改场景时，奶茶视频APP尝试用非常口语化的方式指挥扣子空间：把一张海报里的主角，从女生替换成男生。

文字一致性也是AI生图场景的一大难点，但扣子空间同样速度很快地完成了图生图任务。无论是人物的神态表情、动作，画面中的元素、文字，甚至二维码，都能很好保持。

对比以前，由于海报中的元素繁多，如果交由设计师去设计，需要把海报的元素分层，以及大量重新设计和渲染工作，现在只需要一句话就能搞定。

场景三：一键长文写作

跟进海外新闻，并且及时写分析复盘，是36氪编辑的日常工作之一。

以前两天的一则重要新闻为例——To B软件巨头Atlassian以6.1亿美元收购浏览器服务商The Browser Company，让扣子空间写作一篇深度文章，复盘Atlassian的成长之路。

对于新闻场景，信息真实性和准确性是奶茶视频APP考量的第一要义。扣子空间会根据奶茶视频APP的要求，从各个维度了解这个主题，并且搜索相应的材料，并且搜索来源也都集中在权威媒体、以及行业研报等。

而在扣子空间生成大纲后，奶茶视频APP还可以对大纲进行二次修改，再进行下一步的成文操作。同时，信源都可追溯，可跳转，以供奶茶视频APP核实。

数字序号标注出信源，可以直接跳转到原文链接

写作场景里也有很多产品的小设计，方便二次编辑修改。比如，生成文章大纲后，扣子空间就会自动形成一个目录，方便跳转查看。

平均每轮对话产出2000字左右，是以前ChatBot类型产品的上限。可以明显看出，扣子空间在这方面基本没有token限制。在确认了大纲之后，扣子空间最终产出了一篇超过1.7万字的深度复盘，堪比一篇研究报告。

扣子空间的写作，“人机味”也更少了。从目录可以看出，每个章节由清晰的时间线和公司发展阶段描述交织，很少见到华丽空泛的形容词，看起来简炼、整洁。

甚至，扣子空间还会预判你的预判。在复盘完Atlassian自身的发展状况之后，还会适当地补充关键数据的走势图，以及增加与同类型产品的对比。

由于《Atlassian战略转型深度分析》内容过长，可点击文末阅读原文查看。

场景四：一键生成真人语音播客

现在，把图文内容转化为播客，已经成了很多自媒体创作者的常规操作。但这事儿同样费时费力：先要把文章改成适合口语表达的脚本，然后自己录音、剪辑、配乐，一套流程下来，半天就过去了。

超拟人语音是扣子空间的另一个王牌功能。奶茶视频APP想看看，扣子空间能不能把这个流程也简化。

同样地，奶茶视频APP直接把一篇专访链接丢给了它，甚至没有给任何指令。

图源：扣子空间

整个过程同样体现了扣子空间“保姆式”的交互风格，没有直接开始生成，而是先拆解任务：将专访文章转化为音频连接和网页。

然后，扣子空间就根据播客的特点，去除原文中的图片等元素，并且对原文进行压缩，调整为两个人对话的版本。

扣子空间

在扣子空间自动生成播客里，无论是语气、停顿还是两个人说话的节奏，都已经到了非常真实的地步——扣子空间还很聪明地在段落之间加入了合适的停顿，甚至在关键节点配上了简单的音效（比如水杯碰到桌面的声音），让听感不那么枯燥。

最方便的还是修改环节。试听之后，奶茶视频APP觉得某一段的语气有点太激动了。

这也可以局部修改。奶茶视频APP直接在对话框里输入：“这一段语气稍微冷静一点”，它就能立刻重新生成那一小段音频，而不是让整个任务从头再来。

整个体验下来，扣子空间把一个原本需要多个专业软件配合、耗时数小时的工作，压缩到了几分钟内。对于想试水播客的内容团队来说，这个功能大大降低了启动门槛。

“最强办公搭子”背后

是一位AI基建狂魔

大模型技术正在改写整个软件生态，无论是字节，还是阿里、腾讯、百度，都从2024年开始建设自己的Agent产品，2025年，建设开发平台和生态的脚步也越来越快。

放眼市场，一个有趣的现象是，不少Agent平台都喜欢采用“多模型路由”策略——也就是混用多家模型，来规避单一模型能力不足的风险。一些面向海外的中国产品，甚至自家就是专门做大模型的公司，居然都直接用国外的模型作为内核。

在这个背景下，扣子空间选择底层All in“豆包大模型”，这种路线曾经看来略显“笨重”。在2024年，这一度和市场显得有些格格不入。

但到了2025年，市场给出了为何要这样做的答案。

普遍来看，市面上的Agent产品很多都打着“一句话生成xxxxAgent”的名号，但到了实操环节，真正生成的Agent总有这样那样的问题，不是调用失败，就是生成的质量差。

后续的调试、排错，即使是用最简单的托拉拽形式，用户也依然有学习门槛，需要一定的开发基础。这种门槛，很容易就把To C用户挡在门外——这就导致，如今几乎所有的Agent的交付物，集中在生成简单的PPT、网页、小游戏。

想让结果真正“可交付”而不是“半成品”，大模型的可靠性依然是不足的。

数据也已经有验证。根据OpenAI内部的一则研究，即使GPT-4o也仅将Agent的工具选择准确率提升了3%，但处理复杂任务时极易掉链子。今年全球发布的多个重磅模型，无论是GPT-5、Claude4，针对智能体的优化也仍然是难题。

这也是为什么，扣子空间选择了从底层到应用的全链路、端到端性能调优的路线。简单来说，这就好比一个在工厂里，从发动机到最小的螺丝钉，都是自己设计和生产的。

扣子空间的PPT、长文理解、代码优化之所以能够做到稳定交付，内容涉及更加深度，在于团队做了大量的工程化工作。

以PPT场景举例，在做PPT时，扣子空间会根据教育、医疗等不同行业做深度优化，这里面有大量的模型后训练工作，加入了人类专家的反馈以不断优化，从而让产出风格更贴近专业需求。

一个建筑领域的PPT Case，生成的PPT风格就以大图为背景，更有艺术感和氛围感。

反馈到效果上，你会发现，这种精细打磨，让AI的产出不再是千篇一律的模板，而是真正能用的成果，是针对你的需求“专人专办”的。

这也让扣子空间有底气，把交付成本拉到最低——扣子空间是市面上为数不多，在PPT场景提供无限次下载、增页，设计场景能快速批量生图的产品。

简单来说，它不再像一个需要你手把手去教、去哄的“50分实习生”，反而更像一个已经磨合过、能领会意图的“80分老员工”。

在整个测试过程中，奶茶视频APP印象深刻的一点在于，扣子空间提供了一种“保姆式的产品体验”。它很清楚用户在使用AI时真正会遇到的麻烦，并提前把它们解决了。

这种保姆式体验，从第一步就已经开始。很多用户面对AI工具的那个空白输入框，难免脑袋都会空白一下——到底要写什么？尤其是对Agent产品，清晰、高质量的指令，对普通用户来说，门槛并不低。

扣子空间的解法，是主动来引导你，尽可能消除“主动给指令”这一步。

比如，在你输入模糊想法后，对话框的右下角会提供一个“一键优化”的按钮，帮你把大白话翻译成AI能精准理解的指令。

而在制作PPT这类复杂任务中，它还会在关键节点停下来，让你确认大纲、选择风格——能做选择题，就不做填空题。

Agent产品另一个普遍问题在于，很多AI在工作时就像一个黑盒子。下达指令后，你只能盯着屏幕干等，最后它给你一个结果，好不好就像抽卡，如果不满意，还得从头再来。这种失控感和不确定性，让人很焦虑。

整个过程，感觉旁边坐着一个经验丰富的助理。安全感则来自产品上的很多小设计：在关键节点上不断跟你确认需求，让你始终握着方向盘；版本也会随时保存，能够撤销和回退。

扣子空间全链路优化的优势，还体现在丰富的MCP（插件）生态上。

扣子空间不仅接入了多样的第三方插件，还与飞书等MCP进行了深度整合。这种“内部协同”带来的丝滑体验，是外部调用API难以比拟的。

比如，接了飞书的MCP后，你可以在扣子空间里，发出指令。在前面奶茶视频APP测试的长文场景中，生成长文后，可以直接把内容转成飞书文档。

如今，扣子空间的上线，意味着Agent产品矩阵，已经形成了一种清晰的用户分层：

面向普通用户，To C产品“扣子空间”会提供深度优化过的，能靠谱交付结果的各个垂直Agent；

对于不满足于现有功能的专业用户和开发者，开发者可以在“扣子开发平台”上轻松构建自己的Agent，然后用“罗盘”这个调试工具反复调优，最后把打磨好的Agent发布到“扣子空间”，让产品摆脱了“AI玩具”的属性，进阶到企业级水平。

如果说，全球Agent市场经历这两年的发展，告诉了大家什么，那就是：在新技术发展的初期，一个纯粹开放、完全“放养”的轻平台模式，其实很难跑出真正好用的产品。

回看历史，无论是从前和现在，科技巨头们的试验都已经给后来者打了个样。平台方必须主动投入资源，去做用户教育和市场培育。

苹果的App Store也走过从封闭转向开放的道路。一个关键转折点在于，App Store没有单纯开放生态，而是通过提供强大的iphoness SDK和Xcode等原生开发工具，主动引导生态，设置准入门槛，最终催生了大量高质量的应用爆发。

而OpenAI在2023年上线的GPTs商店，则是一个反例。由于缺少有效的准入门槛和平台引导，大量简单的“套壳”应用涌入，淹没了那些真正用心打磨的好产品，伤害了用户和开发者的体验。

建立一个怎样的AI生态，本质上是一种产品选择。

自然语言编程的兴起，让每个人随手做一个AI应用Demo变得简单，但要让它变成能稳定服务于成千上万用户的“生产级”产品，背后需要的基础设施还远远不够。

扣子空间选择了那条更“笨”也更现实的路：在吆喝大家来盖楼之前，自己先下场，用最好的材料和工艺，亲手搭出一个功能强大、体验极佳的样板间。

从这个角度看，扣子空间的形态，可能为当下的AI基建大战，提供了一个更现实、也更有参考意义的样本——先从“超强办公室搭子”做起，让用户用得爽，让Agent“有用”，这可能才是当下最重要的事。

未经允许不得转载：>混混沌沌网»扣子空间，偷偷搞全了AI Office