Warning: mkdir(): No space left on device in /www/wwwroot/zhenghe1718.com/func.php on line 127

Warning: file_put_contents(./cachefile_yuan/jnsjmc.com/cache/1f/eab80/35ed5.html): failed to open stream: No such file or directory in /www/wwwroot/zhenghe1718.com/func.php on line 115
扣子空间,偷偷搞全了AI Office

混混沌沌网混混沌沌网

扣子空间,偷偷搞全了AI Office

你的下一个Office,不一定要是Office。

但凡稍微关注点AI圈子,2025年你看到最多的关键词,会是什么?

Agent(智能体)绝对榜上有名。

2025年还没过完,市面上的AI Agent产品已经大爆发到让人眼花缭乱——从能帮你写代码的、画画的,到能帮你订机票、做规划的,选择琳琅满目。

但它们普遍又是面目模糊的。通用的AI Agent好像什么都能干,但什么都干得不精;而很多垂类Agent,哪怕如vibe coding这样场景明确,又高度标准化的场景,真正用起来也会在某个环节卡壳,比如指令理解生硬,需要多轮交互修改代码——对小白用户而言,这不可持续。

字节跳动旗下的“扣子空间”,希望能够给出一种新的解法。9月3日,扣子空间(Coze Space)进行了一次大版本升级,以及上线了AI Excel等重磅新功能。

来源:扣子空间

“扣子空间”是一个通用智能体平台,在今年4月上线。在内测阶段,“扣子空间”就已经爆火,一码难求。

自此之后,扣子空间一直在更新迭代,近期更是频频升级:9月3日正式推出AI Excel能力之后,AI设计版块也开始内测豆包图像创作模型Seedream 4.0模型,带来了多图融合、图像修改等能力的又一次升级。

在完成最近的功能更新之后,36氪发现扣子空间的定位也进行了一次刷新:一站式AI办公空间——你的下一代办公空间,可能真的不一定是Office。

简单来说,扣子空间要面向的是几乎所有有学习和工作需求的C端用户。今天,当奶茶视频APP再分析扣子空间的能力时,可以发现它已经覆盖了AI写作、AI PPT、AI设计、AI Excel、AI网页、AI播客。

从2024年上线以来,扣子的变化轨迹清晰可见:从一个To C的智能体生态,逐步完善AI基建,接入丰富多元的MCP广场。

2024年被称为Agent元年,直到2025年,Agent才开始逐步落地。可以说,年初Manus的爆火,彻底打开了Agent市场,但要真正让每一个人都用上Agent,依旧还有很长的路要走。

如今Agent也走到了这样的岔路口。

“最后一公里”,几乎是每一代的技术浪潮中的公司,都会提到并希望解决的问题。以上一代AI技术的发展过程为例,传统模型参数规模小,识别、OCR、TTS等单点算法只能在特定场景产生价值,企业上线时必须做大量系统集成、数据标注、流程再造。结果就是,每一个新客户就意味着一次新版本的深度定制。

扣子空间的目标,不只是做一堆工具的简单集合,而更像是一个打通了普通用户、开发者和企业三方的完整生态。就在不久前的7月,扣子也宣布将另外两个产品——扣子开发平台(Coze Studio)和扣子罗盘(Coze Loop),开源至GitHub。

如果说,“扣子空间”要让路人都能轻松用AI完成学习、工作的产品;那么“扣子开发平台”和“扣子罗盘”,就是为开发者提供了一整套“AI工具台”。

归根结底,扣子要解决的问题只有一个:让Agent真能用,真落地。扣子空间在其中扮演的角色,就是让每个普通人都能以最简单的方式,轻松用AI完成学习、工作的产品。

从50分到80分,靠谱AI实习生如何练成?

在扣子空间批量上新后,36氪迅速跑了数个场景,包括最新图像模型Seedream 4.0,发现还真有点东西。

任务一:一键生成可用的PPT

做PPT是职场的几乎是各家通用智能体平台的标配功能,扣子空间也同样如此。

各家都能做PPT,但产出的质量截然不同。尤其是,现在大多数AI PPT的体验,给人的感觉像在带一个“50分实习生”。它或许能帮你搜点资料,写个初稿,但内容会浅尝辄止,图片和文字格式也常会错乱。

PPT场景是扣子空间的王牌场景,36氪体验之后,发现它最优秀的地方在于——靠谱,能稳定交付。不会任务半途中止,并且需要人类员工返工的步骤,也明显少了许多。

奶茶视频APP模拟了一个场景,要求扣子空间根据奶茶视频APP最近的一篇文章《裸辞的年轻人,把尼泊尔躺成大理》,生成一份PPT。

点击一键优化,扣子空间就开始丰富Prompt,并且开始发散思考了。

扣子空间没有像很多通用Agent一样,直接生成一个成品,让用户开盲盒。相反,它就像实习生一样,在每个关键步骤都会停下来和用户进行确认。

扣子空间生成大纲后,和用户进行确认 图源:扣子空间

在内容生成上也是如此,扣子空间会先进行一轮网页搜索,补充信息。可以看出,扣子所选用的信源质量较高,一般都是来自权威媒体或者官网。

完成这一步后,再根据大纲进行图片搜索。文字和图片匹配是现在AI PPT的难点之一,采用这样的机制,也能够有效地控制PPT最终的质量,避免图不对文的问题。

值得注意的一点是,在生成PPT的过程中,扣子空间所展现的思考过程,也非常详细。

它甚至会根据PPT主题来进行搜索的优化,同一个主题(比如建筑)领域,所采用的审美、布局,都是类似的,但是会根据具体的Prompt做细微改进。

改进的结果就是,排版样式跟别人不会撞车,并且会根据搜索到的资料,自己生成图表,个性化程度比较高。

扣子空间第一版给出的PPT,从排版到设计都是格局完整的,排版简洁清晰。

到了修改环节,扣子空间能够支持修改维度,几乎是市面上最多的。

扣子空间不仅能够支持常规的插入图片/文字,增加页数,PPT背景的增加和删减,还可以支持不同区块的位移、缩放、样式修改。

在PPT制作中,需要的数据、信息常常会分散在word、pdf、网页链接等文件中。用户也不需要再费心进行二次转换和整理——只要扔给扣子空间,扣子空间就可以一键帮忙排版,还会帮忙整理逻辑、增加数据。

场景二:一键生成、修改配图

奶茶视频APP再以36氪编辑日常的一个工作场景为例——给文章做配图。

作为科技媒体,给文章配一张风格独特、主题明确的封面图是家常便饭。这事说大不大,但比较耗时间,奶茶视频APP把这个任务交给了扣子空间:

比如,让扣子空间直接给本期文章生成一个配图,奶茶视频APP还同步提供了扣子的官方形象照。

提示词:画面参考漫画分镜风格生成一张图,一共分6个不规则区域,分别IP形象在写作、2分析数据、3画画、4演讲PPT、5敲代码做网页、6录制播客的场景,背景对应区域对应不同场景和不同的动作。参考形象图见附件,21:9比例,图中不带任何文字。

扣子空间马上抓取了核心要点,然后开始马不停蹄开始设计,并且很快就给出了成品,中间没有寻求奶茶视频APP的确认。

最后的成品中,扣子的形象非常严格保持一致,并且无论是风格和氛围,都非常符合奶茶视频APP的要求,并直接作为了本文封面图使用。

除此之外,设计场景的修改环节也很省心。修改环节里,图生图的能力也是由新一代图像创作模型Seedream 4.0支持的。

简单来说,有了这个模型,“用嘴改图”能真的实现稳定交付,奶茶视频APP选用了扣子近期的公众号上的活动进行海报修改测试。

比如,在做另一个海报修改场景时,奶茶视频APP尝试用非常口语化的方式指挥扣子空间:把一张海报里的主角,从女生替换成男生。

文字一致性也是AI生图场景的一大难点,但扣子空间同样速度很快地完成了图生图任务。无论是人物的神态表情、动作,画面中的元素、文字,甚至二维码,都能很好保持。

对比以前,由于海报中的元素繁多,如果交由设计师去设计,需要把海报的元素分层,以及大量重新设计和渲染工作,现在只需要一句话就能搞定。

场景三:一键长文写作

跟进海外新闻,并且及时写分析复盘,是36氪编辑的日常工作之一。

以前两天的一则重要新闻为例——To B软件巨头Atlassian以6.1亿美元收购浏览器服务商The Browser Company,让扣子空间写作一篇深度文章,复盘Atlassian的成长之路。

对于新闻场景,信息真实性和准确性是奶茶视频APP考量的第一要义。扣子空间会根据奶茶视频APP的要求,从各个维度了解这个主题,并且搜索相应的材料,并且搜索来源也都集中在权威媒体、以及行业研报等。

而在扣子空间生成大纲后,奶茶视频APP还可以对大纲进行二次修改,再进行下一步的成文操作。同时,信源都可追溯,可跳转,以供奶茶视频APP核实。

数字序号标注出信源,可以直接跳转到原文链接

写作场景里也有很多产品的小设计,方便二次编辑修改。比如,生成文章大纲后,扣子空间就会自动形成一个目录,方便跳转查看。

平均每轮对话产出2000字左右,是以前ChatBot类型产品的上限。可以明显看出,扣子空间在这方面基本没有token限制。在确认了大纲之后,扣子空间最终产出了一篇超过1.7万字的深度复盘,堪比一篇研究报告。

扣子空间的写作,“人机味”也更少了。从目录可以看出,每个章节由清晰的时间线和公司发展阶段描述交织,很少见到华丽空泛的形容词,看起来简炼、整洁。

甚至,扣子空间还会预判你的预判。在复盘完Atlassian自身的发展状况之后,还会适当地补充关键数据的走势图,以及增加与同类型产品的对比。

由于《Atlassian战略转型深度分析》内容过长,可点击文末阅读原文查看。

场景四:一键生成真人语音播客

现在,把图文内容转化为播客,已经成了很多自媒体创作者的常规操作。但这事儿同样费时费力:先要把文章改成适合口语表达的脚本,然后自己录音、剪辑、配乐,一套流程下来,半天就过去了。

超拟人语音是扣子空间的另一个王牌功能。奶茶视频APP想看看,扣子空间能不能把这个流程也简化。

同样地,奶茶视频APP直接把一篇专访链接丢给了它,甚至没有给任何指令。

图源:扣子空间

整个过程同样体现了扣子空间“保姆式”的交互风格,没有直接开始生成,而是先拆解任务:将专访文章转化为音频连接和网页。

然后,扣子空间就根据播客的特点,去除原文中的图片等元素,并且对原文进行压缩,调整为两个人对话的版本。

扣子空间

在扣子空间自动生成播客里,无论是语气、停顿还是两个人说话的节奏,都已经到了非常真实的地步——扣子空间还很聪明地在段落之间加入了合适的停顿,甚至在关键节点配上了简单的音效(比如水杯碰到桌面的声音),让听感不那么枯燥。

最方便的还是修改环节。试听之后,奶茶视频APP觉得某一段的语气有点太激动了。

这也可以局部修改。奶茶视频APP直接在对话框里输入:“这一段语气稍微冷静一点”,它就能立刻重新生成那一小段音频,而不是让整个任务从头再来。

整个体验下来,扣子空间把一个原本需要多个专业软件配合、耗时数小时的工作,压缩到了几分钟内。对于想试水播客的内容团队来说,这个功能大大降低了启动门槛。

“最强办公搭子”背后

是一位AI基建狂魔

大模型技术正在改写整个软件生态,无论是字节,还是阿里、腾讯、百度,都从2024年开始建设自己的Agent产品,2025年,建设开发平台和生态的脚步也越来越快。

放眼市场,一个有趣的现象是,不少Agent平台都喜欢采用“多模型路由”策略——也就是混用多家模型,来规避单一模型能力不足的风险。一些面向海外的中国产品,甚至自家就是专门做大模型的公司,居然都直接用国外的模型作为内核。

在这个背景下,扣子空间选择底层All in“豆包大模型”,这种路线曾经看来略显“笨重”。在2024年,这一度和市场显得有些格格不入。

但到了2025年,市场给出了为何要这样做的答案。

普遍来看,市面上的Agent产品很多都打着“一句话生成xxxxAgent”的名号,但到了实操环节,真正生成的Agent总有这样那样的问题,不是调用失败,就是生成的质量差。

后续的调试、排错,即使是用最简单的托拉拽形式,用户也依然有学习门槛,需要一定的开发基础。这种门槛,很容易就把To C用户挡在门外——这就导致,如今几乎所有的Agent的交付物,集中在生成简单的PPT、网页、小游戏。

想让结果真正“可交付”而不是“半成品”,大模型的可靠性依然是不足的。

数据也已经有验证。根据OpenAI内部的一则研究,即使GPT-4o也仅将Agent的工具选择准确率提升了3%,但处理复杂任务时极易掉链子。今年全球发布的多个重磅模型,无论是GPT-5、Claude4,针对智能体的优化也仍然是难题。

这也是为什么,扣子空间选择了从底层到应用的全链路、端到端性能调优的路线。简单来说,这就好比一个在工厂里,从发动机到最小的螺丝钉,都是自己设计和生产的。

扣子空间的PPT、长文理解、代码优化之所以能够做到稳定交付,内容涉及更加深度,在于团队做了大量的工程化工作。

以PPT场景举例,在做PPT时,扣子空间会根据教育、医疗等不同行业做深度优化,这里面有大量的模型后训练工作,加入了人类专家的反馈以不断优化,从而让产出风格更贴近专业需求。

一个建筑领域的PPT Case,生成的PPT风格就以大图为背景,更有艺术感和氛围感。

反馈到效果上,你会发现,这种精细打磨,让AI的产出不再是千篇一律的模板,而是真正能用的成果,是针对你的需求“专人专办”的。

这也让扣子空间有底气,把交付成本拉到最低——扣子空间是市面上为数不多,在PPT场景提供无限次下载、增页,设计场景能快速批量生图的产品。

简单来说,它不再像一个需要你手把手去教、去哄的“50分实习生”,反而更像一个已经磨合过、能领会意图的“80分老员工”。

在整个测试过程中,奶茶视频APP印象深刻的一点在于,扣子空间提供了一种“保姆式的产品体验”。它很清楚用户在使用AI时真正会遇到的麻烦,并提前把它们解决了。

这种保姆式体验,从第一步就已经开始。很多用户面对AI工具的那个空白输入框,难免脑袋都会空白一下——到底要写什么?尤其是对Agent产品,清晰、高质量的指令,对普通用户来说,门槛并不低。

扣子空间的解法,是主动来引导你,尽可能消除“主动给指令”这一步。

比如,在你输入模糊想法后,对话框的右下角会提供一个“一键优化”的按钮,帮你把大白话翻译成AI能精准理解的指令。

而在制作PPT这类复杂任务中,它还会在关键节点停下来,让你确认大纲、选择风格——能做选择题,就不做填空题。

Agent产品另一个普遍问题在于,很多AI在工作时就像一个黑盒子。下达指令后,你只能盯着屏幕干等,最后它给你一个结果,好不好就像抽卡,如果不满意,还得从头再来。这种失控感和不确定性,让人很焦虑。

整个过程,感觉旁边坐着一个经验丰富的助理。安全感则来自产品上的很多小设计:在关键节点上不断跟你确认需求,让你始终握着方向盘;版本也会随时保存,能够撤销和回退。

扣子空间全链路优化的优势,还体现在丰富的MCP(插件)生态上。

扣子空间不仅接入了多样的第三方插件,还与飞书等MCP进行了深度整合。这种“内部协同”带来的丝滑体验,是外部调用API难以比拟的。

比如,接了飞书的MCP后,你可以在扣子空间里,发出指令。在前面奶茶视频APP测试的长文场景中,生成长文后,可以直接把内容转成飞书文档。

如今,扣子空间的上线,意味着Agent产品矩阵,已经形成了一种清晰的用户分层:

面向普通用户,To C产品“扣子空间”会提供深度优化过的,能靠谱交付结果的各个垂直Agent;

对于不满足于现有功能的专业用户和开发者,开发者可以在“扣子开发平台”上轻松构建自己的Agent,然后用“罗盘”这个调试工具反复调优,最后把打磨好的Agent发布到“扣子空间”,让产品摆脱了“AI玩具”的属性,进阶到企业级水平。

如果说,全球Agent市场经历这两年的发展,告诉了大家什么,那就是:在新技术发展的初期,一个纯粹开放、完全“放养”的轻平台模式,其实很难跑出真正好用的产品。

回看历史,无论是从前和现在,科技巨头们的试验都已经给后来者打了个样。平台方必须主动投入资源,去做用户教育和市场培育。

苹果的App Store也走过从封闭转向开放的道路。一个关键转折点在于,App Store没有单纯开放生态,而是通过提供强大的iphoness SDK和Xcode等原生开发工具,主动引导生态,设置准入门槛,最终催生了大量高质量的应用爆发。

而OpenAI在2023年上线的GPTs商店,则是一个反例。由于缺少有效的准入门槛和平台引导,大量简单的“套壳”应用涌入,淹没了那些真正用心打磨的好产品,伤害了用户和开发者的体验。

建立一个怎样的AI生态,本质上是一种产品选择。

自然语言编程的兴起,让每个人随手做一个AI应用Demo变得简单,但要让它变成能稳定服务于成千上万用户的“生产级”产品,背后需要的基础设施还远远不够。

扣子空间选择了那条更“笨”也更现实的路:在吆喝大家来盖楼之前,自己先下场,用最好的材料和工艺,亲手搭出一个功能强大、体验极佳的样板间。

从这个角度看,扣子空间的形态,可能为当下的AI基建大战,提供了一个更现实、也更有参考意义的样本——先从“超强办公室搭子”做起,让用户用得爽,让Agent“有用”,这可能才是当下最重要的事。

赞(1768)
未经允许不得转载:>混混沌沌网»扣子空间,偷偷搞全了AI Office