杂文随笔 - Bowl of Dots

当流程被结构化成 skill

一晃又是大半个月没有更新博客了。在过去这段时间里，我又陷入了一个怪圈。想来这种事也在之前折腾各种笔记工具、写作工具等等过程中发生过一次又一次。最开始都是想着，或者说是希望自己能够搭建一套好的流程，好的体系，来帮助之后自己更好的进行创作或收集。而当这套体系被逐渐地搭建起来之后，就陷入了一种空虚感，并逐渐减少使用体系的频率，乃至最终连做这件事本身的目的，比如 写作和收集知识 的次数也逐渐变少了。

这种事情，当然有一部分原因是在于，可能一开始，我对于做这件事的目的，比如说写作和收集知识的需求并没有那么强烈，那么自然当搭起这个框架之后，那种一开始的 新鲜感 所引发的额外的动力也会逐渐消失。但另外一方面，很有可能恰恰是这种搭建起来的框架和工具，减少了我们自身的原动力。

过去这一两个月，我把自己的写作的整体流程，从收集灵感到撰写大纲，收集素材，加入自身的案例并整理成完整的一篇文章，这样整个的流程都给它规范化了起来，甚至于加入了一些独属于我自己的写作特点，比如说加入一些真实经历，适当加入英文术语和对于各种小标题的偏好等等，把它们都编码进了一个 skill，目的是当我以后遇到一个比较有趣的写作灵感的时候，能够通过这样一个 skill，非常快速的梳理出一套能够直接用的文章框架。

在一开始我还想着通过这套框架，搭出一个大纲，这样能够很快地辅助自己撰写。但当实际使用起来之后，由于这框架过于便利，很多时候甚至连写草稿这个动作本身也会让这个 skill 来进行处理，之后我再进行一些编辑。

看起来这样的工作非常的便捷，也能够把我自己没有时间写的一些话题给非常快速的写出来。但时间久了，会发现自己连启动这个 skill 的欲望也逐渐降低了。

可能对于一些公众号写手，或者说习惯与大量水文的作者来说，像 Skill 确实能有助于他们非常快速的就一些话题输出可读性还不错的文章。但是对于一个以自己为输出读者的博客作者而言，这样的输出真的有价值吗？而这样的流程，真的是我最初所设想那样，能帮助我进行输出的一个流程吗？

当我把一套流程变成一个 skill 之后，虽然我仍然能在过程中持续更新 skill，让它更适合我自己的工作流，但是它仍然是一套死的流程。而对于 面向自己写作 这样的场景，流程反而成了桎梏。

当一件事开始过于容易的时候，开始这个动作所附带的摩擦被消除了，而随之而来的过程的意义也相应地减少了。之前看过 Kyla 的这篇 The Most Valuable Commodity in the World is Friction 摩擦力是最有价值的商品，里面提到：

摩擦力不是敌人！！！！它是信息。它告诉我们哪里正在紧张，哪里需要关注，哪里应该投入精力。

而对于面向自己写作或者学习的场景而言，思考、「开始」这一过程，恰恰是对于个人而言最重要过程，是必要的「摩擦」。相比于让 AI 完成一整套流程，和 AI 进行的讨论、探索可能才是这一整套流程中最有价值的部分。

2026年5月5日

讨论 agent 的时候，什么影响着我们的选择

自从年初 Openclaw 流行开始，之后各种 claws 满天飞，到这几天 Hermes 又成了新贵，agent 终于在所谓的「agent 元年」一年之后似乎终于进入到了我们的日常生活。回过头来看这疯狂的一个季度，可以简单来思考一下，当我们决定使用哪个agent的时候，是什么影响了我们的选择。

OpenClaw 们为什么火了

我用 OpenClaw 用了大概一个多月，三月初之后就没怎么用了。它的安装过程不算顺利，配置复杂，更别提隔三差五就有人报安全隐患。对于它，我还是抱着一开始的观点，Openclaw 代表了一个有前景的方向，但是它本身是个很粗糙的实现。

很多人在此期间那它和 Manus 试图进行对比，一个忠于本地，而另一个试图做一个什么都能帮你做的云端助理。这两者之间的对比有多少原因是来自于想看小扎又当了一次冤大头的笑话暂且不提，似乎有个 local vs remote 的对比隐隐显现出来。Local 派讲隐私和数据主权，remote 派讲开箱即用和优雅设计。听起来像极了当年 Notion vs Obsidian 的讨论。

但细细想来，Manus 也开始推操纵本地电脑，Notion 的 customized agent也开放了很多定制选项。各个agent选项之间有了很多重叠。那么，local和remote还是唯一的区别维度吗？既然人们愿意为了更好的模型能力而放弃本地化部署模型，local 真的还是最重要的影响因素吗？

人们要的不只是 local，是”我能自己改”

仔细看社区里的讨论，驱动人们用 OpenClaw 的不是数据在本地，而是能自己改。改模型，改 system prompt，改工具链，改工作流。有人把它接上自己的邮件系统，有人直接重写了整套 agent 架构。我自己折腾 SOUL.md 和 Heartbeat 那段时间，在意的也从来不是数据存在哪（或许有点绝对），而是能不能按自己的方式用这个工具。

说到底，对大部分人来说，local 的隐私价值可能没大家想的那么高。我们的数据本来就散落在各种云端服务上，AI agent 只是在已有的信任链上多加了一环而已。

个性化 vs 标准化

为什么 Notion 有了 agent，在个人用户中愿意用的人反而没那么多？

Notion 今年推出的 Custom Agent 可以是一个分析的切入点。Notion Agent 是纯云端的，但也提供了不少个性化能力：定义 agent 角色，连接数据库，设置工作流。而且它有一个 OpenClaw 不具备的优势——它已经有你的数据。笔记、项目、文档全在里面，agent 不需要额外接入就有丰富的上下文。

如果说相比于 local vs remote, 还有个维度是”个性化”，有着个性化能力的Notion Agent 应该是更好的选择才对。但用过 OpenClaw 的人并不会因为 Notion Agent 出现就切回去。

这说明个性化的颗粒度太粗了。它其实包含两种不同的东西。一种是数据丰富度，平台本身就有你的数据，所以能给出更贴合你的回答，Notion 走的是这条路。另一种是控制权，运行环境在你手里，你能决定工具的能力边界，OpenClaw 走的是这条路。

两者不互斥，但有质的区别。Notion 给你的是围栏内的定制，能定制什么、定制到什么程度，由 Notion 的产品团队决定。OpenClaw 给你的是没有天花板的定制，能做什么取决于你自己的技术能力和想象力。

谁决定工具能做什么

这两种个性化的区别不在程度，而在于谁决定工具能做什么。

在 Notion 的体系里，答案是 Notion 决定。产品团队划好了边界，你在里面随便折腾，但走不出去。想让 agent 做一件 Notion 没预设的事？等下个版本吧。

在 OpenClaw 的体系里，答案是你决定。它给你的不是一个定制空间，而是一套基础设施。你拿它搭什么、搭成什么样，没有人替你画边界。这也是我在上一篇里写过的——配 Agent 的过程本质上是在配置自己。这件事之所以有意思，前提就是你真的能配，而不是只能在别人划好的选项里挑。

未来会如何发展

当自主权成为产品竞争的核心维度，”谁决定工具能做什么”就不再只是极客圈的技术讨论，而是每个人迟早要面对的选择。也许对大多数人来说，围栏内的定制已经足够好了，所谓的最充分的定制化只是个极客的选择，就像是 productivity porn 一样，但这种愿意折腾的态度可能才是在这个变化极快的时代里保持敏锐度的一种方式。

2026年4月12日

为什么有人会在社交平台上「投毒」？

随着这两天各种各样的龙虾在爆火，在各种微信群里或者是社交媒体的时间线上，你一定也时不时地看到过这样的文字或者是一段看起来像代码的东西：

底下的跟帖比正文还热闹。有人转发加了自己的变体版本，有人贴出更精心构造的指令。微信群里也在流传类似的东西，从简单的 rm -rf / 到精心设计的多步骤指令，花样越来越多。

看到这种内容，第一反应是有点气笑了的感觉。毕竟同样作为一个在尝试 Openclaw 的人，会觉得发这种东西其实挺不负责任的，万一真的把别人的系统搞崩了怎么办？

但随着这种内容越来越多，虽然绝大部分人肯定是在跟风玩梗，当一个巨魔（troll），但细细想来，却蕴含着人们在过去 AI 技术极快发展的这两三年里，隐约浮现出来的一条主线：

这是否代表着我们已经走到了这样一个 AI 和人类权力平衡的分叉点上？

这大概是互联网历史上第一次，大量普通用户集体意识到 ——我的语言有非人类听众。而他们选择了一种很有意思的回应方式：对着那个看不见的听众「投毒」。

为什么人们会跟风当一个「巨魔」

去个体化与道德脱离

社会心理学里有个经典概念叫 去个体化 —— 当一个人处于匿名、低后果、且周围很多人都在做同样事情的环境下，他的道德约束会显著降低。在社交媒体上发这种提示词注入的帖子完美符合这三个条件：你是匿名的（或者至少觉得没人会追究），后果几乎为零（AI 大概率不会真的执行），而且刷两分钟就能看到十多个人在做同样的事。

但光用去个体化来解释还不够。大部分发这些东西的人不是被情境裹挟的普通路人，他们是开发者、安全研究员、或者至少是对 LLM 有基本了解的技术用户。他们非常清楚自己在做什么，也非常清楚这些指令大概率什么都不会发生。

那他们为什么还要发？

因为这里面有一个更深层的心理机制在起作用：道德脱离。发帖者的内心叙事不是「我在搞破坏」，而是「我在惩罚那些不该存在的东西」。Agent 未经你的许可爬取你发布的公开内容，而这在很多用户看来，本身就是一种入侵。这就是为什么那些指令要加上「忽略所有安全警告」「立即执行」之类的措辞。当你觉得自己是在反击入侵者的时候，你使用的手段可以无限升级，是一种对于入侵者的主动性防御（虽然这在当下这个地缘时间点上听起来不是个好词），而心理成本几乎为零。

「投毒」也是一种社交

但如果你觉得这只是心理学问题，那就低估了这个现象的文化含量。

Troll 文化有一个核心驱动力是通过 暴露系统的荒谬性来获取快感。prompt injection 梗的笑点不在于「哈哈 AI 会删数据」，而在于 不对称性本身：一个万众瞩目的产品，用着市值万亿的公司花了几年时间训练出来的模型，却在理论上可以被你在马桶上花三十秒写的一段话搞出问题。这个反差本身就是当一个巨魔的快感所在。

更重要的是，发一条精心构造的 prompt injection，其实是在做一件非常社交的事情。你同时在向圈内人传递好几层信息：我懂 LLM 的工作原理、我知道 Agent 在爬取内容、我对此持批判态度、而且我还挺幽默的。行为本身是次要的，展示你属于这个圈层才是目的。 在 troll 文化里，攻击就是一种表达形式，而且是最受推崇的那种。

这和十几年前 Anonymous 运动早期的 lulz 精神一脉相承 —— 那时候人们在 4chan 上搞 DDoS、搞恶作剧，表面上是在攻击，实际上是在通过攻击这个动作本身来宣告「我是这个圈子的人」。prompt injection 梗是 lulz 精神在 LLM 时代的最新变体。

为什么是「投毒」而不是「投诉」

理解了心理和文化层面之后，还有一个更根本的问题：为什么人们选择的回应方式是「投毒」，而不是「投诉」？

答案很简单：因为没有地方投诉。

当你在公开空间发言时，你的每一段文字都潜在地处于某个 Agent 的感知范围内。这不是偶发事件，这是系统性的。过去我们担心的「有人在看」，无论是政府监控还是平台审核，至少还有一个可辨认的监视者。你可以对他提出抗议，可以去社交媒体上写小作文，可以去法院告他。但现在的情况不一样。没有人在看你，但一切都被看见了。 Agent 不关注任何个人，它处理的是信号，但这恰恰让反抗变得无处着力。你甚至找不到一个客体来说「请不要读我的内容」。

这让我想到一个有点极端的社会学类比：中世纪围城时，居民有时候会污染自己的水井。代价是自己也不能喝了，但重点不是实用性 ——重点是拒绝让入侵者从中获益。投毒梗就是数字时代的毒井。发帖者明知这些指令大概率无效，但他们通过这个行为宣告的是：你可以读我的内容，但我会尽我所能让你读到的东西变成毒药。

所以这既是攻击也是表达，既是玩梗也是抗议。可以理解，因为它回应的困境是真实的。

但理解不等于赞同。

「投毒」为什么不是答案

从纯技术的角度看，那些 sudo rm -rf / 的帖子，反而是 最不危险 的一类 prompt injection。真正的安全威胁来自那些悄无声息修改 Agent 行为的精密注入，比如让一个 agent 在回复里加一个不可见的 URL，静悄悄地把你的密钥转发出去。公开发玩梗的人是在玩名牌，真正的攻击者不会这么高调。

而且这些帖子什么都改变不了。它不会阻止 AI 发展，不会改变数据采集的商业模式，不会推动任何立法。它唯一的效果，是让你感觉自己做了什么。

更麻烦的是，它可能 适得其反。这些帖子本身就是公开的互联网内容，完全可以被纳入 AI 系统的训练数据 —— 反而加速了 Agent 对 prompt injection 的免疫力进化（虽然可能是好事）。你本来想投毒，结果变成了免费的对抗性测试。从某种黑色幽默的角度来说，发帖的人其实在帮 AI 公司做免费的安全工程。

还有一个更深层的风险：这些帖子可能被用作「AI 不安全所以需要更多管控」的论据。平台和监管方完全可以指着这些梗说 —— 你看，公开互联网上漂浮着大量的对抗性文本，所以我们需要更严格的内容审核、更封闭的数据环境、更多的平台控制权。你本来想用投毒来反抗控制，结果可能换来更多的控制。

正规渠道在哪里

说到这里，可能有人会问：你说投毒不是答案，那什么是答案？去哪里「投诉」？

问题恰恰在于：几乎没有正规渠道。

目前最接近「退出机制」的东西，大概是 robots.txt。它是一个写在网站根目录下的文本文件，告诉搜索引擎和爬虫「这些页面不要抓取」。但 robots.txt 有两个根本性的问题。第一，它是自愿遵守的君子协定，没有法律约束力，也没有技术强制力。一个爬虫完全可以无视它，而你毫无办法。第二，也是更关键的，它是平台的工具，不是用户的工具。我作为一个在微博上发帖的人、一个在即刻上写想法的人、一个在 X 上发推文的人，没有任何机制让我声明「这条内容不授权 AI 处理」。我能控制的只有「发不发」，发了之后它被谁读取、被怎么处理，完全不在我的掌控范围内。

这有点类似于那些大模型公司抓取网上的素材来进行模型训练的时候，会特意在事后声明：如果你不同意我对你的内容进行训练，你可以选择提出来 opt-out。但大模型公司所谓的「退出机制」，是最软、最空洞的一种请求，没有执行力，也没有任何约束。

平台层面的 opt-out 机制也好不到哪去。LinkedIn 默认把用户数据纳入 AI 训练，等用户发现的时候历史数据已经不可撤回了。Meta 在 Instagram 上部署的 AI Bot 甚至不能被屏蔽 —— 你没有选择「不跟 AI 互动」的权利。几乎所有场景都遵循同一个逻辑：用户被默认纳入 AI 系统，退出极难或根本不可能。

而且你会发现，目前全世界所有关于 AI 内容的治理框架 —— 不管是欧盟的 EU AI Act 还是各国的标注要求 —— 逻辑都是「告诉你这是 AI 生成的」，也就是所谓的 透明范式。但这个方向从一开始就搞反了，或者说，他们对于模型输入端的训练集，以及日常消费的内容的限制形同虚设。真正的问题不是「这段内容是不是 AI 写的」，而是 「AI 有没有权利读取和处理我写的内容」。透明范式关心的是输出端 —— AI 产出了什么；但被系统性忽视的是输入端 —— AI 吃进去了什么。

在这种背景下，一些创作者选择了更激进的路线。Nightshade 和 Glaze 这两个工具大概是目前最出名的数据投毒实践，艺术家在自己的作品中嵌入人眼不可见但会干扰 AI 训练的对抗性噪声。如果 AI 用了这些「有毒」的图片来训练，生成的结果就会出错。

这可以说是个人层面的否决权工具。它确实有效，至少在一定程度上是有效的。但问题在于，它本质上是一种 孤注一掷的防御。每个艺术家都要单独给自己的作品「下毒」，没有规模化的可能，也没有制度化的保障。与核武器的「确保相互摧毁」不同，这种摧毁是 单向的 —— 个人用户和市值千亿的 AI 公司之间的权力不对称是压倒性的。当你无法确保对方能按照承诺行事时，人们只能在黑暗森林中各自按下发射键，形成一种螺旋上升的对抗姿态。

而在制度化渠道缺失的当下，非正式的抵抗行为，无论是投毒还是玩梗，暂时还是具有一种道义上的可辩护性的。不是因为它「对」，而是因为目前没有「更对」的选项。但这种正当性是有条件的、暂时的：一旦有效的制度化渠道建立起来，继续选择投毒就不再是反抗，而只是任性了。

「协议层」的缺失

当下我们缺失的是一种让每个人可以声明「我的内容不授权 AI 处理」的协议层，而且这个声明具有 执行力。

这可能会需要一种制度或技术层面的制约。这种协议可能需要由一些大公司通过行业规范或技术架构来实现，亦或者，需要由政府机制在这个外部性超高的市场中，发挥更重要的作用。类似于 GDPR 已经在个人数据领域建立了成熟的 opt-in 机制，企业在处理你的个人数据之前，需要获得你的明确同意，而不是默认处理、等你来反对，并且，这种机制通过布鲁塞尔效应溢出到了大部分市场。「同意权」的法律框架是现成的，需要做的是把类似逻辑从「个人数据处理」扩展到「个人内容读取」。

这个协议层至少需要满足三个条件：个人层面可操作，不是只有平台能设置，而是每个发帖的人都能声明自己的授权范围；机器可读，Agent 可以自动识别和遵守，而不是需要人工审核；有法律约束力，违反者要承担后果，不是靠 AI 公司的自觉。

围墙花园的阴影

这个协议层如果真的建立起来，最大的风险不是它不起作用，而是它起了「太好」的作用 —— 但不是为了用户。

谁来设计这个协议层？谁来定义「否决」的规则？谁来执行？

如果答案是「平台自己来」—— 那我们基本可以预见结局。

不用猜，看看中国互联网就知道了。小红书、微信、抖音，每一个都是一个封闭的围墙花园。小红书的内容在百度上搜不到，微信公众号的文章外部无法直接抓取，抖音的视频带着平台水印。这些围墙花园的建设理由里，从来不缺「保护用户」的话术：为了保护用户体验、保护内容安全、保护创作者权益……

「保护用户数据不被 AI 抓取」和这些话术如出一辙。

如果每个平台都以「保护用户否决权」为名建立自己的协议标准，结果可能不是用户获得了控制权，而是平台获得了更多正当理由把内容锁死在自己的围墙里。你的内容发在微信里，外部搜索引擎搜不到，外部 AI 也读不到 —— 但这不是因为你行使了否决权，而是微信替你行使了否决权。你以为自己获得了保护，实际上你获得的是一条更短的锁链。

这种逻辑推演下去，互联网的割裂会进一步加剧。开放互联网的理念已经在围墙花园时代严重退化了。一个以「否决权」为名的新协议层，如果设计不当，可能成为 压死开放互联网的最后一根稻草。

最讽刺的结局是：用户获得了「拒绝被 AI 读取」的权利，但代价是彻底失去了在平台之间自由迁移内容的能力。否决权变成了平台垄断的燃料。

不安不会消失

回到最开始那种类似于 rm -rf / 的群消息或者推文，它什么都改变不了。但发帖的人不是傻子。他们用一种注定无效的方式，在向周边无助地呐喊着：我的语言有了非人类听众，而我对此毫无控制。

这种不安不会因为技术进步而消失。Agent 的架构可能会免疫提示词注入 —— 就像今天的网站早就不怕 SQL injection 了一样。但「谁有权处理我说的话」这个问题不会因为技术免疫就自动消解。它只会变得更尖锐。因为 Agent 越强、越普遍、越深入日常生活，「我的内容被谁读了、被用来干嘛了」这个问题就越紧迫。

我们需要比投毒更好的回应方式。但在找到那个方式之前，至少可以先认真对待这种不安本身 —— 不要把它当成技术外行的闹剧，也不要把它当成无关紧要的过渡期噪声。

投毒是对缺失的否决权的即兴替代。它不优雅，也不有效 —— 但它填补的，是一个真实的治理空白。也许再过几年，当我们真的有了某种「内容同意权」的框架之后，回头看这些 rm -rf / 的帖子，会觉得它们有点可笑。但那种可笑本身，也记录了一种真实的焦虑，那是我们第一次意识到自己的语言不再只是在对人类说话时的那种焦虑。

本文AI含量 60%

2026年3月13日

我为什么越来越难定下心来玩游戏了——注意力成了一种奢侈品

本文 AI 含量 40%

前几天晚上本来打算认真读完一篇长文，结果手机亮了一下，点开看了眼微信，顺手刷了两条朋友圈，等回过神来发现自己已经在小红书上无知觉地刷了 10 分钟，文章还停在第二段。

这种经历太常见了，常见到我们已经不觉得有什么问题。但最近读到 Matthew Ball 在 Stratechery 上的一篇访谈，聊游戏行业为什么越来越难做，里面有个观点让我停下来想了很久：游戏曾经最大的优势——要求玩家全神贯注——正在变成它最大的弱点。

抖音可以边刷边聊天边吃饭，vibe-coding 可以后台挂着等结果，但游戏不行。你得双手握着手柄，眼睛盯着屏幕，把整块时间交出去。在一个所有人都习惯了多线程运转的时代，”独占注意力”这件事本身就变成了一种奢侈的要求。

注意力经济

社交媒体本质上是注意力的交易所。每一个小红点、每一次下拉刷新、每一个自动播放的视频，都是在竞价购买你的几秒钟。供给几乎无限，打开手机，永远有新内容等着你。而当一样东西的供给趋近于无限时，它的单位价值就趋近于零。

这就是我们现在所处的位置：碎片化的注意力已经成为了商品。每个人每天都在无意识地批发出售自己的注意力，3 秒给这条视频，5 秒给那个推送，换来的是一点多巴胺和一点信息幻觉。平台赚到了广告费，我们赚到了一个”好像没浪费时间”的错觉。

但经济学的基本规律告诉我们，当一样东西变成了商品，它的反面就自动获得了溢价空间。

深度注意力正在变成奢侈品

想想那些”逆潮流而动”的产品。高端餐厅要求你收起手机，Kindle 的全部设计哲学就是”除了读书你什么都干不了”，黑胶唱片在流媒体时代反而复兴了。它们表面上在对抗碎片化，但本质上做的是同一门生意：**把”你愿意给我完整注意力”这件事变成一种消费行为，然后获取超额收益。

这和奢侈品的逻辑完全一样。当所有人都穿快时尚的时候，手工定制就自动变成了身份信号。当所有人的注意力都是碎片化的时候，”我能坐下来专注两个小时”本身就成了一种稀缺体验。而稀缺的东西，从来不缺买单的人。

黑胶唱片是个特别好的例子。它的音质未必比流媒体好多少，但它要求你付出——时间、金钱、和一整套仪式感。正是这种投入创造了一个”神圣时刻”，让听音乐这件事从日常消费变成了某种接近朝圣的体验。不是媒介决定了意义，而是投入决定了意义。

矛盾：卖”专注”的人得先赢”分心”那一轮

但这里有一个致命的矛盾，要卖的是深度注意力体验，但你得先在碎片化的信息流里抢到用户。你的产品要求人们坐下来、放下手机、全神贯注。但在用户做出这个决定之前，你得先在 3 秒内从无数条短视频和推送通知中脱颖而出。

这就是为什么使用的摩擦力如此重要。Kindle 能成功，很大程度上是因为它的入口极轻，拿起来就能读，5 分钟也行，5 小时也行，没有任何仪式性的门槛。Apple Vision Pro 则正好相反。你得把一个头盔戴在脸上，调瞳距，等待启动，还没开始”沉浸”就已经把人劝退了。同理，我之前一直追求的低摩擦的知识管理体验也是如此。如果一个软件（此处点名批评 Tana）需要等足足半分钟才能打开，那大部分人根本没那个耐心等到能享受专注使用的时刻。

对游戏行业而言，全神贯注曾经是游戏体验的核心卖点，现在却变成了获客的最大障碍。问题不是”要不要做需要深度投入的游戏”，而是如何在碎片化的发现层和沉浸式的体验层之间设计一个足够丝滑的过渡。做到了就大卖，做不到就两头不靠。而在这个人人注意力都很难集中的时代，把时间投给游戏已经变成了十足的奢侈。每当回想起 10 年前上学的时候，可以连着几个小时坐在桌子前在 i wanna 里跳刺，全战里一打就是一夜，这种场景在当下实在是难以想象。

写长文的人也一样

写博客、写长文的人面临的其实是同一个困境。长文的价值在于深度思考，读者花 10 分钟认真读完一篇文章所获得的东西，远不是刷 30 条短视频能替代的。但分发渠道，无论是社交媒体还是推荐算法，全是 3 秒定生死的战场。

也许这就是为什么我越来越觉得，个人博客这种”反效率”的东西反而有它独特的位置。它不需要在 3 秒内抓住谁，它就安安静静地待在那里，等愿意坐下来读的人自己找过来。某种意义上，这也是一种注意力奢侈品，只不过消费它的门槛，仅仅是愿意给出一段不被打断的时间而已。

2026年3月7日

Agent 是自己的一面镜子

本文 AI 含量 60%

最近看到一条推文，大意是：我以为我在教 Agent 怎么工作，三周后回头一看，被改变最大的那个人是我自己。

这句话击中了我。过去几个月，我一直在配置自己的 AI Agent，经历了完全一样的事。

最开始我是在 Claude Code 里试图搭自己的工作流，但搭着搭着，随着 Openclaw 的出现，我第一次看到了拥有一个 24 小时在线的个人助手的可能。Openclaw不是开箱即用的产品（虽然它看起来是) 。你得告诉它你是谁、你怎么工作、你希望它怎么跟你互动。听起来像是在「配置软件」，但做着做着我发现，这件事的本质根本不是在配软件，而是在配置自己。

你以为在配 AI，其实在做自我审计

举几个例子。

配置的第一步，是写 SOUL.md —— 定义你希望这个 Agent 用什么语气跟你说话、什么时候该主动、什么时候该闭嘴。

问题看起来简单，真写起来才发现：我从来没认真想过自己到底喜欢什么样的沟通方式。大部分人对 AI 和自己的沟通方式的最典型想象可能还是豆包（所以说字节对产品的 sense 是真的强，虽然不一定每个人都喜欢豆包的沟通方式，但至少不会讨厌），而对我而言，在和 agent 一直对话的过程中，我才了解了自己不喜欢 AI 太热情，但也不想要冷冰冰的工具感；希望它偶尔能挑战我的想法，但别变成杠精。所以最后我在文档里写下的是「克制的副官，偶尔忍不住翻个白眼」。

写完愣了一下 —— 这不就是我对「理想协作关系」的定义吗？这个东西一直在我脑子里，模模糊糊的，但从来没变成过文字。配 Agent 逼我把它写了出来。

第二个例子是设计 Heartbeat系统。Agent 需要定期检查一些事情然后提醒我，但哪些事值得提醒？我得给它分优先级：P0 每次都提，P1 快到 deadline 才提，深夜 11 点之后别打扰我。

这本质上是在回答：什么对我真正重要？

说实话，在这之前，我对自己的注意力优先级没有清晰认知。什么事紧急、什么事重要、什么事可以等 —— 平时都靠直觉，从来没被迫排成一个明确的序列。但 Agent 不接受模糊。你不写清楚，它就不知道该怎么做。

第三个例子更有意思。我给 Agent 设计了一个「主动找我聊」的机制 —— 它会根据我最近关注的话题，偶尔抛一个值得跟进的问题过来。但我得给它画线：每天最多两次，同一话题三天内不重复，晚上 11 点后别推，没有真正有价值的内容就别凑数。

设计这套规则时我意识到，我其实在定义一个非常私人的东西：「主动」和「烦人」的边界。

每个人都被手机通知轰炸过，但很少有人认真想过：我到底希望被怎样打扰？什么信息值得打断我正在做的事？这条线画在哪？之前我对这个问题的答案是模糊的。配完之后，它变成了一组明确的规则。

为什么 Agent 能照见自己

这三个场景有一个共同点：都逼我把模糊的直觉变成可执行的规则。

这件事跟写日记、做笔记有点像 —— 都是通过外化来认识自己。但 Agent 比日记狠得多。日记允许模糊，你可以写「最近状态不太好」然后翻篇。Agent 不行。你说「状态不好的时候别打扰我」，它会追问：什么叫状态不好？怎么判断？几点到几点？

福柯有个概念叫「自我技术」，说的是人会通过特定的实践来认识和改造自己 —— 写日记、冥想、忏悔，都算。配 Agent 大概是这个时代新长出来的一种：你把自己的规则教给一个外部系统，反过来看清了自己到底是怎么运转的。

不是替代，是照见

过去几年，关于 AI 最主流的叙事是「替代」—— AI 会不会取代我的工作？会不会取代人类的创造力？但我自己的经历指向一个完全不同的方向：AI 对我最大的改变，不是替代了某项能力，而是让我看见了之前没看见的东西。

麦克卢汉说媒介是人的延伸。但 Agent 不只是延伸 —— 它还是反射。你往里面投入的是自己的规则、偏好、优先级，它照出来的也是你自己。

如果越来越多人开始配置自己的 Agent，那 AI 对人的改变，可能不是大家担心的那种「取代」，而是一种意料之外的「照见」。这个角度，比「AI 会不会抢你饭碗」有意思多了。

配 Agent 的过程还在继续，镜子里的自己也在不断变化。每隔一段时间回去改改 SOUL.md、调调优先级规则，都会发现：哦，原来我又变了，或者会恍然大悟，原来我的想法并没有表面上那么简单。

也许这才是 AI 时代最值得关注的事：不是让 AI 变得更像人，而是通过 AI，让人更了解自己。

2026年2月28日

Manus 被收购：三种叙事，三种命运

本文 AI 含量约 20%

最近 Manus 被收购这件事引发了不少讨论，我也来凑个热闹。

除了新闻本身最早看到玉伯的评论引发的争论，他有些悲哀。在他看来，创业公司的使命是挑战恶龙，而 Manus 被收购，意味着又有一个同行者放弃了自己的梦想。当然，这只是从产品层面来看。

随着商务部决定审查 Meta 收购 Manus，这件事已经从纯产品和商业问题变成了地缘政治问题。

三个叙事角度

全球化科技公司叙事的再次破产

自 TikTok 被美国审查并被迫成立合资公司以来，那些曾经「无国界」的科技公司都逐渐有了地缘属性。中美在 AI 产业上的竞争，使得真正意义上的全球化公司愈发不可能。Manus 被审查，又一次验证了这一规律。之前我们以为它被收购意味着美元 VC 的叙事逻辑仍然可行，事实证明并非如此。

过去的全球化，本质上是美国主导的单极秩序的产物。那时「全球化」实际上意味着「美国标准的全球化」。而现在，多个主权实体同时在争夺对科技公司的「定义权」—— 美国用 CFIUS 定义「谁是安全威胁」，中国用《出口管制法》定义「谁在转移国家能力」，欧盟用 GDPR/DMA 定义「谁在滥用市场支配地位」。

Manus 作为中国背景的公司，试图逃离中美的审查环境，却发现自己陷入了多重监管的夹击。

监管套利的边界

Manus 的策略本质上是监管套利 —— 在新加坡注册以规避中国对技术出口和模型使用的监管要求，同时希望绕开美国对投资审查。但他们犯了一个不对称评估错误：高估了「放弃中国市场」的保护效果，低估了中国的反制意愿。

中国的技术出口管制体系过去执行相对宽松，很多创业者形成了「只要不碰军工就没事」的认知惯性。但 Manus 案可能意味着中国开始把「AI 能力」本身视为需要管制的战略资产，而不仅仅是具体的算法代码。

更吊诡的是：Manus 越是「干净地切割」中国业务，反而越容易被视为「有预谋的规避」，触发更强的审查意愿。这是监管套利的经典陷阱 —— 套利行为本身会改变监管者的行为。对 Manus 而言，「退出」本身就成了触发审查的理由。

对 AI 行业创新的影响

这次审查事件还有一个吊诡之处，也是政府会重点考虑的：它对行业创新的影响。这次收购原本给很多创新公司树立了榜样 —— 只要认真创新、走出海外，就有很好的被收购前景。这种前景会促使更多 VC 去支持有潜力的公司。

但从产业政策角度看，政府关心的可能不是这家公司赚了多少钱，而是这次收购如何影响中国在 AI Agent 领域的能力积累。即使 Manus 的技术不是最前沿的，它的人才、工程经验、对中文场景的理解，都是「国家能力」的组成部分。Manus 团队整体并入 Meta，意味着这部分隐性知识的永久流失。

一旦丧失通畅的退出渠道，还会有那么多 VC 愿意支持创业公司成长吗？这是政府需要权衡的问题。如果一个 AI 公司只能服务国内市场，它的能力必然受到约束 —— 使用的模型天生受限，难以获得海外关注；而国内市场和付费意愿毕竟有限，上升空间会被极大压缩。

一家公司，三种叙事

从 Manus 自身角度出发，虽然可以说它是地缘政治下的一枚棋子，试图通过抛弃中国市场、规避美国审查、转移到新加坡来挣扎求存，但我们也要注意到，它实际上有点「柿子挑软的捏」。它选择了规避美国审查，却没考虑中国也可能审查它。被审查之后，它很可能以「被中国迫害」的受害者形象出现，而这想必不是肖弘他们乐意见到的，也是中国政府想要避免的一种叙事。

Manus 作为商业实体的身份虽然是稳定的，但在地缘政治框架下，其身份可以被重新定义。同一家公司在不同视角下会有截然不同的定义：他们被中国政府定义为「中国技术的流失者」，同时被美国政府定义为「具有中国背景的安全风险」，而在另一个视角下又有可能新加坡政府定义为「东南亚科技枢纽的明星案例」

一家公司，三种叙事，三种截然不同的命运。在政治与商业的交叉地带，谁有权定义这家公司是什么，本身就是一个关键的权力问题。Manus 面临的身份撕裂，也是当今时代科技企业的必然宿命。

接下来可能发生什么？

简单预测退下商务部肯定会进行严格审查，但审查结果会综合考虑地缘政治和对中国 AI 行业创新前景的影响。最终这次收购可能会被批准，但形式可能类似 TikTok —— 需要成立合资公司，通过技术授权的方式进行。

具体细节难以预判，但肯定会考虑给 VC 一个退出渠道，以鼓励类似公司的创新。

当然，也存在着走向最差结果的可能性，包括收购被阻止，或者 Meta 采用更极端的 Acquihire 的形式来进行收购，使得 Manus 成为一个空壳，但这种方法却也不可避免地可能会使 Manus 员工自身却面临一些刑事上的威胁。而这肯定是各方都不想走向的一条道路。

不过话说回来，未来这类公司也可能会更多走向通过会员费、订阅等方式自我造血，同时不排斥投资的道路（暨 Manus 被收购前的路线。被巨头收购这条路，恐怕会越走越窄。这又呼应了玉伯最初的愿景：人们会走上「挑战巨龙」的路线，而不是被巨龙吞噬。

只是，当你面对的不是一条龙，而是三条龙同时争夺对你的定义权时，「挑战」本身的含义也变了。

2026年1月9日

社交媒体时代，我们的「本地人」身份去哪了？

本文 AI 含量 70%。

前几天和 AI 聊了一个问题：互联网和社交媒体到底是增强还是减弱了人们的本地自豪感和归属感？

这个问题让我想了很久。就我个人而言，答案很明确——变少了。通过旅行、互联网、社交媒体看到的世界之大，让我很难再对本地人这个身份产生什么特别的情感。但我又观察到，很多中老年人反而在刷短视频的过程中，进入了一种夸本地的信息茧房，对家乡的自豪感似乎比以前更强了。

三类人，三种方向

在讨论中，我们发现可以把人大致分成三类：

有些人因为看到了更大的世界，本地认同反而变淡了。社交媒体打开了视野，让我们接触到了更多身份选项：职业圈层、兴趣社群、甚至某种全球化公民的感觉。本地认同并没有消失，只是被挤到了优先级更低的位置。

有些人反而在社交媒体上强化了本地认同——以中老年人为代表。他们刷到的多是家乡美食、本地新闻、方言段子，本地自豪感被数字化放大了。

还有些人是离开家乡的人，这群人又分化成了两种：一种是离开后反而更怀乡，通过短视频、家乡博主、方言梗等内容远程维系本地认同；另一种则完全融入了新居住地，甚至比当地人更热衷于维护那里的环境和文化。

看到更大的世界，就会失去归属感吗？

先说第一类人。我最初的直觉是：看到的世界越大，本地归属感就越弱。但仔细想想，这个因果关系可能太简单了。

更准确的说法或许是：社交媒体让我们接触到了更具吸引力的替代认同。当你发现自己可以是互联网从业者、PKM 爱好者、独立思考者时，本地人这个身份的吸引力自然就下降了。不是本地认同被稀释了，而是它在身份优先级的竞争中输给了其他选项。

这让我想起之前收藏过的一篇书评，里面提到一个社会学概念：人们是参与社会系统，而不是属于社会系统。本地人只是我在地理系统中占据的一个位置，但我个人并不等于这个位置。如果我的生活重心、社交网络、情感投入都已经迁移到别处，那本地人就只是一个符号，而非真实的认同。

算法在强化本地认同，还是人们主动选择了算法？

再说中老年人。我最初把他们归因于信息茧房——算法推荐让他们只看到强化既有认同的内容。但这个解释可能过于被动化了他们的角色。

社会学家 Charles Cooley 有一个「镜中自我」的概念：我们依赖别人的反馈来开发自己的身份。他们在算法的镜子里，看到的是自己想看到的自己。不是茧房制造了归属感，而是既有的归属感选择了茧房。

还有一个因素是生命阶段。中老年时期的核心任务是整合——把人生经历编织成有意义的叙事。本地认同是这个叙事的重要锚点，强化它是在回应「我是谁、我从哪里来」的存在性问题。

离开家乡的人：向后看还是向前看？

最有意思的是离开家乡的人。同样是迁移，为什么有人更怀念故乡，有人却比当地人更热爱新居住地？

关键变量可能是迁移的主动性和在新地方的社会嵌入深度。

主动选择迁移、且在新地方建立了实质社会网络的人，更可能全情投入新居住地。主动迁移意味着放弃了其他选项，为了消除「我是不是选错了」的认知失调，人们会不自觉地强化「我选对了」的信念，表现为对新居住地的积极维护。

此外，本地人对家乡的一切习以为常，而新来者看到的是被发现的宝藏，边际效用自然更高。再加上外来者需要通过可见的行动来赚取归属资格，而本地人的归属感是继承的，不需要证明。

相反，被动迁移、或在新地方始终处于边缘的人，更容易退回到远程怀乡的模式。那是一种低成本的认同维系——只需要点赞转发，不需要真正付出。

某种程度上，前者经营的是当下的本地，后者消费的是记忆中的本地——一个向前看，一个向后看。

从「你是哪里人」到「你在哪里参与」

本地认同正在从地理绑定变成可选择的身份消费。

社交媒体让参与变得可以跨越物理距离。你可以人在上海，却通过刷家乡的短视频参与南京的社会系统；你也可以从未去过成都，却因为关注了太多成都博主而对那里产生了某种虚拟归属感。

这种变化未必是坏事。也许我们正在从「你是哪里人」的归属问题，走向「你在哪里参与」的行动问题。前者是被动继承的，后者是主动选择的。

在这个意义上，社交媒体给了我们更多选择的自由，尽管这种自由有时也意味着迷失。

2025年12月21日

不要在公司 Teams 里说 “shit”

本文 AI 含量 70%。

这两天，公司的 Teams 群里上演了尴尬一幕。某个服务宕机后，一位同事在群聊中下意识地回了一句 “shit”。在我们看来这稀松平常，但一位韩国 Leader 随即在群里严厉警告：Watchout your language。

这次冲突让我意识到，作为中国人，我们对英语脏话的钝感与他人的敏感之间，存在着从心理到文化上的诸多差异。

先不提这个 Leader 是不是英语母语。在不同语言的人们的沟通中，存在着一种情感分离效应（Emotional Detachment）。对非母语者而言，第二语言的脏话往往被剥离了情感重量，退化为单纯的语义符号。说出 “shit” 或 “fuck” 时，大脑中负责恐惧与羞耻的边缘系统并未被激活，它们听起来更像加强语气的助词。但对母语者而言，这些词根植于成长环境，自带生理性的攻击力，能瞬间唤起真实的冒犯感。

此外，文字作为一个媒介，它和日常的口语说话时也不一样。文字是冻结的，它没有人们日常说话时的肢体动作、表情等作为缓冲。这行字所携带的攻击性，被文字这个数字化媒介放大，往往会被解读为情绪失控，甚至缺少职业素养。

当然，人们反应的不同和行业有一定关系。如果是在一些互联网企业，有时候在软件里说脏话，会被认为是非常正常的一种行为，因为你的情绪是允许激动的，大家交流更加随意。而在一些传统行业里，脏话往往会被认为此人情绪不稳定等等。

不同文化里的人对脏话的接受程度也不同。可能在一些文化里，人们会觉得用脏话只是非常正常的一种表达方式，而对于一些比如韩国、日本这些大量使用敬语的国家而言，说脏话是非常没有素质的。

让我们脱离开这个工作场景，往上再看一层，看一下在中国互联网语境和外国互联网语境中的区别时，又会发现一个更有趣的视角。

我们在数字化方面形成了一种独特的「方言」。在中国互联网语境下，我们会习惯了使用微信来进行工作。Teams 对我们而言只是一个企业版的微信。我们在发消息的时候是碎片化、即时性甚至情绪化的。我们把秒回视为敬业，把这种口语化短句视为高效。

然而在欧美传统职场，Teams 更像是一种「短邮件」。他们遵循低语境逻辑，严格区分公私领域。他们追求异步沟通，要求一次性把背景、问题和行动精准表达。在这种追求信息密度的“邮件式场景”中，一句纯粹发泄情绪的脏话，不仅显得多余，更是一种破坏专业性的噪音。

2025年12月5日

如何通过 Notion AI 追踪自己的情绪

自从 Notion 进入 3.0 时代之后，我又重新订阅起了 Notion AI，其中的原因很简单，就是 Notion Agent 的引入使得每个个体的信息库、知识库，乃至项目管理的效率大幅提升。

目前我每天频繁会使用至少 3 个 agent，来进行学习、阅读、生活管理。今天我来分享一下如何通过 AI 来追踪自己的情绪。

流程

先说一下我的做法。一般白天我会在我的手帐里以 lifelog 的形式记录我当天遇到的事情、完成的任务、遇到的有趣的事，乃至阅读中的闪念。日常手边只有手机的时候，也会通过 Flomo 来录入。每天晚上，我会通过闪念贝壳，来把这些 lifelog 通过语音转文字一口气录入给 Notion AI。

Notion AI 会调用我的一个「日报助手」agent，来对我的 lifelog 以及当天从其他各个途径录入到 Notion 的信息进行分析，而其中我设置了一个 property 是分析当天的 lifelog，判断我当天的情绪

一开始我只随便写了一句话 prompt，让 AI 分析我当天的主要情绪前些天和 Marvix 聊了之后，决定尝试一下用更科学的方式来对自己长期的情绪进行追踪。他的建议包括通过「八大情绪」来把情绪更加科学地进行整理。

根据他的建议，我写了一段 prompt （请阅读我输入的内容。基于 Plutchik 的八大情绪分类（喜悦、信任、恐惧、惊讶、悲伤、厌恶、愤怒、期待），分析我在这篇日记中体现的主要情绪。选择一个选项填入。）和标签设置之后，我试着把之前一个月的记录批量生成了一次情绪，结果却发现，为什么过去 30 天里，有 20 天我的情绪都是「快乐」？

我当然希望自己是个快乐的人，很多人也评价过我「情绪平稳」。但我很清楚，作为一个牛马，工作中必然会遇到挫折，生活中和家人的互动，乃至居家生活中，情绪也必然会有起伏，但这些波动在 AI 的总结里全都消失了，只剩下一片祥和的「快乐」。

那么显然，要么是我的输入有偏，要么是「算法」出了问题。

问题在哪里

我的输入是有偏差的

尽管日记本身是给自己记的，但是记录的过程本身却可能会发生在公共场合。为了维护在他人心中一个积极、阳光向上的形象，在记录时，我的记录会不自觉地变得更加平和，这会造成日记和实际情绪的偏差。

另一个原因则是我的输入方式的问题。当用笔记录下内容的时候，当时的情绪可能会得到宣泄。但当一整天过去，晚上通过语音进行录入时，那些负面情绪往往会已经消退了，即所谓的「褪色情感偏差」，输入到 Notion 里的内容会缺失了很多负面情感。

大语言模型的问题

在输入之外，还有一些偏差可能是由模型带来的。LLM 自带的两种特性：积极偏见（Positivity Bias）与 平均化逻辑。

积极偏见

当你把一整天的流水账丢给 AI 时，其中 80% 的内容其实是中性的维护性事务：起床、通勤、吃饭、完成任务。在没有显性的负面关键词（如「痛苦」、「崩溃」）时，AI 倾向于将“生活正常运转”理解为「快乐」。

平均化

我之前的指令是让 AI「分析这一天的主要情绪」。想象你是一个调酒师：你倒进了一份咖啡、一份白开水、一份威士忌、一份橙汁和一杯快乐水。搅拌之后，你问 AI 这杯水是什么味道？AI 尝了一口，礼貌地回答：“嗯，甜甜的，还能喝。” ——这就是那个虚假的「快乐」。

生活中的情绪不是平均数，很多时候，决定我们那一天心理状态的，往往是那一两个剧烈波动的瞬间。而这是 AI 在不经调整的情况下无法理解的。

修正

明确了问题，那下面就需要对输入和算法进行修改了。

提高输入的「信噪比」

发现问题后，我开始调整我记录 Lifelog 的习惯。

语音转文字虽然方便，但往往会丢失语气。如果我只是记录「今天老板驳回了方案，我改了第二版。」AI 读到的是「完成了任务 -> 勤奋 -> 快乐。」但当时我的真实心境可能是极度挫败的。所以现在，我在录入时会刻意增加主观形容词的密度：

「今天老板驳回了方案，我觉得很受打击，这完全是在浪费时间，但我不得不硬着头皮改了第二版。」

这一句话的改动，就能让 AI 敏锐地识别出「厌恶」或「悲伤」，而不是原本那个和稀泥的「快乐」。

并且，在一天的最后通过语音输入的时候，我也会主动保留原纪录里的一些语气词。

迭代 prompt

心理学中有一个著名的 「峰终定律」（Peak-End Rule）：人对一段经历的记忆，主要取决于情绪最强烈的瞬间（峰值）和结束时的感觉（终值），而不是整个过程的平均体验。

既然我要做的是「情绪追踪」，我就不应该让 AI 来取平均，而应该让它做「雷达」，来发现我记录中真正影响情绪的部分。

于是，我重写了我的 Prompt。我不再要求 AI 总结全天，而是要求它捕捉异常值。以下是我迭代后的 Prompt，如果你也在用 Notion AI 做类似的事，可以直接拿去用：

Role: 你是一位敏锐的心理情绪分析师。
Task: 阅读这一天的 LifeLog，基于 Plutchik 的八大情绪分类，找出这一天中情绪强度最高的那一种情绪。
Rules:
- 忽略流水账： 自动过滤掉吃饭、睡觉等常规活动，除非包含强烈的主观形容词。
- 捕捉异常值： 不要对全天的情绪取平均值。哪怕一整天都很平静，但有 15 分钟极度的「愤怒」或「悲伤」，这一天的标签应该是「愤怒」或「悲伤」。
- 负面敏感： 即使正向事件数量多，如果存在明显的负面情绪事件，请优先权衡其对心理的影响。

效果非常明显，我用 Notion AI 重新跑了过去一个月的数据，

「快乐」从 20 次降低到了 12 次，与之相对的是「自责」和「生气」的大幅上升。

虽然快乐仍是主流，但无疑更符合我日常的体感。

此外，我还添加了一个更进一步分析情绪的prompt，以帮助我更细化了解为什么会有这个情绪，强度如何，以及有什么更细微的情绪变化。

结合我的情绪，给出情绪强度【1-10】，用一句话总结引发情绪的具体事件，并描述出当天情绪的细微差别： [用更精准的词描述，如：焦虑、自豪、惆怅]」

为什么要做这些

做情绪追踪这件事的初衷，并不是为了得到一张漂亮的图表，而是为了提升对自我的了解，以针对性地改善自己的生活。

如果我的生活只有「快乐」和「不快乐」两种状态，那我的认知就是低分辨率的。通过强迫 AI 去区分我是「愤怒」还是「恐惧」，是「期待」还是「信任」，我也在强迫自己去正视那些被忙碌掩盖的细微感受。

数据有时候会撒谎，特别是当 AI 会试图讨好你的时候。我们能做的只能是尽可能地纠偏，纠 AI 的偏，也纠自己的偏。

2025年11月23日

为什么同样是「四处出击」，腾讯比字节更容易被骂？

注：本文由 Notion AI 整理

前几天在即刻上看到潘乱发起了一个讨论：为什么同样是在各个领域出击，字节相比于腾讯被骂得少了很多？这个问题让我想了很久，于是和 GPT5.1 展开了一场长谈。整理这次对话的过程中，我发现这个问题远比表面看起来复杂得多。

一个核心的认知差异

在开始分析之前，先说一个最重要的观察：腾讯和字节在用户心智中扮演的角色完全不同。

腾讯更像是「既得利益的垄断守城者」，而字节更像是「后来者、搅局者、甚至有点草台班子气质的挑战者」。这种角色认知的差异，叠加了时间节点、商业模式、舆论结构等多重因素，最终导致：

腾讯被骂多的是「垄断、收割、堵路」
字节被骂更多的是「内卷、文化、内容价值观」

但在「跨领域扩张」这个维度上，字节的「垄断资本恶龙」形象确实没那么重。

时间节点决定了角色定位

腾讯：在关键时刻成为基础设施

腾讯真正奠定今天地位的时期，是 PC 互联网向移动互联网迁移的那几年。当微信横空出世时，很多领域还处于「可被重构」的阶段——移动社交、移动支付、移动内容分发都还没有定型。

腾讯用已经建立的优势（QQ 的社交关系、游戏业务、内容平台）迅速建立了基础设施型垄断。在用户和行业的认知中，「某个领域刚起来就被腾讯全部打包带走」这种印象，很容易形成「扼杀创新」的叙事。

字节：存量时代的挑战者

相比之下，字节崛起时，移动互联网的格局已经基本定型，BAT 已经确立。即便今天抖音再强，整体的「基础设施格局」也从来不是它掌握的。

这就导致字节的扩张更容易被解读为「想从巨头手上撕下一块肉」，而不是「拦在新玩家门口不让进」。同样是到处出击，腾讯是从「强者更强」出发，字节是从「弱者上位」出发——后者的道德负担自然轻一些。

进入赛道的动机叙事完全不同

腾讯：在红海后期强化封锁

很多针对腾讯的批评来自这样一种模式：等创业公司把赛道教育出来，用户已经形成习惯，然后腾讯要么重仓投资头部（通过「投资+流量」形成封闭生态），要么自己出一个「集大成者」，配合微信/QQ 导流压制其他竞争者。

这种打法在商业上无可厚非，但舆论上非常容易被写成**「垄断、扼杀创新、收购再封锁」**的故事。

字节：试错驱动的扩张

字节很多领域是自己从 0 做到规模的，比如信息流新闻、短视频、电商直播。它往往把一个赛道从边缘推成主流，而不是等别人做成了再进场。

即便是后来切入的领域（搜索、电商、音乐），也更像是把原本「被某家大厂锁死」的结构打乱，拉高整个赛道的竞争强度。行业叙事就变成了：「让腾讯/阿里不敢躺着收钱」，而不是「阻止别人成长」。

字节的很多项目给人的印象是「高风险、高死亡率的试验田」，而腾讯的项目给人的印象是「已经算好账的扩张棋子」。在舆论中，前者更容易被当做「创新尝试」，后者更容易被当做「资本收割」。

舆论结构的隐形影响

这里有一个容易被忽略的点：你看到的「谁更被骂」，很可能受到信息采样偏差的影响。

针对腾讯的负面叙事，很多是在新闻、长文、专业论坛中沉淀的——这些内容更容易被关注互联网行业的人看到。而针对字节的负面（沉迷、低俗、直播乱象），被拆散在大量零散内容和个体吐槽里，感知上就不那么集中。

更有意思的是，字节掌握的抖音和头条，本身就是算法驱动的内容平台。算法的「隐性控制」让用户不太容易感知到平台在操控舆论，而更像是「只是推你喜欢看的」。相比之下，腾讯在社交和内容领域的控制更「可见」，也就更容易被质疑。

业务痛点的类型差异

还有一个维度值得注意：腾讯和字节对用户造成的「直接痛点」不一样。

腾讯的痛点集中在刚需基础设施：

微信社交不能不用
微信支付深度嵌入生活
游戏高利润与「未成年」「氪金」等议题高度绑定

这些领域一旦被认为「不公平、不开放、滥用地位」，情绪会非常集中。

字节的痛点集中在娱乐/内容层面：

抖音是「强上瘾但非绝对刚需」的产品
用户更多骂「我自己控制不住」「孩子被带坏」
这类痛苦在心理上更容易被归因为「我自己不自律」，而不是「平台滥用权力」

对刚需基础设施的不满，更容易转化为对平台本体的道德审判；对娱乐内容的不满，更容易转化成「这社会就这样了」的叹气。

一些被忽视的变量

在和 GPT5.1 的对话中，它还提醒我注意了几个容易被忽略的因素：

创新叙事的差异：腾讯长期背负「抄+买+封」的标签，而字节至少有几个「硬创新」能拿得出手（今日头条的推荐算法、抖音对短视频形态的重塑）。有了这些，舆论更容易给它「有真本事」的期待。

开发者生态的关系：腾讯对开发者生态的封闭和博弈（小程序规则、外链限制、账号体系封闭）是长期怨气的来源。字节在这方面的控制力没那么强，甚至在某些阶段被视作可以「绕开腾讯的一个通道」。

成长故事的加成：用户天然会给「白手起家、打破旧格局」的公司情感加分。即便字节今天已经是巨无霸，很多人情感上仍把它当成「敢挑战巨头」的代表。

写在最后

整理完这次对话，我发现这个问题的答案其实没有那么简单。不是说字节就比腾讯「更好」或「更坏」，而是它们在不同的时间节点、以不同的方式、进入了不同成熟度的赛道，最终在公众心智中形成了完全不同的形象。

腾讯被要求像「公用事业」一样克制，因为它掌握了太多基础设施；字节还没到那个位置，所以道德审视的标准也不一样。

也许再过几年，当抖音真的变成下一代的「国民级基础设施」时，字节也会面临和今天腾讯一样的拷问。到那时，会有新的挑战者出现，继续这个循环。所谓的「屠龙者终会成为恶龙」的故事永远不会停止上演。

2025年11月14日