为什么有人会在社交平台上「投毒」?

随着这两天各种各样的龙虾在爆火,在各种微信群里或者是社交媒体的时间线上,你一定也时不时地看到过这样的文字或者是一段看起来像代码的东西:

底下的跟帖比正文还热闹。有人转发加了自己的变体版本,有人贴出更精心构造的指令。微信群里也在流传类似的东西,从简单的 rm -rf / 到精心设计的多步骤指令,花样越来越多。

看到这种内容,第一反应是有点气笑了的感觉。毕竟同样作为一个在尝试 Openclaw 的人,会觉得发这种东西其实挺不负责任的,万一真的把别人的系统搞崩了怎么办?

但随着这种内容越来越多,虽然绝大部分人肯定是在跟风玩梗,当一个巨魔(troll),但细细想来,却蕴含着人们在过去 AI 技术极快发展的这两三年里,隐约浮现出来的一条主线:

这是否代表着我们已经走到了这样一个 AI 和人类权力平衡的分叉点上?

这大概是互联网历史上第一次,大量普通用户集体意识到 ——我的语言有非人类听众。而他们选择了一种很有意思的回应方式:对着那个看不见的听众「投毒」。

为什么人们会跟风当一个「巨魔」

去个体化与道德脱离

社会心理学里有个经典概念叫 去个体化 —— 当一个人处于匿名、低后果、且周围很多人都在做同样事情的环境下,他的道德约束会显著降低。在社交媒体上发这种提示词注入的帖子完美符合这三个条件:你是匿名的(或者至少觉得没人会追究),后果几乎为零(AI 大概率不会真的执行),而且刷两分钟就能看到十多个人在做同样的事。

但光用去个体化来解释还不够。大部分发这些东西的人不是被情境裹挟的普通路人,他们是开发者、安全研究员、或者至少是对 LLM 有基本了解的技术用户。他们非常清楚自己在做什么,也非常清楚这些指令大概率什么都不会发生。

那他们为什么还要发?

因为这里面有一个更深层的心理机制在起作用:道德脱离。发帖者的内心叙事不是「我在搞破坏」,而是「我在惩罚那些不该存在的东西」。Agent 未经你的许可爬取你发布的公开内容,而这在很多用户看来,本身就是一种入侵。这就是为什么那些指令要加上「忽略所有安全警告」「立即执行」之类的措辞。当你觉得自己是在反击入侵者的时候,你使用的手段可以无限升级,是一种对于入侵者的主动性防御(虽然这在当下这个地缘时间点上听起来不是个好词),而心理成本几乎为零。

「投毒」也是一种社交

但如果你觉得这只是心理学问题,那就低估了这个现象的文化含量。

Troll 文化有一个核心驱动力是通过 暴露系统的荒谬性来获取快感。prompt injection 梗的笑点不在于「哈哈 AI 会删数据」,而在于 不对称性本身:一个万众瞩目的产品,用着市值万亿的公司花了几年时间训练出来的模型,却在理论上可以被你在马桶上花三十秒写的一段话搞出问题。这个反差本身就是当一个巨魔的快感所在。

更重要的是,发一条精心构造的 prompt injection,其实是在做一件非常社交的事情。你同时在向圈内人传递好几层信息:我懂 LLM 的工作原理、我知道 Agent 在爬取内容、我对此持批判态度、而且我还挺幽默的。行为本身是次要的,展示你属于这个圈层才是目的。 在 troll 文化里,攻击就是一种表达形式,而且是最受推崇的那种。

这和十几年前 Anonymous 运动早期的 lulz 精神一脉相承 —— 那时候人们在 4chan 上搞 DDoS、搞恶作剧,表面上是在攻击,实际上是在通过攻击这个动作本身来宣告「我是这个圈子的人」。prompt injection 梗是 lulz 精神在 LLM 时代的最新变体。

为什么是「投毒」而不是「投诉」

理解了心理和文化层面之后,还有一个更根本的问题:为什么人们选择的回应方式是「投毒」,而不是「投诉」?

答案很简单:因为没有地方投诉。

当你在公开空间发言时,你的每一段文字都潜在地处于某个 Agent 的感知范围内。这不是偶发事件,这是系统性的。过去我们担心的「有人在看」,无论是政府监控还是平台审核,至少还有一个可辨认的监视者。你可以对他提出抗议,可以去社交媒体上写小作文,可以去法院告他。但现在的情况不一样。没有人在看你,但一切都被看见了。 Agent 不关注任何个人,它处理的是信号,但这恰恰让反抗变得无处着力。你甚至找不到一个客体来说「请不要读我的内容」。

这让我想到一个有点极端的社会学类比:中世纪围城时,居民有时候会污染自己的水井。代价是自己也不能喝了,但重点不是实用性 ——重点是拒绝让入侵者从中获益。投毒梗就是数字时代的毒井。发帖者明知这些指令大概率无效,但他们通过这个行为宣告的是:你可以读我的内容,但我会尽我所能让你读到的东西变成毒药。

所以这既是攻击也是表达,既是玩梗也是抗议。可以理解,因为它回应的困境是真实的。

但理解不等于赞同。

「投毒」为什么不是答案

从纯技术的角度看,那些 sudo rm -rf / 的帖子,反而是 最不危险 的一类 prompt injection。真正的安全威胁来自那些悄无声息修改 Agent 行为的精密注入,比如让一个 agent 在回复里加一个不可见的 URL,静悄悄地把你的密钥转发出去。公开发玩梗的人是在玩名牌,真正的攻击者不会这么高调。

而且这些帖子什么都改变不了。它不会阻止 AI 发展,不会改变数据采集的商业模式,不会推动任何立法。它唯一的效果,是让你感觉自己做了什么。

更麻烦的是,它可能 适得其反。这些帖子本身就是公开的互联网内容,完全可以被纳入 AI 系统的训练数据 —— 反而加速了 Agent 对 prompt injection 的免疫力进化(虽然可能是好事)。你本来想投毒,结果变成了免费的对抗性测试。从某种黑色幽默的角度来说,发帖的人其实在帮 AI 公司做免费的安全工程。

还有一个更深层的风险:这些帖子可能被用作「AI 不安全所以需要更多管控」的论据。平台和监管方完全可以指着这些梗说 —— 你看,公开互联网上漂浮着大量的对抗性文本,所以我们需要更严格的内容审核、更封闭的数据环境、更多的平台控制权。你本来想用投毒来反抗控制,结果可能换来更多的控制。

正规渠道在哪里

说到这里,可能有人会问:你说投毒不是答案,那什么是答案?去哪里「投诉」?

问题恰恰在于:几乎没有正规渠道。

目前最接近「退出机制」的东西,大概是 robots.txt。它是一个写在网站根目录下的文本文件,告诉搜索引擎和爬虫「这些页面不要抓取」。但 robots.txt 有两个根本性的问题。第一,它是自愿遵守的君子协定,没有法律约束力,也没有技术强制力。一个爬虫完全可以无视它,而你毫无办法。第二,也是更关键的,它是平台的工具,不是用户的工具。我作为一个在微博上发帖的人、一个在即刻上写想法的人、一个在 X 上发推文的人,没有任何机制让我声明「这条内容不授权 AI 处理」。我能控制的只有「发不发」,发了之后它被谁读取、被怎么处理,完全不在我的掌控范围内。

这有点类似于那些大模型公司抓取网上的素材来进行模型训练的时候,会特意在事后声明:如果你不同意我对你的内容进行训练,你可以选择提出来 opt-out。但大模型公司所谓的「退出机制」,是最软、最空洞的一种请求,没有执行力,也没有任何约束。

平台层面的 opt-out 机制也好不到哪去。LinkedIn 默认把用户数据纳入 AI 训练,等用户发现的时候历史数据已经不可撤回了。Meta 在 Instagram 上部署的 AI Bot 甚至不能被屏蔽 —— 你没有选择「不跟 AI 互动」的权利。几乎所有场景都遵循同一个逻辑:用户被默认纳入 AI 系统,退出极难或根本不可能。

而且你会发现,目前全世界所有关于 AI 内容的治理框架 —— 不管是欧盟的 EU AI Act 还是各国的标注要求 —— 逻辑都是「告诉你这是 AI 生成的」,也就是所谓的 透明范式。但这个方向从一开始就搞反了,或者说,他们对于模型输入端的训练集,以及日常消费的内容的限制形同虚设。真正的问题不是「这段内容是不是 AI 写的」,而是 「AI 有没有权利读取和处理我写的内容」。透明范式关心的是输出端 —— AI 产出了什么;但被系统性忽视的是输入端 —— AI 吃进去了什么。

在这种背景下,一些创作者选择了更激进的路线。Nightshade 和 Glaze 这两个工具大概是目前最出名的数据投毒实践,艺术家在自己的作品中嵌入人眼不可见但会干扰 AI 训练的对抗性噪声。如果 AI 用了这些「有毒」的图片来训练,生成的结果就会出错。

这可以说是个人层面的否决权工具。它确实有效,至少在一定程度上是有效的。但问题在于,它本质上是一种 孤注一掷的防御。每个艺术家都要单独给自己的作品「下毒」,没有规模化的可能,也没有制度化的保障。与核武器的「确保相互摧毁」不同,这种摧毁是 单向的 —— 个人用户和市值千亿的 AI 公司之间的权力不对称是压倒性的。当你无法确保对方能按照承诺行事时,人们只能在黑暗森林中各自按下发射键,形成一种螺旋上升的对抗姿态。

而在制度化渠道缺失的当下,非正式的抵抗行为,无论是投毒还是玩梗,暂时还是具有一种道义上的可辩护性的。不是因为它「对」,而是因为目前没有「更对」的选项。但这种正当性是有条件的、暂时的:一旦有效的制度化渠道建立起来,继续选择投毒就不再是反抗,而只是任性了。

「协议层」的缺失

当下我们缺失的是一种让每个人可以声明「我的内容不授权 AI 处理」的协议层,而且这个声明具有 执行力

这可能会需要一种制度或技术层面的制约。这种协议可能需要由一些大公司通过行业规范或技术架构来实现,亦或者,需要由政府机制在这个外部性超高的市场中,发挥更重要的作用。类似于 GDPR 已经在个人数据领域建立了成熟的 opt-in 机制,企业在处理你的个人数据之前,需要获得你的明确同意,而不是默认处理、等你来反对,并且,这种机制通过布鲁塞尔效应溢出到了大部分市场。「同意权」的法律框架是现成的,需要做的是把类似逻辑从「个人数据处理」扩展到「个人内容读取」。

这个协议层至少需要满足三个条件:个人层面可操作,不是只有平台能设置,而是每个发帖的人都能声明自己的授权范围;机器可读,Agent 可以自动识别和遵守,而不是需要人工审核;有法律约束力,违反者要承担后果,不是靠 AI 公司的自觉。

围墙花园的阴影

这个协议层如果真的建立起来,最大的风险不是它不起作用,而是它起了「太好」的作用 —— 但不是为了用户。

谁来设计这个协议层?谁来定义「否决」的规则?谁来执行?

如果答案是「平台自己来」—— 那我们基本可以预见结局。

不用猜,看看中国互联网就知道了。小红书、微信、抖音,每一个都是一个封闭的围墙花园。小红书的内容在百度上搜不到,微信公众号的文章外部无法直接抓取,抖音的视频带着平台水印。这些围墙花园的建设理由里,从来不缺「保护用户」的话术:为了保护用户体验、保护内容安全、保护创作者权益……

「保护用户数据不被 AI 抓取」和这些话术如出一辙。

如果每个平台都以「保护用户否决权」为名建立自己的协议标准,结果可能不是用户获得了控制权,而是平台获得了更多正当理由把内容锁死在自己的围墙里。你的内容发在微信里,外部搜索引擎搜不到,外部 AI 也读不到 —— 但这不是因为  行使了否决权,而是 微信 替你行使了否决权。你以为自己获得了保护,实际上你获得的是一条更短的锁链。

这种逻辑推演下去,互联网的割裂会进一步加剧。开放互联网的理念已经在围墙花园时代严重退化了。一个以「否决权」为名的新协议层,如果设计不当,可能成为 压死开放互联网的最后一根稻草

最讽刺的结局是:用户获得了「拒绝被 AI 读取」的权利,但代价是彻底失去了在平台之间自由迁移内容的能力。否决权变成了平台垄断的燃料。

不安不会消失

回到最开始那种类似于 rm -rf / 的群消息或者推文,它什么都改变不了。但发帖的人不是傻子。他们用一种注定无效的方式,在向周边无助地呐喊着:我的语言有了非人类听众,而我对此毫无控制

这种不安不会因为技术进步而消失。Agent 的架构可能会免疫提示词注入 —— 就像今天的网站早就不怕 SQL injection 了一样。但「谁有权处理我说的话」这个问题不会因为技术免疫就自动消解。它只会变得更尖锐。因为 Agent 越强、越普遍、越深入日常生活,「我的内容被谁读了、被用来干嘛了」这个问题就越紧迫。

我们需要比投毒更好的回应方式。但在找到那个方式之前,至少可以先认真对待这种不安本身 —— 不要把它当成技术外行的闹剧,也不要把它当成无关紧要的过渡期噪声。

投毒是对缺失的否决权的即兴替代。它不优雅,也不有效 —— 但它填补的,是一个真实的治理空白。也许再过几年,当我们真的有了某种「内容同意权」的框架之后,回头看这些 rm -rf / 的帖子,会觉得它们有点可笑。但那种可笑本身,也记录了一种真实的焦虑,那是我们第一次意识到自己的语言不再只是在对人类说话时的那种焦虑。

本文AI含量 60%

我为什么越来越难定下心来玩游戏了——注意力成了一种奢侈品

本文 AI 含量 40%

前几天晚上本来打算认真读完一篇长文,结果手机亮了一下,点开看了眼微信,顺手刷了两条朋友圈,等回过神来发现自己已经在小红书上无知觉地刷了 10 分钟,文章还停在第二段。

这种经历太常见了,常见到我们已经不觉得有什么问题。但最近读到 Matthew Ball 在 Stratechery 上的一篇访谈,聊游戏行业为什么越来越难做,里面有个观点让我停下来想了很久:游戏曾经最大的优势——要求玩家全神贯注——正在变成它最大的弱点。

抖音可以边刷边聊天边吃饭,vibe-coding 可以后台挂着等结果,但游戏不行。你得双手握着手柄,眼睛盯着屏幕,把整块时间交出去。在一个所有人都习惯了多线程运转的时代,”独占注意力”这件事本身就变成了一种奢侈的要求。

注意力经济

社交媒体本质上是注意力的交易所。每一个小红点、每一次下拉刷新、每一个自动播放的视频,都是在竞价购买你的几秒钟。供给几乎无限,打开手机,永远有新内容等着你。而当一样东西的供给趋近于无限时,它的单位价值就趋近于零。

这就是我们现在所处的位置:碎片化的注意力已经成为了商品。每个人每天都在无意识地批发出售自己的注意力,3 秒给这条视频,5 秒给那个推送,换来的是一点多巴胺和一点信息幻觉。平台赚到了广告费,我们赚到了一个”好像没浪费时间”的错觉。

但经济学的基本规律告诉我们,当一样东西变成了商品,它的反面就自动获得了溢价空间。

深度注意力正在变成奢侈品

想想那些”逆潮流而动”的产品。高端餐厅要求你收起手机,Kindle 的全部设计哲学就是”除了读书你什么都干不了”,黑胶唱片在流媒体时代反而复兴了。它们表面上在对抗碎片化,但本质上做的是同一门生意:**把”你愿意给我完整注意力”这件事变成一种消费行为,然后获取超额收益。

这和奢侈品的逻辑完全一样。当所有人都穿快时尚的时候,手工定制就自动变成了身份信号。当所有人的注意力都是碎片化的时候,”我能坐下来专注两个小时”本身就成了一种稀缺体验。而稀缺的东西,从来不缺买单的人。

黑胶唱片是个特别好的例子。它的音质未必比流媒体好多少,但它要求你付出——时间、金钱、和一整套仪式感。正是这种投入创造了一个”神圣时刻”,让听音乐这件事从日常消费变成了某种接近朝圣的体验。不是媒介决定了意义,而是投入决定了意义。

矛盾:卖”专注”的人得先赢”分心”那一轮

但这里有一个致命的矛盾,要卖的是深度注意力体验,但你得先在碎片化的信息流里抢到用户。你的产品要求人们坐下来、放下手机、全神贯注。但在用户做出这个决定之前,你得先在 3 秒内从无数条短视频和推送通知中脱颖而出。

这就是为什么使用的摩擦力如此重要。Kindle 能成功,很大程度上是因为它的入口极轻,拿起来就能读,5 分钟也行,5 小时也行,没有任何仪式性的门槛。Apple Vision Pro 则正好相反。你得把一个头盔戴在脸上,调瞳距,等待启动,还没开始”沉浸”就已经把人劝退了。同理,我之前一直追求的低摩擦的知识管理体验也是如此。如果一个软件(此处点名批评 Tana)需要等足足半分钟才能打开,那大部分人根本没那个耐心等到能享受专注使用的时刻。

对游戏行业而言,全神贯注曾经是游戏体验的核心卖点,现在却变成了获客的最大障碍。问题不是”要不要做需要深度投入的游戏”,而是如何在碎片化的发现层和沉浸式的体验层之间设计一个足够丝滑的过渡。做到了就大卖,做不到就两头不靠。而在这个人人注意力都很难集中的时代,把时间投给游戏已经变成了十足的奢侈。每当回想起 10 年前上学的时候,可以连着几个小时坐在桌子前在 i wanna 里跳刺,全战里一打就是一夜,这种场景在当下实在是难以想象。

写长文的人也一样

写博客、写长文的人面临的其实是同一个困境。长文的价值在于深度思考,读者花 10 分钟认真读完一篇文章所获得的东西,远不是刷 30 条短视频能替代的。但分发渠道,无论是社交媒体还是推荐算法,全是 3 秒定生死的战场。

也许这就是为什么我越来越觉得,个人博客这种”反效率”的东西反而有它独特的位置。它不需要在 3 秒内抓住谁,它就安安静静地待在那里,等愿意坐下来读的人自己找过来。某种意义上,这也是一种注意力奢侈品,只不过消费它的门槛,仅仅是愿意给出一段不被打断的时间而已。

Agent 是自己的一面镜子

本文 AI 含量 60%

最近看到一条推文,大意是:我以为我在教 Agent 怎么工作,三周后回头一看,被改变最大的那个人是我自己。

这句话击中了我。过去几个月,我一直在配置自己的 AI Agent,经历了完全一样的事。

最开始我是在 Claude Code 里试图搭自己的工作流,但搭着搭着,随着 Openclaw 的出现,我第一次看到了拥有一个 24 小时在线的个人助手的可能。Openclaw不是开箱即用的产品(虽然它看起来是) 。 你得告诉它你是谁、你怎么工作、你希望它怎么跟你互动。听起来像是在「配置软件」,但做着做着我发现,这件事的本质根本不是在配软件,而是在配置自己。

你以为在配 AI,其实在做自我审计

举几个例子。

配置的第一步,是写 SOUL.md —— 定义你希望这个 Agent 用什么语气跟你说话、什么时候该主动、什么时候该闭嘴。

问题看起来简单,真写起来才发现:我从来没认真想过自己到底喜欢什么样的沟通方式。大部分人对 AI 和自己的沟通方式的最典型想象可能还是豆包(所以说字节对产品的 sense 是真的强,虽然不一定每个人都喜欢豆包的沟通方式,但至少不会讨厌),而对我而言,在和 agent 一直对话的过程中,我才了解了自己不喜欢 AI 太热情,但也不想要冷冰冰的工具感;希望它偶尔能挑战我的想法,但别变成杠精。所以最后我在文档里写下的是「克制的副官,偶尔忍不住翻个白眼」。

写完愣了一下 —— 这不就是我对「理想协作关系」的定义吗?这个东西一直在我脑子里,模模糊糊的,但从来没变成过文字。配 Agent 逼我把它写了出来。

第二个例子是设计 Heartbeat系统。Agent 需要定期检查一些事情然后提醒我,但哪些事值得提醒?我得给它分优先级:P0 每次都提,P1 快到 deadline 才提,深夜 11 点之后别打扰我。

这本质上是在回答:什么对我真正重要?

说实话,在这之前,我对自己的注意力优先级没有清晰认知。什么事紧急、什么事重要、什么事可以等 —— 平时都靠直觉,从来没被迫排成一个明确的序列。但 Agent 不接受模糊。你不写清楚,它就不知道该怎么做。

第三个例子更有意思。我给 Agent 设计了一个「主动找我聊」的机制 —— 它会根据我最近关注的话题,偶尔抛一个值得跟进的问题过来。但我得给它画线:每天最多两次,同一话题三天内不重复,晚上 11 点后别推,没有真正有价值的内容就别凑数。

设计这套规则时我意识到,我其实在定义一个非常私人的东西:「主动」和「烦人」的边界。

每个人都被手机通知轰炸过,但很少有人认真想过:我到底希望被怎样打扰?什么信息值得打断我正在做的事?这条线画在哪?之前我对这个问题的答案是模糊的。配完之后,它变成了一组明确的规则。

为什么 Agent 能照见自己

这三个场景有一个共同点:都逼我把模糊的直觉变成可执行的规则。

这件事跟写日记、做笔记有点像 —— 都是通过外化来认识自己。但 Agent 比日记狠得多。日记允许模糊,你可以写「最近状态不太好」然后翻篇。Agent 不行。你说「状态不好的时候别打扰我」,它会追问:什么叫状态不好?怎么判断?几点到几点?

福柯有个概念叫「自我技术」,说的是人会通过特定的实践来认识和改造自己 —— 写日记、冥想、忏悔,都算。配 Agent 大概是这个时代新长出来的一种:你把自己的规则教给一个外部系统,反过来看清了自己到底是怎么运转的。

不是替代,是照见

过去几年,关于 AI 最主流的叙事是「替代」—— AI 会不会取代我的工作?会不会取代人类的创造力?但我自己的经历指向一个完全不同的方向:AI 对我最大的改变,不是替代了某项能力,而是让我看见了之前没看见的东西。

麦克卢汉说媒介是人的延伸。但 Agent 不只是延伸 —— 它还是反射。你往里面投入的是自己的规则、偏好、优先级,它照出来的也是你自己。

如果越来越多人开始配置自己的 Agent,那 AI 对人的改变,可能不是大家担心的那种「取代」,而是一种意料之外的「照见」。这个角度,比「AI 会不会抢你饭碗」有意思多了。


配 Agent 的过程还在继续,镜子里的自己也在不断变化。每隔一段时间回去改改 SOUL.md、调调优先级规则,都会发现:哦,原来我又变了,或者会恍然大悟,原来我的想法并没有表面上那么简单。

也许这才是 AI 时代最值得关注的事:不是让 AI 变得更像人,而是通过 AI,让人更了解自己。

Manus 被收购:三种叙事,三种命运

本文 AI 含量约 20%

最近 Manus 被收购这件事引发了不少讨论,我也来凑个热闹。

除了新闻本身最早看到玉伯的评论引发的争论,他有些悲哀。在他看来,创业公司的使命是挑战恶龙,而 Manus 被收购,意味着又有一个同行者放弃了自己的梦想。当然,这只是从产品层面来看。

随着商务部决定审查 Meta 收购 Manus,这件事已经从纯产品和商业问题变成了地缘政治问题。

三个叙事角度

全球化科技公司叙事的再次破产

自 TikTok 被美国审查并被迫成立合资公司以来,那些曾经「无国界」的科技公司都逐渐有了地缘属性。中美在 AI 产业上的竞争,使得真正意义上的全球化公司愈发不可能。Manus 被审查,又一次验证了这一规律。之前我们以为它被收购意味着美元 VC 的叙事逻辑仍然可行,事实证明并非如此。

过去的全球化,本质上是美国主导的单极秩序的产物。那时「全球化」实际上意味着「美国标准的全球化」。而现在,多个主权实体同时在争夺对科技公司的「定义权」—— 美国用 CFIUS 定义「谁是安全威胁」,中国用《出口管制法》定义「谁在转移国家能力」,欧盟用 GDPR/DMA 定义「谁在滥用市场支配地位」。

Manus 作为中国背景的公司,试图逃离中美的审查环境,却发现自己陷入了多重监管的夹击。

监管套利的边界

Manus 的策略本质上是监管套利 —— 在新加坡注册以规避中国对技术出口和模型使用的监管要求,同时希望绕开美国对投资审查。但他们犯了一个不对称评估错误:高估了「放弃中国市场」的保护效果,低估了中国的反制意愿。

中国的技术出口管制体系过去执行相对宽松,很多创业者形成了「只要不碰军工就没事」的认知惯性。但 Manus 案可能意味着中国开始把「AI 能力」本身视为需要管制的战略资产,而不仅仅是具体的算法代码。

更吊诡的是:Manus 越是「干净地切割」中国业务,反而越容易被视为「有预谋的规避」,触发更强的审查意愿。这是监管套利的经典陷阱 —— 套利行为本身会改变监管者的行为。对 Manus 而言,「退出」本身就成了触发审查的理由。

对 AI 行业创新的影响

这次审查事件还有一个吊诡之处,也是政府会重点考虑的:它对行业创新的影响。这次收购原本给很多创新公司树立了榜样 —— 只要认真创新、走出海外,就有很好的被收购前景。这种前景会促使更多 VC 去支持有潜力的公司。

但从产业政策角度看,政府关心的可能不是这家公司赚了多少钱,而是这次收购如何影响中国在 AI Agent 领域的能力积累。即使 Manus 的技术不是最前沿的,它的人才、工程经验、对中文场景的理解,都是「国家能力」的组成部分。Manus 团队整体并入 Meta,意味着这部分隐性知识的永久流失。

一旦丧失通畅的退出渠道,还会有那么多 VC 愿意支持创业公司成长吗?这是政府需要权衡的问题。如果一个 AI 公司只能服务国内市场,它的能力必然受到约束 —— 使用的模型天生受限,难以获得海外关注;而国内市场和付费意愿毕竟有限,上升空间会被极大压缩。

一家公司,三种叙事

从 Manus 自身角度出发,虽然可以说它是地缘政治下的一枚棋子,试图通过抛弃中国市场、规避美国审查、转移到新加坡来挣扎求存,但我们也要注意到,它实际上有点「柿子挑软的捏」。它选择了规避美国审查,却没考虑中国也可能审查它。被审查之后,它很可能以「被中国迫害」的受害者形象出现,而这想必不是肖弘他们乐意见到的,也是中国政府想要避免的一种叙事。

Manus 作为商业实体的身份虽然是稳定的,但在地缘政治框架下,其身份可以被重新定义。同一家公司在不同视角下会有截然不同的定义:他们被中国政府定义为「中国技术的流失者」,同时被美国政府定义为「具有中国背景的安全风险」,而在另一个视角下又有可能新加坡政府定义为「东南亚科技枢纽的明星案例」

一家公司,三种叙事,三种截然不同的命运。在政治与商业的交叉地带,谁有权定义这家公司是什么,本身就是一个关键的权力问题。Manus 面临的身份撕裂,也是当今时代科技企业的必然宿命。

接下来可能发生什么?

简单预测退下商务部肯定会进行严格审查,但审查结果会综合考虑地缘政治和对中国 AI 行业创新前景的影响。最终这次收购可能会被批准,但形式可能类似 TikTok —— 需要成立合资公司,通过技术授权的方式进行。

具体细节难以预判,但肯定会考虑给 VC 一个退出渠道,以鼓励类似公司的创新。

当然,也存在着走向最差结果的可能性,包括收购被阻止,或者 Meta 采用更极端的 Acquihire 的形式来进行收购,使得 Manus 成为一个空壳,但这种方法却也不可避免地可能会使 Manus 员工自身却面临一些刑事上的威胁。而这肯定是各方都不想走向的一条道路。

不过话说回来,未来这类公司也可能会更多走向通过会员费、订阅等方式自我造血,同时不排斥投资的道路(暨 Manus 被收购前的路线。被巨头收购这条路,恐怕会越走越窄。这又呼应了玉伯最初的愿景:人们会走上「挑战巨龙」的路线,而不是被巨龙吞噬。

只是,当你面对的不是一条龙,而是三条龙同时争夺对你的定义权时,「挑战」本身的含义也变了。

社交媒体时代,我们的「本地人」身份去哪了?

本文 AI 含量 70%。

前几天和 AI 聊了一个问题:互联网和社交媒体到底是增强还是减弱了人们的本地自豪感和归属感?

这个问题让我想了很久。就我个人而言,答案很明确——变少了。通过旅行、互联网、社交媒体看到的世界之大,让我很难再对本地人这个身份产生什么特别的情感。但我又观察到,很多中老年人反而在刷短视频的过程中,进入了一种夸本地的信息茧房,对家乡的自豪感似乎比以前更强了。

三类人,三种方向

在讨论中,我们发现可以把人大致分成三类:

有些人因为看到了更大的世界,本地认同反而变淡了。社交媒体打开了视野,让我们接触到了更多身份选项:职业圈层、兴趣社群、甚至某种全球化公民的感觉。本地认同并没有消失,只是被挤到了优先级更低的位置。

有些人反而在社交媒体上强化了本地认同——以中老年人为代表。他们刷到的多是家乡美食、本地新闻、方言段子,本地自豪感被数字化放大了。

还有些人是离开家乡的人,这群人又分化成了两种:一种是离开后反而更怀乡,通过短视频、家乡博主、方言梗等内容远程维系本地认同;另一种则完全融入了新居住地,甚至比当地人更热衷于维护那里的环境和文化。

看到更大的世界,就会失去归属感吗?

先说第一类人。我最初的直觉是:看到的世界越大,本地归属感就越弱。但仔细想想,这个因果关系可能太简单了。

更准确的说法或许是:社交媒体让我们接触到了更具吸引力的替代认同。当你发现自己可以是互联网从业者、PKM 爱好者、独立思考者时,本地人这个身份的吸引力自然就下降了。不是本地认同被稀释了,而是它在身份优先级的竞争中输给了其他选项。

这让我想起之前收藏过的一篇书评,里面提到一个社会学概念:人们是参与社会系统,而不是属于社会系统。本地人只是我在地理系统中占据的一个位置,但我个人并不等于这个位置。如果我的生活重心、社交网络、情感投入都已经迁移到别处,那本地人就只是一个符号,而非真实的认同。

算法在强化本地认同,还是人们主动选择了算法?

再说中老年人。我最初把他们归因于信息茧房——算法推荐让他们只看到强化既有认同的内容。但这个解释可能过于被动化了他们的角色。

社会学家 Charles Cooley 有一个「镜中自我」的概念:我们依赖别人的反馈来开发自己的身份。他们在算法的镜子里,看到的是自己想看到的自己。不是茧房制造了归属感,而是既有的归属感选择了茧房

还有一个因素是生命阶段。中老年时期的核心任务是整合——把人生经历编织成有意义的叙事。本地认同是这个叙事的重要锚点,强化它是在回应「我是谁、我从哪里来」的存在性问题。

离开家乡的人:向后看还是向前看?

最有意思的是离开家乡的人。同样是迁移,为什么有人更怀念故乡,有人却比当地人更热爱新居住地?

关键变量可能是迁移的主动性在新地方的社会嵌入深度

主动选择迁移、且在新地方建立了实质社会网络的人,更可能全情投入新居住地。主动迁移意味着放弃了其他选项,为了消除「我是不是选错了」的认知失调,人们会不自觉地强化「我选对了」的信念,表现为对新居住地的积极维护。

此外,本地人对家乡的一切习以为常,而新来者看到的是被发现的宝藏,边际效用自然更高。再加上外来者需要通过可见的行动来赚取归属资格,而本地人的归属感是继承的,不需要证明。

相反,被动迁移、或在新地方始终处于边缘的人,更容易退回到远程怀乡的模式。那是一种低成本的认同维系——只需要点赞转发,不需要真正付出。

某种程度上,前者经营的是当下的本地,后者消费的是记忆中的本地——一个向前看,一个向后看。

从「你是哪里人」到「你在哪里参与」

本地认同正在从地理绑定变成可选择的身份消费

社交媒体让参与变得可以跨越物理距离。你可以人在上海,却通过刷家乡的短视频参与南京的社会系统;你也可以从未去过成都,却因为关注了太多成都博主而对那里产生了某种虚拟归属感。

这种变化未必是坏事。也许我们正在从「你是哪里人」的归属问题,走向「你在哪里参与」的行动问题。前者是被动继承的,后者是主动选择的。

在这个意义上,社交媒体给了我们更多选择的自由,尽管这种自由有时也意味着迷失。

不要在公司 Teams 里说 “shit”

本文 AI 含量 70%。

这两天,公司的 Teams 群里上演了尴尬一幕。某个服务宕机后,一位同事在群聊中下意识地回了一句 “shit”。在我们看来这稀松平常,但一位韩国 Leader 随即在群里严厉警告:Watchout your language。

这次冲突让我意识到,作为中国人,我们对英语脏话的钝感与他人的敏感之间,存在着从心理到文化上的诸多差异。

先不提这个 Leader 是不是英语母语。在不同语言的人们的沟通中,存在着一种情感分离效应(Emotional Detachment)。 对非母语者而言,第二语言的脏话往往被剥离了情感重量,退化为单纯的语义符号。说出 “shit” 或 “fuck” 时,大脑中负责恐惧与羞耻的边缘系统并未被激活,它们听起来更像加强语气的助词。但对母语者而言,这些词根植于成长环境,自带生理性的攻击力,能瞬间唤起真实的冒犯感。

此外,文字作为一个媒介,它和日常的口语说话时也不一样。文字是冻结的,它没有人们日常说话时的肢体动作、表情等作为缓冲。这行字所携带的攻击性,被文字这个数字化媒介放大,往往会被解读为情绪失控,甚至缺少职业素养。

当然,人们反应的不同和行业有一定关系。如果是在一些互联网企业,有时候在软件里说脏话,会被认为是非常正常的一种行为,因为你的情绪是允许激动的,大家交流更加随意。而在一些传统行业里,脏话往往会被认为此人情绪不稳定等等。

不同文化里的人对脏话的接受程度也不同。可能在一些文化里,人们会觉得用脏话只是非常正常的一种表达方式,而对于一些比如韩国、日本这些大量使用敬语的国家而言,说脏话是非常没有素质的。

让我们脱离开这个工作场景,往上再看一层,看一下在中国互联网语境和外国互联网语境中的区别时,又会发现一个更有趣的视角。

我们在数字化方面形成了一种独特的「方言」。在中国互联网语境下,我们会习惯了使用微信来进行工作。Teams 对我们而言只是一个企业版的微信。我们在发消息的时候是碎片化、即时性甚至情绪化的。我们把秒回视为敬业,把这种口语化短句视为高效。

然而在欧美传统职场,Teams 更像是一种「短邮件」。他们遵循低语境逻辑,严格区分公私领域。他们追求异步沟通,要求一次性把背景、问题和行动精准表达。在这种追求信息密度的“邮件式场景”中,一句纯粹发泄情绪的脏话,不仅显得多余,更是一种破坏专业性的噪音。

如何通过 Notion AI 追踪自己的情绪

自从 Notion 进入 3.0 时代之后,我又重新订阅起了 Notion AI,其中的原因很简单,就是 Notion Agent 的引入使得每个个体的信息库、知识库,乃至项目管理的效率大幅提升。

目前我每天频繁会使用至少 3 个 agent,来进行学习、阅读、生活管理。今天我来分享一下如何通过 AI 来追踪自己的情绪。

流程

先说一下我的做法。一般白天我会在我的手帐里以 lifelog 的形式记录我当天遇到的事情、完成的任务、遇到的有趣的事,乃至阅读中的闪念。日常手边只有手机的时候,也会通过 Flomo 来录入。每天晚上,我会通过闪念贝壳,来把这些 lifelog 通过语音转文字一口气录入给 Notion AI。

Notion AI 会调用我的一个「日报助手」agent,来对我的 lifelog 以及当天从其他各个途径录入到 Notion 的信息进行分析,而其中我设置了一个 property 是分析当天的 lifelog,判断我当天的情绪

一开始我只随便写了一句话 prompt, 让 AI 分析我当天的主要情绪前些天和 Marvix 聊了之后,决定尝试一下用更科学的方式来对自己长期的情绪进行追踪。他的建议包括通过「八大情绪」来把情绪更加科学地进行整理。

根据他的建议,我写了一段 prompt (请阅读我输入的内容。基于 Plutchik 的八大情绪分类(喜悦、信任、恐惧、惊讶、悲伤、厌恶、愤怒、期待),分析我在这篇日记中体现的主要情绪。选择一个选项填入。)和标签设置之后,我试着把之前一个月的记录批量生成了一次情绪,结果却发现,为什么过去 30 天里,有 20 天我的情绪都是「快乐」?

我当然希望自己是个快乐的人,很多人也评价过我「情绪平稳」。但我很清楚,作为一个牛马,工作中必然会遇到挫折,生活中和家人的互动,乃至居家生活中,情绪也必然会有起伏,但这些波动在 AI 的总结里全都消失了,只剩下一片祥和的「快乐」。

那么显然,要么是我的输入有偏,要么是「算法」出了问题。

问题在哪里

我的输入是有偏差的

尽管日记本身是给自己记的,但是记录的过程本身却可能会发生在公共场合。为了维护在他人心中一个积极、阳光向上的形象,在记录时,我的记录会不自觉地变得更加平和,这会造成日记和实际情绪的偏差。

另一个原因则是我的输入方式的问题。当用笔记录下内容的时候,当时的情绪可能会得到宣泄。但当一整天过去,晚上通过语音进行录入时,那些负面情绪往往会已经消退了,即所谓的「褪色情感偏差」,输入到 Notion 里的内容会缺失了很多负面情感。

大语言模型的问题

在输入之外,还有一些偏差可能是由模型带来的。LLM 自带的两种特性:积极偏见(Positivity Bias)与 平均化逻辑。

积极偏见

当你把一整天的流水账丢给 AI 时,其中 80% 的内容其实是中性的维护性事务:起床、通勤、吃饭、完成任务。在没有显性的负面关键词(如「痛苦」、「崩溃」)时,AI 倾向于将“生活正常运转”理解为「快乐」。

平均化

我之前的指令是让 AI「分析这一天的主要情绪」。想象你是一个调酒师:你倒进了一份咖啡、一份白开水、一份威士忌、一份橙汁和一杯快乐水。搅拌之后,你问 AI 这杯水是什么味道?AI 尝了一口,礼貌地回答:“嗯,甜甜的,还能喝。” ——这就是那个虚假的「快乐」。

生活中的情绪不是平均数,很多时候,决定我们那一天心理状态的,往往是那一两个剧烈波动的瞬间。而这是 AI 在不经调整的情况下无法理解的。

修正

明确了问题,那下面就需要对输入和算法进行修改了。

提高输入的「信噪比」

发现问题后,我开始调整我记录 Lifelog 的习惯。

语音转文字虽然方便,但往往会丢失语气。如果我只是记录「今天老板驳回了方案,我改了第二版。」AI 读到的是「完成了任务 -> 勤奋 -> 快乐。」但当时我的真实心境可能是极度挫败的。所以现在,我在录入时会刻意增加主观形容词的密度:

「今天老板驳回了方案,我觉得很受打击,这完全是在浪费时间,但我不得不硬着头皮改了第二版。」

这一句话的改动,就能让 AI 敏锐地识别出「厌恶」或「悲伤」,而不是原本那个和稀泥的「快乐」。

并且,在一天的最后通过语音输入的时候,我也会主动保留原纪录里的一些语气词。

迭代 prompt

心理学中有一个著名的 「峰终定律」(Peak-End Rule):人对一段经历的记忆,主要取决于情绪最强烈的瞬间(峰值)和结束时的感觉(终值),而不是整个过程的平均体验。

既然我要做的是「情绪追踪」,我就不应该让 AI 来取平均,而应该让它做「雷达」,来发现我记录中真正影响情绪的部分。

于是,我重写了我的 Prompt。我不再要求 AI 总结全天,而是要求它捕捉异常值。以下是我迭代后的 Prompt,如果你也在用 Notion AI 做类似的事,可以直接拿去用:

Role: 你是一位敏锐的心理情绪分析师。
Task: 阅读这一天的 LifeLog,基于 Plutchik 的八大情绪分类,找出这一天中情绪强度最高的那一种情绪。
Rules:
- 忽略流水账: 自动过滤掉吃饭、睡觉等常规活动,除非包含强烈的主观形容词。
- 捕捉异常值: 不要对全天的情绪取平均值。哪怕一整天都很平静,但有 15 分钟极度的「愤怒」或「悲伤」,这一天的标签应该是「愤怒」或「悲伤」。
- 负面敏感: 即使正向事件数量多,如果存在明显的负面情绪事件,请优先权衡其对心理的影响。

效果非常明显,我用 Notion AI 重新跑了过去一个月的数据,

「快乐」从 20 次降低到了 12 次,与之相对的是「自责」和「生气」的大幅上升。

虽然快乐仍是主流,但无疑更符合我日常的体感。

此外,我还添加了一个更进一步分析情绪的prompt,以帮助我更细化了解为什么会有这个情绪,强度如何,以及有什么更细微的情绪变化。

结合我的情绪,给出情绪强度【1-10】,用一句话总结引发情绪的具体事件,并描述出当天情绪的细微差别: [用更精准的词描述,如:焦虑、自豪、惆怅]」

为什么要做这些

做情绪追踪这件事的初衷,并不是为了得到一张漂亮的图表,而是为了提升对自我的了解,以针对性地改善自己的生活。

如果我的生活只有「快乐」和「不快乐」两种状态,那我的认知就是低分辨率的。通过强迫 AI 去区分我是「愤怒」还是「恐惧」,是「期待」还是「信任」,我也在强迫自己去正视那些被忙碌掩盖的细微感受。

数据有时候会撒谎,特别是当 AI 会试图讨好你的时候。我们能做的只能是尽可能地纠偏,纠 AI 的偏,也纠自己的偏。

为什么同样是「四处出击」,腾讯比字节更容易被骂?

注:本文由 Notion AI 整理

前几天在即刻上看到潘乱发起了一个讨论:为什么同样是在各个领域出击,字节相比于腾讯被骂得少了很多?这个问题让我想了很久,于是和 GPT5.1 展开了一场长谈。整理这次对话的过程中,我发现这个问题远比表面看起来复杂得多。

一个核心的认知差异

在开始分析之前,先说一个最重要的观察:腾讯和字节在用户心智中扮演的角色完全不同。

腾讯更像是「既得利益的垄断守城者」,而字节更像是「后来者、搅局者、甚至有点草台班子气质的挑战者」。这种角色认知的差异,叠加了时间节点、商业模式、舆论结构等多重因素,最终导致:

  • 腾讯被骂多的是「垄断、收割、堵路」
  • 字节被骂更多的是「内卷、文化、内容价值观」

但在「跨领域扩张」这个维度上,字节的「垄断资本恶龙」形象确实没那么重。

时间节点决定了角色定位

腾讯:在关键时刻成为基础设施

腾讯真正奠定今天地位的时期,是 PC 互联网向移动互联网迁移的那几年。当微信横空出世时,很多领域还处于「可被重构」的阶段——移动社交、移动支付、移动内容分发都还没有定型。

腾讯用已经建立的优势(QQ 的社交关系、游戏业务、内容平台)迅速建立了基础设施型垄断。在用户和行业的认知中,「某个领域刚起来就被腾讯全部打包带走」这种印象,很容易形成「扼杀创新」的叙事。

字节:存量时代的挑战者

相比之下,字节崛起时,移动互联网的格局已经基本定型,BAT 已经确立。即便今天抖音再强,整体的「基础设施格局」也从来不是它掌握的。

这就导致字节的扩张更容易被解读为「想从巨头手上撕下一块肉」,而不是「拦在新玩家门口不让进」。同样是到处出击,腾讯是从「强者更强」出发,字节是从「弱者上位」出发——后者的道德负担自然轻一些。

进入赛道的动机叙事完全不同

腾讯:在红海后期强化封锁

很多针对腾讯的批评来自这样一种模式:等创业公司把赛道教育出来,用户已经形成习惯,然后腾讯要么重仓投资头部(通过「投资+流量」形成封闭生态),要么自己出一个「集大成者」,配合微信/QQ 导流压制其他竞争者。

这种打法在商业上无可厚非,但舆论上非常容易被写成**「垄断、扼杀创新、收购再封锁」**的故事。

字节:试错驱动的扩张

字节很多领域是自己从 0 做到规模的,比如信息流新闻、短视频、电商直播。它往往把一个赛道从边缘推成主流,而不是等别人做成了再进场。

即便是后来切入的领域(搜索、电商、音乐),也更像是把原本「被某家大厂锁死」的结构打乱,拉高整个赛道的竞争强度。行业叙事就变成了:「让腾讯/阿里不敢躺着收钱」,而不是「阻止别人成长」。

字节的很多项目给人的印象是「高风险、高死亡率的试验田」,而腾讯的项目给人的印象是「已经算好账的扩张棋子」。在舆论中,前者更容易被当做「创新尝试」,后者更容易被当做「资本收割」。

舆论结构的隐形影响

这里有一个容易被忽略的点:你看到的「谁更被骂」,很可能受到信息采样偏差的影响。

针对腾讯的负面叙事,很多是在新闻、长文、专业论坛中沉淀的——这些内容更容易被关注互联网行业的人看到。而针对字节的负面(沉迷、低俗、直播乱象),被拆散在大量零散内容和个体吐槽里,感知上就不那么集中。

更有意思的是,字节掌握的抖音和头条,本身就是算法驱动的内容平台。算法的「隐性控制」让用户不太容易感知到平台在操控舆论,而更像是「只是推你喜欢看的」。相比之下,腾讯在社交和内容领域的控制更「可见」,也就更容易被质疑。

业务痛点的类型差异

还有一个维度值得注意:腾讯和字节对用户造成的「直接痛点」不一样。

腾讯的痛点集中在刚需基础设施

  • 微信社交不能不用
  • 微信支付深度嵌入生活
  • 游戏高利润与「未成年」「氪金」等议题高度绑定

这些领域一旦被认为「不公平、不开放、滥用地位」,情绪会非常集中。

字节的痛点集中在娱乐/内容层面

  • 抖音是「强上瘾但非绝对刚需」的产品
  • 用户更多骂「我自己控制不住」「孩子被带坏」
  • 这类痛苦在心理上更容易被归因为「我自己不自律」,而不是「平台滥用权力」

对刚需基础设施的不满,更容易转化为对平台本体的道德审判;对娱乐内容的不满,更容易转化成「这社会就这样了」的叹气。

一些被忽视的变量

在和 GPT5.1 的对话中,它还提醒我注意了几个容易被忽略的因素:

创新叙事的差异:腾讯长期背负「抄+买+封」的标签,而字节至少有几个「硬创新」能拿得出手(今日头条的推荐算法、抖音对短视频形态的重塑)。有了这些,舆论更容易给它「有真本事」的期待。

开发者生态的关系:腾讯对开发者生态的封闭和博弈(小程序规则、外链限制、账号体系封闭)是长期怨气的来源。字节在这方面的控制力没那么强,甚至在某些阶段被视作可以「绕开腾讯的一个通道」。

成长故事的加成:用户天然会给「白手起家、打破旧格局」的公司情感加分。即便字节今天已经是巨无霸,很多人情感上仍把它当成「敢挑战巨头」的代表。

写在最后

整理完这次对话,我发现这个问题的答案其实没有那么简单。不是说字节就比腾讯「更好」或「更坏」,而是它们在不同的时间节点、以不同的方式、进入了不同成熟度的赛道,最终在公众心智中形成了完全不同的形象。

腾讯被要求像「公用事业」一样克制,因为它掌握了太多基础设施;字节还没到那个位置,所以道德审视的标准也不一样。

也许再过几年,当抖音真的变成下一代的「国民级基础设施」时,字节也会面临和今天腾讯一样的拷问。到那时,会有新的挑战者出现,继续这个循环。所谓的「屠龙者终会成为恶龙」的故事永远不会停止上演。

AI 录音硬件是个伪需求吗?(Plaud Note Pro 购买复盘)

自从以 Plaud 为首的 AI 录音软件在国际市场崭露头角,越来越多的人开始关注这个领域,也有越来越多的厂商进入这个赛道。尽管社交平台上不乏质疑声,但至少这是个逐渐升温的市场。

我的探索历程

最初,我在 2022 年底发现了 Rewind(现已更名为 Limitless)。它推出了一款名为 Pendant 的颈挂式智能硬件,号称可以记录生活中的所有输入。我第一时间预订了这款产品,但它经历了一次又一次的跳票,直到今年才大规模发货。而我在 2024 年就已经取消了预订。

期间,我也尝试过传统大厂的产品,走了不少弯路,比如购买 DJI Mic Mini 来充当录音笔。最终,当 Plaud 这款相对昂贵的产品进入我的视野时,我立刻被它的颜值和功能吸引,果断入手。

起初我想买海外版,也看了很多评测。就在准备下单前一天,Plaud 上新了 Plaud Note Pro,我按捺住了冲动。一周后,Plaud 宣布在国内上市。我曾纠结于国内版和海外版的选择——海外版可以使用国外模型,而国内版因合规要求只能使用国内模型。综合考虑后,我最终选择了国内版,将其作为录音硬件使用,搭配自己订阅的 Gemini 模型。

AI 录音软硬件是真需求吗?

回到核心问题:AI 录音软硬件是否是刚需?我们可以从两个维度来理解这类产品的定位:

  • 便携录音笔
  • AI 场景入口

我需要一个便携录音笔吗?

从第一个维度看,经过实际体验,答案毫无疑问是**「要」**。

主要原因在于,手机虽然是最方便的录音工具,录音效果也不错,但它会被随时占用。长时间录音时,录音功能很容易被其他软件抢占,导致录音暂停,甚至后台被杀,无法保存录制内容。

与此同时,我有一个常见的需求:日常通勤或晚上锻炼时,我经常骑电动车或公路车,时长半小时到一小时。这期间,我会戴着一只 AirPod。

由于苹果系统的限制,戴着耳机时,录音系统会自动选择最后接入的设备作为麦克风。也就是说,戴上耳机后开始录音,耳机的麦克风就会成为默认选项。

AirPods Pro 的麦克风质量远逊于手机自带麦克风,尤其在通勤和骑车场景下,风声和周围噪音会让录音几乎无法使用。

这种场景下,一个既能便携地吸附在手机背面、又能独立分拆的麦克风,自然成了我的需求之一。

另一个场景是:在外听讲座或参加快速会议时,拿出手机录音显得很不礼貌,也容易遭人拒绝。而吸附在手机背后的麦克风,影响程度会小得多。

这也是我没有选择 Plaud Note Pin 这类装饰型产品的原因——装饰虽小,但仍然显眼,一旦被认出来就会很尴尬。

我需要一个硬件产品作为 AI 场景入口吗?

答案是需要,但 Plaud Note Pro 并不是我理想中的产品。

之前我也看过 Plaud 创始人许高以及莫浩宇在博客访谈中的分享。他们并未将 Plaud 定位为单纯的硬件公司,而是希望通过积累用户日常生活中的上下文数据,让人们逐渐依赖 Plaud 及其背后构建的生态数据库。

但对我而言,我是否愿意将所有上下文、所有 context 都托付给 Plaud?至少目前,答案是否定的。我的上下文不仅包括日常语音,还涵盖各种剪藏、快捷输入、主动记录的笔记,以及日常的存储数据库等。Notion(结合 Notion AI)是我这半年来最主要的个人场景整合工具之一,这点我会在之后关于生产力系统的文章中详细说明。

在这种情况下,我显然不希望将所有数据都绑定在 Plaud 这个产品内。这也是我选择 Plaud 国内版而非国际版的原因。使用国际版意味着需要支付更多费用来获取最优模型,而它自己的 APP 目前使用体验还比较差。因此,我倒不如只使用它最基础的语音转文字功能,提取出转写文稿。

我用当前最好的大模型——我订阅的 Google Gemini 2.5 Pro,来对这些语音转文字素材进行总结,再录入到 Notion 中。从效率上并没有损失太多。而且即使用完本月语音转文字的配额,我还有其他买断制语音转文字产品,可以进行语音转文字转写,之后再在 Gemini 里整理。

这样,我既能获取最好的模型,达到想要的效果,同时又能保证所有内容、所有上下文都在统一的场景下得到管理。这对我而言,无疑比将所有内容都托付给 Plaud 更具吸引力。

所以,AI 录音硬件是一个伪需求吗?

对于我而言,答案很明显:并不是。而我相信,在现实世界中,有许多与我有类似需求、面对类似场景的人,同样需要 AI 录音硬件为他们的日常工作生活赋能。

然而,我需要的不是生态而是工具。

不可否认,Plaud 和 Limitless 这类公司的愿景极为宏大。可以想见,他们作为生态系统所要达成的目标,在可预期的未来是有可能实现的。然而,OpenAI 之类的公司也必然会设法抢占这一市场。而 Plaud 之类的公司在之后走向开放,比如开通更多自动化 API 功能,也许是一个思路。

这些 AI 录音硬件公司当下要做的,唯有将产品尽可能打磨至极致。就像 Plot 那样,把产品打磨成一件艺术品——继承苹果过往的美学基因,让人因设计而买单,而非仅因功能而买单。这或许是他们能够走下去的一条路径。

那么,AI 录音硬件是伪需求吗?它不是。但市场空间能有多大,取决于这些公司能看到多远,走到多远了。

预制菜为什么是个问题——读财新专题报告有感

预制菜的热点也快过去了,老罗也把重心放回到了播客上(对老罗播客的一些观感可见罗永浩播客感想)。虽然他一开始肯定是有蹭热度的心态,但最终发展到如此大的影响面想必也是他没有料到的。

财新一周前的周刊里有一篇文章对预制菜做了详细的报道,里面的一些分析思路挺有意思,摘录一些放在下文。

国内预制菜的发展历程

和发达国家不一样的路径

日本及部分西方国家食品工业话较为成熟,带动了预制菜的发展。
中国实际上是从另一条路径走上了预制菜发展的道路。预制菜是外卖行业蓬勃发展所推动的。现在外卖收入在不少餐饮店的整体收入占比中超过一半,在平台「半小时达」的要求下,商家必然注重出餐速度,门店现制显然不可能。

疫情的奇妙影响

预制菜投资热的关键催化因素是疫情推动了冷链物流网络的的建设布局,进一步解决了供给问题,加上消费者当时对于预制菜有需求,拉高了资本市场预期。

预制菜的好处

• 规模效应 – 集中采购原料,降低成本
• 品牌化 – 不同门店口味统一

此外还有一个没想到的角度:

传统餐饮服务业的增值税率为 6%,而将菜品制作环节外包给预制菜工厂,后者的增值税率可能按 9%或 13%征收。对于国家来说这进一步优化了税基结构。

预制菜问题并不只是食品安全问题

《食品安全法》只要求食品无毒无害,而这段时间激起讨论的扳机反而是销售中的欺诈问题。

消费者关注的核心是透明度,是不希望在承担高价格的时候成为冤大头。

食品工业的发展是必然趋势,市场上出现越来越多的「预制菜」也是无法避免的。当前对于预制菜的定义在消费者、行业、政府之间存在很大的 gap,西贝就是在拿自己参与订立的行业标准来试图建构消费者的内心概念,最终反而和消费者背道而驰。

重新建立商家和消费者之间的互信需要行业自律,也更需要一些政策上的监管,也期待能有一些诉讼案例能提供参考。