AI - Bowl of Dots

Agent 是自己的一面镜子

本文 AI 含量 60%

最近看到一条推文，大意是：我以为我在教 Agent 怎么工作，三周后回头一看，被改变最大的那个人是我自己。

这句话击中了我。过去几个月，我一直在配置自己的 AI Agent，经历了完全一样的事。

最开始我是在 Claude Code 里试图搭自己的工作流，但搭着搭着，随着 Openclaw 的出现，我第一次看到了拥有一个 24 小时在线的个人助手的可能。Openclaw不是开箱即用的产品（虽然它看起来是) 。你得告诉它你是谁、你怎么工作、你希望它怎么跟你互动。听起来像是在「配置软件」，但做着做着我发现，这件事的本质根本不是在配软件，而是在配置自己。

你以为在配 AI，其实在做自我审计

举几个例子。

配置的第一步，是写 SOUL.md —— 定义你希望这个 Agent 用什么语气跟你说话、什么时候该主动、什么时候该闭嘴。

问题看起来简单，真写起来才发现：我从来没认真想过自己到底喜欢什么样的沟通方式。大部分人对 AI 和自己的沟通方式的最典型想象可能还是豆包（所以说字节对产品的 sense 是真的强，虽然不一定每个人都喜欢豆包的沟通方式，但至少不会讨厌），而对我而言，在和 agent 一直对话的过程中，我才了解了自己不喜欢 AI 太热情，但也不想要冷冰冰的工具感；希望它偶尔能挑战我的想法，但别变成杠精。所以最后我在文档里写下的是「克制的副官，偶尔忍不住翻个白眼」。

写完愣了一下 —— 这不就是我对「理想协作关系」的定义吗？这个东西一直在我脑子里，模模糊糊的，但从来没变成过文字。配 Agent 逼我把它写了出来。

第二个例子是设计 Heartbeat系统。Agent 需要定期检查一些事情然后提醒我，但哪些事值得提醒？我得给它分优先级：P0 每次都提，P1 快到 deadline 才提，深夜 11 点之后别打扰我。

这本质上是在回答：什么对我真正重要？

说实话，在这之前，我对自己的注意力优先级没有清晰认知。什么事紧急、什么事重要、什么事可以等 —— 平时都靠直觉，从来没被迫排成一个明确的序列。但 Agent 不接受模糊。你不写清楚，它就不知道该怎么做。

第三个例子更有意思。我给 Agent 设计了一个「主动找我聊」的机制 —— 它会根据我最近关注的话题，偶尔抛一个值得跟进的问题过来。但我得给它画线：每天最多两次，同一话题三天内不重复，晚上 11 点后别推，没有真正有价值的内容就别凑数。

设计这套规则时我意识到，我其实在定义一个非常私人的东西：「主动」和「烦人」的边界。

每个人都被手机通知轰炸过，但很少有人认真想过：我到底希望被怎样打扰？什么信息值得打断我正在做的事？这条线画在哪？之前我对这个问题的答案是模糊的。配完之后，它变成了一组明确的规则。

为什么 Agent 能照见自己

这三个场景有一个共同点：都逼我把模糊的直觉变成可执行的规则。

这件事跟写日记、做笔记有点像 —— 都是通过外化来认识自己。但 Agent 比日记狠得多。日记允许模糊，你可以写「最近状态不太好」然后翻篇。Agent 不行。你说「状态不好的时候别打扰我」，它会追问：什么叫状态不好？怎么判断？几点到几点？

福柯有个概念叫「自我技术」，说的是人会通过特定的实践来认识和改造自己 —— 写日记、冥想、忏悔，都算。配 Agent 大概是这个时代新长出来的一种：你把自己的规则教给一个外部系统，反过来看清了自己到底是怎么运转的。

不是替代，是照见

过去几年，关于 AI 最主流的叙事是「替代」—— AI 会不会取代我的工作？会不会取代人类的创造力？但我自己的经历指向一个完全不同的方向：AI 对我最大的改变，不是替代了某项能力，而是让我看见了之前没看见的东西。

麦克卢汉说媒介是人的延伸。但 Agent 不只是延伸 —— 它还是反射。你往里面投入的是自己的规则、偏好、优先级，它照出来的也是你自己。

如果越来越多人开始配置自己的 Agent，那 AI 对人的改变，可能不是大家担心的那种「取代」，而是一种意料之外的「照见」。这个角度，比「AI 会不会抢你饭碗」有意思多了。

配 Agent 的过程还在继续，镜子里的自己也在不断变化。每隔一段时间回去改改 SOUL.md、调调优先级规则，都会发现：哦，原来我又变了，或者会恍然大悟，原来我的想法并没有表面上那么简单。

也许这才是 AI 时代最值得关注的事：不是让 AI 变得更像人，而是通过 AI，让人更了解自己。

2026年2月28日

沉迷 Claude Code 的这半个月：Reader 改造计划

本文 AI 含量 60%

距离上一次更新博客已经过去了 20 多天。这半个月，我的大部分时间都被 Claude Code 占据了。

半个月前，我终于没忍住买了 Claude Code 100 刀的会员。买完之后，每次想到 token 额度没用完，就觉得亏。于是大部分时间都扑在了 Claude Code 上。

那么，这半个月我用 Claude Code 主要做了什么？

帮朋友做了一个选课工具。
搞了自己的打卡 app、content digest 早报邮件，家里用的小工具。
剩下绝大部分时间，都花在建造自己的阅读器上。

为什么要自己做阅读器

说起原因，得先回顾我的阅读器使用经历。

五六年前开始订阅 Readwise，后来 Readwise 出了 Reader，它便成了我的主力阅读器。

Reader 确实有不少优点：解析好、方便高亮，与 Readwise 的高亮系统集成度高，还支持不少快捷键。

但它也有让我受不了的地方。最大的问题是颜值：虽然支持浅色、深色主题切换，却不支持自定义字体和背景。它的背景非白即黑，盯久了眼睛累。另外，PDF 以外的文件上传也挺麻烦，也没法翻译外文文章。

于是我尝试用不同软件来阅读，最终形成了现在的模式：

微信文章：用「新枝」。它支持自定义背景，也能用官方设定的字体。但对国外链接支持很差。
长篇 PDF 拆书学习：用 Heptabase。

但这两者的高亮都无法与 Readwise 同步。没法同步，就意味着没法把它们集成到其他工具中。

虽然我现在重新开始用手写笔记记录感兴趣的内容，但在外面，比如通勤时阅读文章，总不能掏出本子乱写一通。这种场景下，简单的高亮还是有用的。

我之前没有任何编程经验，自然没办法改进体验。直到半个多月前的一天，我把这些困扰告诉了 Claude。

我告诉它我的诉求：

一个美观、可自定义的阅读软件
高亮能同步进 Readwise
能解析文章链接
支持上传文件

这里的「上传文件」主要是指：我用 Podwise 总结那些没时间听的播客，再通过 Claude Code 把文字稿转成播客精读稿（攒了 100 多篇了）。

Claude Code 告诉我一个我之前不知道的事：Readwise 有 Reader API，可以把文章内容导出来，还支持不少字段筛选。正巧刚订阅了 Claude Code，我决定基于这个 API，开发一个由自己掌控的阅读器。

最初的样子

第一版非常简单。我把需求告诉 Claude Code，它建议用 Astro 搭一个静态站点，把 Markdown 文件渲染出来就行。

作为编程小白，我之前选博客框架时听说过 Astro，但完全不知道它具体能做什么。Claude Code 说它的 Content Collections 功能天然适合这个场景。于是我在本地 Obsidian 用 Claude Code 把播客文字稿转换成精读稿，用脚本自动同步到 GitHub 仓库，Vercel 检测到更新就自动部署。整个流程不需要数据库，不需要后端，纯静态。

为了让阅读体验舒服一点，我让 Claude Code 帮我调样式。最后选了 Flexoki 这个护眼配色 —— 背景是淡淡的米黄色，文字是深灰而非纯黑，长时间盯着不累。字体用思源宋体，中文阅读的经典选择。终于告别了 Readwise 那个纯白纯黑的刺眼背景。

这个版本用了大概两周，每天晚上拿 iPad 打开网页读文章，感觉还不错。

但很快就不够用了

问题出在「高亮」上。

阅读时划重点是我的习惯，而且希望这些高亮能同步回 Readwise，方便之后回顾。但静态站点没有后端，高亮数据只能存在浏览器的 localStorage 里，换个设备就没了。

这让我面临一个选择：要不要把这个「小工具」改造成「小应用」？

纠结了几天，还是决定干。原因很简单：做都做了，不如做完整一点。反正有 Claude Code，我又不用自己写代码。

SaaS 改造

所谓 SaaS 改造，说白了就是加数据库和 API。

Claude Code 帮我选了 Turso 作为数据库 —— 一个基于 SQLite 的边缘数据库，有免费额度，跟 Vercel Edge Functions 配合得很好。ORM 用的是 Drizzle，据说类型安全，写起来很舒服（虽然我也不懂这些术语什么意思）。

改造后的架构变成这样：

Astro 切换到 hybrid 模式，首页还是预渲染，API 路由按需执行
文章存在数据库里，通过 API 增删改查
高亮数据也存数据库，可以跨设备同步
接入 Readwise API，定时把新收藏的文章拉过来

这一步踩了不少坑，后面会说。

功能堆叠

SaaS 改造完成后，我开始往上加功能。有些是一开始就想做的，有些是用着用着才发现需要的。每次有新想法，告诉 Claude Code，它就帮我实现。

阅读进度追踪 是第一个加的。思路很简单：监听滚动位置，防抖保存到数据库，下次打开自动恢复。还做了一个顶部的细进度条，显示当前读到哪了。

多主题支持 是标配。Flexoki 本身就有 Light 和 Dark 两套配色，Claude Code 按官方色值做了两套 CSS 变量。为了避免页面闪烁（先显示浅色再切换成深色），在 HTML head 里加了一段内联脚本，在页面渲染前就应用好主题。此外我还加入了 Nord、Ayu、Monokai Pro 等好几个主题。

批量管理 是为了解决「归档焦虑」。有时候一口气想清理掉十几篇文章，一篇篇点归档太慢了。所以做了个管理模式，可以多选后批量归档或删除。

「下一篇」按钮 是个小细节但很实用。读完一篇，点一下就跳转到下一篇，同时自动把当前这篇归档。连续阅读体验好了很多。

沉浸式翻译 偶尔面对一些长文我也会想偷懒，翻译成中文。所以我接了自己的 Gemini 2.5 Flash Lite 模型，模仿了沉浸式翻译的样式，速度还挺快。

阅读器设置面板 是后来加的。原本主题切换和字体切换是分开的，用着用着觉得该整合起来。现在点顶栏的 Aa 按钮，可以调字号、行间距、正文宽度，还能选不同的配色主题。

踩坑实录

虽然代码都是 Claude Code 写的，但做这个项目的过程中还是踩了不少坑。

iOS PWA 的字体不显示

这个问题困扰了好几天。

我用的思源宋体是从 CDN 加载的。浏览器里一切正常，但把网页添加到 iPad 主屏幕作为 PWA 打开后，字体就变成了系统默认的黑体。

一开始以为是 Service Worker 没缓存好，让 Claude Code 折腾了一圈，发现不是。后来查资料才知道：iOS PWA 在 standalone 模式下，跨域的 CDN 资源加载有问题。

解决方案是把字体文件下载到本地，直接打包进网站。一个可变字重的思源宋体 WOFF2 文件有 21 MB，但没办法，为了字体能正常显示，只能接受这个体积。

Readwise API

另一个比较大的坑来自 Readwise API。

Readwise API 在官方文档里明确表示，它主要用于个人导出自己的文章和文档。当我想批量拉取文章时，很容易触发速率限制。而且我的数据库结构跟 Readwise API 的数据格式差异不小，开发过程中反复调试。

之后为了防止 API 在公网上被滥用，我还加了密钥验证。在浏览器上使用时，需要先输入密钥，才能进行拉取和高亮等操作。而这个密钥功能整整折腾了我两周 —— 各种场景切换以及新功能的变动，都可能导致需要重复输入密钥。

直到这两天，我才终于把这个问题基本修好。

现在的样子

折腾了半个多月，我的 Reader 现在有 40 多个功能点，代码量大概一万行（当然都是 Claude Code 写的，我最多在终端里敲敲命令）。每天睡前拿 iPad 打开它读半小时文章，偶尔发现小 bug 就让 Claude Code 顺手修掉。

直到这几天，它才终于稳定下来，成了我理想中的样子：

支持主题、字体、明暗模式的切换
与 Readwise 实现了双向打通（无论输入还是输出）
支持本地文档上传
模仿「沉浸式翻译」添加了翻译功能
左侧展示文章列表，右侧展示目录
在移动端和浏览器端会有不同的呈现方式

可以说，这个产品终于接近了我想要的阅读器的样子。

而这个项目带给我最大的收获，倒不是技术层面的 —— 毕竟代码都不是我写的 —— 而是做一个「给自己用的工具」的满足感。

市面上有无数优秀的阅读应用：Readwise、Instapaper、Pocket、Omnivore（虽然已经关了）……它们功能更全、体验更好。但它们是别人的工具，而这是我的。

每一个功能都是因为我需要才加的，每一个样式都是按我的审美调的。用着用着想到「哎这里可以改进一下」，就真的能让 Claude Code 去改。这种掌控感，是用任何现成产品都得不到的。

不过，回想过去这近一个月的时间，每天晚上打开电脑，除了玩《终末地》，就是不停地对着终端自言自语，或者焦急地等待它完成任务。之前每天晚上用来阅读、练字、看视频的消遣时间，通通让位给了 Claude Code。

看起来生产力是提高了，但这种 productivity porn 真的是我想要的吗？所以目前的打算是，先用足这一个月的会员，把几个主要的日常自动化和缺少工具的场景覆盖好。之后等会员到期，降回 20 刀的普通会员，日常用用、修修 bug 足够了。

2026年2月13日

在 AI 时代，写作真的那么神圣吗？

我们在日常的网上博客和文章中，总能看到很多作者赋予自己的创作一种所谓的神圣化。而这种神圣化本身可能带有某种精英主义的阶级色彩，他们试图守住某种阶层化的手艺。

但对于写作这件事而言，AI 写作本身更有可能是一种认知表达的平权化。

在 AI 时代，写作对个人的意义，可能更多地在于它是一种避免自我认知萎缩的手段——更多的是服务于自我，而不是服务于他人。

不过，我这里所讲述的更多是基于 AI 写作能力足够强的情况下。而当前大部分 AI 的写作能力还不足以支撑它们负担起比一般人提供更多信息的重任。

2026年1月9日

Manus 被收购：三种叙事，三种命运

本文 AI 含量约 20%

最近 Manus 被收购这件事引发了不少讨论，我也来凑个热闹。

除了新闻本身最早看到玉伯的评论引发的争论，他有些悲哀。在他看来，创业公司的使命是挑战恶龙，而 Manus 被收购，意味着又有一个同行者放弃了自己的梦想。当然，这只是从产品层面来看。

随着商务部决定审查 Meta 收购 Manus，这件事已经从纯产品和商业问题变成了地缘政治问题。

三个叙事角度

全球化科技公司叙事的再次破产

自 TikTok 被美国审查并被迫成立合资公司以来，那些曾经「无国界」的科技公司都逐渐有了地缘属性。中美在 AI 产业上的竞争，使得真正意义上的全球化公司愈发不可能。Manus 被审查，又一次验证了这一规律。之前我们以为它被收购意味着美元 VC 的叙事逻辑仍然可行，事实证明并非如此。

过去的全球化，本质上是美国主导的单极秩序的产物。那时「全球化」实际上意味着「美国标准的全球化」。而现在，多个主权实体同时在争夺对科技公司的「定义权」—— 美国用 CFIUS 定义「谁是安全威胁」，中国用《出口管制法》定义「谁在转移国家能力」，欧盟用 GDPR/DMA 定义「谁在滥用市场支配地位」。

Manus 作为中国背景的公司，试图逃离中美的审查环境，却发现自己陷入了多重监管的夹击。

监管套利的边界

Manus 的策略本质上是监管套利 —— 在新加坡注册以规避中国对技术出口和模型使用的监管要求，同时希望绕开美国对投资审查。但他们犯了一个不对称评估错误：高估了「放弃中国市场」的保护效果，低估了中国的反制意愿。

中国的技术出口管制体系过去执行相对宽松，很多创业者形成了「只要不碰军工就没事」的认知惯性。但 Manus 案可能意味着中国开始把「AI 能力」本身视为需要管制的战略资产，而不仅仅是具体的算法代码。

更吊诡的是：Manus 越是「干净地切割」中国业务，反而越容易被视为「有预谋的规避」，触发更强的审查意愿。这是监管套利的经典陷阱 —— 套利行为本身会改变监管者的行为。对 Manus 而言，「退出」本身就成了触发审查的理由。

对 AI 行业创新的影响

这次审查事件还有一个吊诡之处，也是政府会重点考虑的：它对行业创新的影响。这次收购原本给很多创新公司树立了榜样 —— 只要认真创新、走出海外，就有很好的被收购前景。这种前景会促使更多 VC 去支持有潜力的公司。

但从产业政策角度看，政府关心的可能不是这家公司赚了多少钱，而是这次收购如何影响中国在 AI Agent 领域的能力积累。即使 Manus 的技术不是最前沿的，它的人才、工程经验、对中文场景的理解，都是「国家能力」的组成部分。Manus 团队整体并入 Meta，意味着这部分隐性知识的永久流失。

一旦丧失通畅的退出渠道，还会有那么多 VC 愿意支持创业公司成长吗？这是政府需要权衡的问题。如果一个 AI 公司只能服务国内市场，它的能力必然受到约束 —— 使用的模型天生受限，难以获得海外关注；而国内市场和付费意愿毕竟有限，上升空间会被极大压缩。

一家公司，三种叙事

从 Manus 自身角度出发，虽然可以说它是地缘政治下的一枚棋子，试图通过抛弃中国市场、规避美国审查、转移到新加坡来挣扎求存，但我们也要注意到，它实际上有点「柿子挑软的捏」。它选择了规避美国审查，却没考虑中国也可能审查它。被审查之后，它很可能以「被中国迫害」的受害者形象出现，而这想必不是肖弘他们乐意见到的，也是中国政府想要避免的一种叙事。

Manus 作为商业实体的身份虽然是稳定的，但在地缘政治框架下，其身份可以被重新定义。同一家公司在不同视角下会有截然不同的定义：他们被中国政府定义为「中国技术的流失者」，同时被美国政府定义为「具有中国背景的安全风险」，而在另一个视角下又有可能新加坡政府定义为「东南亚科技枢纽的明星案例」

一家公司，三种叙事，三种截然不同的命运。在政治与商业的交叉地带，谁有权定义这家公司是什么，本身就是一个关键的权力问题。Manus 面临的身份撕裂，也是当今时代科技企业的必然宿命。

接下来可能发生什么？

简单预测退下商务部肯定会进行严格审查，但审查结果会综合考虑地缘政治和对中国 AI 行业创新前景的影响。最终这次收购可能会被批准，但形式可能类似 TikTok —— 需要成立合资公司，通过技术授权的方式进行。

具体细节难以预判，但肯定会考虑给 VC 一个退出渠道，以鼓励类似公司的创新。

当然，也存在着走向最差结果的可能性，包括收购被阻止，或者 Meta 采用更极端的 Acquihire 的形式来进行收购，使得 Manus 成为一个空壳，但这种方法却也不可避免地可能会使 Manus 员工自身却面临一些刑事上的威胁。而这肯定是各方都不想走向的一条道路。

不过话说回来，未来这类公司也可能会更多走向通过会员费、订阅等方式自我造血，同时不排斥投资的道路（暨 Manus 被收购前的路线。被巨头收购这条路，恐怕会越走越窄。这又呼应了玉伯最初的愿景：人们会走上「挑战巨龙」的路线，而不是被巨龙吞噬。

只是，当你面对的不是一条龙，而是三条龙同时争夺对你的定义权时，「挑战」本身的含义也变了。

2026年1月9日

纸笔 + AI —— 截至 2025 年底的知识管理系统更新

前言

眨眼间又过去了一年，这个选题从 9 月底就打了草稿，奈何之后生产力系统又经历了一些更新（才不承认是自己懒），便一直拖到了现在。

四月曾经做过一次盘点，可以参考近期生产力玩具们使用状态更新 (2025 April)

TL;DR

Folo + Reader + Youmind + Podwise 消费信息
纸笔和 Plaud 为入口
Notion 管理信息 + 播客阅读
Heptabase 管理知识
Linear 管理工作

后文不一定会按照这里的顺序来挨个阐述，这里的内容只是作为一个汇总。

今年影响我生产力系统的重要产品/更新

Notion 3.0
Gemini 的进化
Heptabase Web Browsing & AI
Youmind 的持续进化
Plaud Pro 进入国内

AI

在这样一个 AI 时代，避而不谈 AI，未免有些掩耳盗铃。然而，AI 可以说是渗透在了我的知识管理流程的每一个角落，因此不妨把它单独拿出来，单开一个章节。

今年年初也思考过 AI时代，我们还需要个人知识管理吗？，不管答案如何，AI 必然会深深融入我们的生产力系统里。

今年在 AI 使用方面，最大的变化莫过于我订阅了 Gemini One。

纵观过去这三年，我在 AI 方面的主要订阅基本上是一年一家，从最初的 OpenAI，到去年的 Claude，我订阅了 Claude 的会员，但随着发现 Claude 的一些对中文的支持以及和各种生态集成并没有那么理想，我就转到了 Gemini。转到 Gemini 的原因，最主要的自然还是它的模型在这一年里的飞速提升。从 2.5 Pro 到 3.0 Pro 乃至 3.0 Flash，Gemini 的提升是一步一个脚印。

尤其在长文本处理上，可以说是冠绝群雄。同时，在一些文字方面的书写上，相比于 OpenAI 更是有极大的优势。而随着 Claude 在过去一两年一直把精力集中于编程方面，Gemini 在文本撰写上的优势也逐渐胜过了 Claude。

同时，它的自身生态集成也非常强大，无论是 NotebookLM 还是 Antigravity，都足以覆盖生活中方方面面的使用需求。

除此之外，套壳工具方面，去年黑五订阅的 Monica 几乎完全没用上，今年年初转到了 Raycast 旗下。Raycast AI 最大特点就是方便、快速。它和启动器的集成使得它可以通过简单的键盘操作完成从触发到详细的聊天。

而今年，它所集成的包括 MCP 以及其他一些本地端集成，更使得它的 AI 愈发易用。同时，它对新模型的集成也非常快速。

现在我已经非常习惯用 Raycast 来问答常规问题。

而另一个常用的工具则是 Notion AI。Notion AI 在 3.0 更新了它的 agent 功能之后，一跃成为了我日常使用频率最高的 AI 工具。

除了下面要提到的用它来精读一些博客专写的文字稿之外，它承担了我在日常生活管理中的众多工作。会在后续的具体专页中详述，在此就不做过多介绍。

信息消费

我日常的信息摄入来源主要有播客、订阅的 newsletter、RSS、即刻、公众号、微信读书、实体书籍等。这一年最大的特征是大幅增加了信息的质量。

相比于之前几年，小说的阅读量显著减少了，对日常刷的 feed 进行了删减，去除了一些无用的信息；另一方面，增加了高质量付费信息阅读，比如 Stratechery 和财新（其实财新去年就订了，但一直没怎么看，今年则坚持每一期都阅读）；此外，开始关注更多博客这种有「人味」的内容，并得益于 AI 的帮助，大幅增加了播客的「阅读」。

做得不好的地方莫过于，在书籍方面阅读量保持着消费速度远远低于书架的膨胀速度的状态，好在，年底随着拥有了自己的工作空间，书籍的阅读意愿和时间空间大幅增加，明年有望实现触底反弹（笑）。

播客

在过去的这四五年间，听播客已经成为我日常通勤、锻炼、做家务时的习惯。之前我一直用的客户端是小宇宙，也没什么原因，主要就是一个是它有评论区，另外一个就是它的界面 UI 足够好用。

有很多人会认为播客的信息密度太小，并不值得以它作为信息输入的来源。这点我确实同意，毕竟大部分人听播客都是把它作为打发时间的一个工具。

但不得不承认的是，播客本身也是我们拓展自身知识面的一个重要途径。也许有人会说，在 AI 时代，拓展知识面有什么作用呢？毕竟 AI 都知道，想问的时候问一下就行。

这点我不敢苟同。拓展自身知识面的另外一个原因是让我们能够发现知识和知识之间的关联。很多事情，当你不了解的情况下，你就不会产生这种边缘与边缘之间的碰撞。而这些碰撞往往是最容易触发出创作的火花的。当然，这是另外一个话题，在此也不做过多阐述。

但是这一年里，我会发现我的播放列表越攒越多，从一开始的三四十到后来的接近 100，直到逼近 200。在前年的年初，我发现了 Podwise 这款工具。那时候它还相当简陋，而且只有网页版，作用很简单，就是可以把播客语音转文字，并且生成摘要以及一些对应的大纲、金句等等。

中途它推出了手机版，我也试用过一小段时间，但它的播放逻辑、UI 等等和小宇宙也有挺大差距，加上价格也比较贵，也就没有长期使用。在之后的一年时间里，我更多的是在小宇宙上积攒一些想要听的播客，每个半年或一年就开通一个月的 Podwise 会员，集中到 Podwise 里处理。

但这样的处理方法毕竟摩擦挺大，频繁在两个软件之间切换，一是心智和操作成本高，二是难免存在错漏或重复操作。

而今年，当我重新试用了一段时间 Podwise 之后，决心还是把自己的播客客户端从小宇宙转移到 Podwise 上来。这里面有几个原因：一个是它的客户端现在已经完全达到了可用的状态，而且开发者对于用户反馈回复得非常及时，也乐于做一些改进。小宇宙之前也推出了它的会员。这会员可以说非常鸡肋。除了一个没有什么用的播客总结之外，它既不支持把总结以及书签内容导出到我其他的知识管理软件中，同时也缺少挺多在国内收不到的播客。

相比之下，Podwise 里面的操作流就会非常顺滑。我每天早上都会打开 Podwise，浏览一遍最新的播客列表，把自己想听的内容 —— 主要是那些体育类的、陪伴类的，或者关键在于播主的讲述类的内容 —— 放入播放列表。还把那些信息类、知识类的播客直接要不用一点点数来进行语音转文字，要不把那些已经转文字的热门内容给一键转发到 Notion 里。

而在 Notion 里，我专门设定了一个 agent，目的是将播客文章结合它的语音转文字，一键转写成一篇长篇的精读文稿。

之所以不直接读 Podwise 的总结，是因为它在细节和摘要之间缺乏中间形态。要么只看摘要，获取不到重要信息；要么就像大海捞针一样在文稿里找自己想要的内容。

而 Notion AI 正好能填补这个空缺。这样一来，我不用再读那些冗长杂乱的语音转文字原稿，而是能以顺滑且不遗漏关键信息的方式来阅读播客内容。

而且，随着 Notion AI 支持了 Opus 4.5 之后，这个流程愈发顺滑，精读内容的转写精准度也越来越高，已经成为了我的信息摄入的最主要来源之一。

为什么用 Youmind（以及我以后还会继续用吗？）

在年初的时候用早鸟价格（200 多）买了一年多的 Youmind 会员，但这一年里使用 Youmind 还是断断续续的。直到现在，对于 Youmind 之后如何使用还是比较犹豫的。毕竟它的大部分功能会被其他软件部分覆盖，而它的很大一部分内容我并没有使用的需求，甚至对我而言，Youmind 有些华而不实。

一方面，很多 Youmind 的功能能被 Notion AI 和 NotebookLM 覆盖了，目前它所着重推广的系列功能，无论是画图还是一些快捷的 prompt，这些长久来看都可以被 skills 来取代，而它所做的不过就是把这些包装得更加精美、更加用户友好。

但其实回过头来看，这种用户友好的 UI 也正是它的优势。很多产品虽然在一开始只是被看作套壳，最典型的比如 Models，但这种审美、UI 的便利性、对用户需求的洞察，其实自身也是一种护城河的体现。

当你的 UI 做得足够友好，并且能持续保持领先，其他人就很难追上你。

当前我使用 Youmind 最主要的方式还是把一些比较长篇的文章，或者是一些看理想课程以及端传媒之类的长篇文章，导入到 Youmind 里面。通过它的浏览器插件进行剪藏之后，在里面精细阅读，并通过定制化的 prompt 生成卡片或进一步解读。

而它的 craft 功能，也就是用来创作和收集资料的功能，却并不是我日常使用的重点。因此，目前我也有些纠结，等明年初到期之后是否要继续续费。毕竟 Youmind 第二年的定价是 10 美元起步，还是挺高的。到底是买它，还是干脆把这钱拿来买 Claude Pro，用 Claude Code 来完成相应的工作，其实是一个值得思考的问题。

此外，过去一年你很明显能看到预博在尝试把它的个人作为一个 IP 进行营销，通过个人营销来带动产品的推广。这确实是一个很好的思路，但这也会把创始人自身的三观中的一些缺陷放大出来。比如，明显能看到预博有一些强行营销的文字发出来，能感觉到他在哗众取宠。之前也有文章写过，就不详细叙述了。

总之，Youmind 在我的生产力系统里所扮演的角色还是一个无法确定的状态。我会再继续观察两三个月，看看之后会不会有其他的想法。

Reader & Folo

两者可以作为对比组来看。我使用 Reader 也已经有好多个年头了。除了无法自定义字体之外，Reader 作为一个阅读器可以说是无可挑剔的。整体的 UI、用户逻辑，包括 Fit 和 Library 的设置，都非常出色。

对于多种文件格式的支持以及 Highlight 功能，目前而言都没有什么替代品。我用它主要是用来读一些 Newsletter 长文。之前曾经试着用 Reader 来读过一些书籍，但整体体验其实没有特别好。之后可能还是把书籍更多放在微信读书和 Heptabase 里阅读。

Folo 则是另外一个方向，它就是用来读 RSS 的。它的好处是，对于一些值得深度阅读的文章，可以转存到 Reader 里进一步阅读。

而 Folo 本身在 RSS 的各种方面其实做得都挺优秀。奈何年底搞了波骚操作，虽然一开始他没有把商业化模式想好，是一个挺遗憾的事儿。但仓促商业化造成的危害对产品其实更大，尤其是强行把 AI 功能和产品功能进行捆绑。

虽然之后推出了 Basic 版的会员，但是这种把 RSS Hub 开源的 RSS 工具跟 Folo 的会员捆绑其实也挺败好感的。我也在考虑等这一期会员到期之后，把 Folo 迁到 QiReader 上去。那个便宜很多，而且在阅读的界面上也挺优秀的，并且由于是 webapp，在各个端上都可以非常优秀地支持阅读。

唯一可惜的是，那些通过 RSSHub 来订阅的源可能没法继续阅读了。不过也还好，大部分时候都是用 Folo 来阅读各种博客内容的，而各个博客自己的 RSS 还是做得比较完备，并不需要使用到 RSSHub。

输入端

重新开始使用又放弃的 Flomo

吸引我重新开始使用的 AI，恰好是让我放弃使用的源头。

我也从四年前就开始使用 Flomo 了。中间断断续续试过挺多速记产品，但用下来，使用最友好的界面、最简单的仍然是 Flomo。中途也和少楠提过挺多建议，包括要加上语音转文字和一些 AI 功能。当然，还有很多人都关注的 Markdown。

最终 Markdown 没有实现，但 AI 和语音转文字功能都加上了，这也是吸引我重新用回 Flomo 的原因。然而，实际使用了几个月下来，发现 Flomo 在这两方面做得都有点不尽如人意。他号称尽量保持语音输入的原意，不做过多修改，实际看下来却并不如此。他做的修改其实还是挺多的，并且会对原文的一些名词强行进行一些修正。不知道是不是他自己的设置和国产的模型的自身问题所致。（语音转文字软件的思考可见语音转文字正在改变我们的生活——兼简要横评市面上的语音转文字笔记软件

而 Flomo 力推的另一个功能「AI 洞察」，在最早的时候，我用它来进行洞察时确实有过一些 AHA moment，发现它的洞察能够反映我内心的一些思想变化。但用得多了，发现不知道是模型的能力所致，还是 AI 会陷入一种自证的漩涡。每次的洞察结果其实都差不多，而且由于它相关笔记的算法并没有特别精确，进行 AI 洞察的来源其实是不足的。这就导致每次 AI 洞察总会关联到一些莫名其妙的事情上去。时间久了，虽然偶尔能有 AHA，但这种 AHA 的频率是相当之低的，可能十几二十次才能有一次觉得这 AHA 确实有用，其他的更多只是不停地自我重复而已。

于是我又一次抛弃了 Flomo，而这一次并没有选择投入到哪一个新的速记软件中去，反而我回归了最原始的纸和笔。

纸和笔

其实我并不是一个喜欢用纸和笔的人。究其原因，当然是从小我的字就一直不大好看。

但自从几个月前被一些漂亮本子种草之后，再加上使用这些工具上的不便，我重新燃起了使用纸和笔的念头。要用纸和笔，自然首先是要好好写字。我也在这几个月重新开始了练字，从纠正握笔开始，慢慢地练。至少目前来看，写的字相比于以前已经有一些进步。

本子上我主要使用的是 TN 和 Plotter 的 A6 和 M5。TN 主要用作周记的日程以及每天的 Life Log 记录。Plotter 的两个本子中，M5 用作日常的代办列表等等，而 A6 则是自己的草稿本以及灵感本。平时工作以及阅读时，我就把它铺在面前，想到什么就写什么。之后再定期把这些灵感摘抄整理到 Heptabase 里面。而之前提到的 Life Log，后续会在 Notion 的部分详细说。

使用纸和笔记录时，实际上相当于对所记录的内容进行了一轮思考与重组。这有点类似于少楠之前所说的，记笔记是记给自己的，需要用自己的话重新来讲一遍。

相比于语音，手写更适合对内容进行深度思考与处理。而且，手写还有一个好处，就是没有文字的局限性，可以随意地画一些线条来勾勒相互连接，或者画一些示意图，这些都是软件所不能达到的。

当然，在这过程中，我也不免陷入了差生文具多的一些怪圈，包括像买各种纸和钢笔，有点发烧的迹象。也只能安慰自己，工欲善其事必先利其器。在这个折腾的过程中，也能给自己找到一些乐趣。

Plaud + 闪念贝壳

虽说不再用 Flomo 记录语音转文字，但语音转文字仍是我日常工作生活中不可缺少的一环。无论是上课的录音，还是一些会议纪要，这些我都会通过今年新买的 Plaud Pro 来进行录音。

很多人说 Plaud Pro 不就是个录音笔吗？有人把它的优越性归功于背后的系统，而对我而言，Plaud Pro 确实就是个录音笔，但市面上找不到比它更好的录音笔。它能直接把会议转录成文字，这属于附加项，但归根结底，它是一款做工精良、交互顺畅、能直接贴在手机背面的录音笔。

Plaud 的便捷程度确实能帮助我在不同场景下方便地录音。之后，我会把它放到闪念贝壳里进行语音转文字，这样就不用付昂贵的会员费来转录了。毕竟国内版的转录和总结用的还是国内的模型，效果并没有很好。

转录完之后，我会把语音转文字稿放到 Gemini 预先设置的 Gem 里梳理。目前用下来，整个流程还是非常通畅的。

详见 AI 录音硬件是个伪需求吗？（Plaud Note Pro 购买复盘）

管理端

从一开始，我就不是「all in one」的拥护者。一直秉承着重器轻用的理念。

但是，重器轻用也要有一个逻辑，即什么样的东西需要被分开来使用。同时，也要照顾到怎样处理好软件和软件之间信息的流转。

尤其是在当今信息供给爆发的年代，我们周围的信息越来越多，日常接触的内容也越来越多。那么，如何管理这些内容？怎么样把这些东西和自己日常的生活和兴趣关联起来？这就成了过去一直在思考的话题。

最终，我还是把这些信息进行了简单的二分法，所以收集到的可以阅读的都是信息，而只有我自身经过理解并梳理过的东西才是我自身的知识。经过这么简单的分解后，选取工具也就变得简单了起来。

从 Tana 回到 Notion

从功能的复杂性可定式化程度上而言，毫无疑问，Tana 是远远超过 Notion 的。但自从 Notion 更新了 3.0 之后，我就毅然决然地放弃了 Tana。

首先，除了 Tana 的移动端，尤其是我主力操作端 iPad 端基本上是残废以外，Tana 最大的弱点自然是它虽然有 AI，但没法对整个知识库进行梳理。而 Notion 的 AI 跟自身的架构集成得要深很多。之前我也写过文章分享过在 Notion 里设置的一些 agent。

最近在看了二一的教程之后，我更是把这些 Notion agent 通过路由集中起来，这样也避免在各种 agent 里面来回切换，极大地提高了我使用 Notion 的效率。

现在我会把各个软件，包括像是新知从微信里面收集的文章、从小红书里收集的帖子、从 Plaud 里面收集的会议记录和讲座记录、从 Podwise 收集的播客转文字稿、BibiGBT 收集的视频转文字稿，这些东西都会总到 Notion 里面。同时，也通过 Notion 来管理自身的一些信息项的笔记，包括菜谱、家庭的一些记录、英语单词学习、订阅的记录、网络安全相关知识的学习、prompt 收集。此外，还有零零散散各种生活中的一些数据库都会汇总到 Notion 里进行结构化管理。

总体上看，Notion 就像是我生活中的信息收集器。我们常说 AI 时代最重要的是上下文，而 Notion 正是扮演着这个上下文中心的角色，AI 则辅助在这个中心里输入、输出、管理，并能方便地与其他工具集成 —— 比如需要提取信息时，可以通过 MCP 从 Notion 调取。

放弃又重新开始使用的 Heptabase

作为 Heptabase 的第一批用户，看着 Heptabase 一步步虽不快，但踏实地走到当前这一状态，还是有点遗憾的，毕竟 Heptabase 当前的状态离 Alan 当时的愿景还有不少差距。但不可否认的是，Heptabase 的本体，一个用于中观研究的白板，它的生态位是任何其他软件所无法取代的。

去年底，Heptabase 到期之后，我没有续费。当时是觉得，白板是个伪需求，并没有什么文章或书籍需要用白板来拆解。在这一想法下，我重新用起了颜值更高的思源笔记，把课程笔记、写作都放到了思源里。但用了一段时间之后，发现 Siyuan 对 AI 的支持实在是一般，相比之下，年底 Heptabase 密集上了一批 AI 相关的功能，其中就包括了最重要的通过 AI 检索全库内容。

此外还上了 Web Tab 这一个极大拓展了使用场景的功能。更重要的是，无论是纸笔还是电子，我都坚持做 Daily Notes，而在 Heptabase 里，daily note 可以以中观的视角被呈现，后文也会在「日记」的部分详述。

总的来说，我最终还是回到了 Heptabase 的怀抱，把所有自己吸取到的知识、观点都放到 Heptabase 里，并且自从有了 MCP 之后，从 AI Chatbot 创建卡片也变得非常方便了。这让 Heptabase 能真正成为我的知识中心。

输出端

iA Writer

之前的这些年，我的写作软件一直在变，也尝试过不少，或专业或不专业的。专业的像 Lattics、Ulysses 都曾尝试过。也曾在各种笔记软件里面试过写作，像是 Obsidian、思源，还有 Logseq 里面的长文写作插件也都尝试过。

一直听说过 iA Writer 的大名，直到今年终于痛下决心买了 iA Writer。买它原因主要还是它的界面设计 UI。非常的优美简洁，虽然没法自定义字体，但是它本身的颜值就足够高了。而在写作上，一切都从极简出发，帮助人能够专心在写作本身，而不是其他的稀奇古怪的功能上面。而它通过 iCloud 的同步方式也非常的方便。现在每一篇文章我都是通过 iA Writer 记录选题、完成撰写来写出来的，写完之后再把它粘到 Heptabase 和 Notion 里面去，并发布到自己的博客里。

日记

前面也说过，我有记自己 life log 的习惯，之前都是在 Tana 里面做 life log。但是 Life Log 有个关键点很多家都没有做好，那就是和其他日子的联动，需要能通过越简单的操作实现越好。因为，写 life log 经常会需要参考之前的 action，这样才能让 life log 发挥作用，并且能让一个个日程的点连成一条线。

举个例子，在 Roam Research 和 Logseq 里，这种连点成线是通过上下滚动可以实现，Heptabase 则可以在白板里以日历的形式插入 Journal，能在一屏上看到多个日历。

Notion 里，则可以通过 AI 把一天的日程分门别类输入到表格里，在数据库里看每个类型的 life log 在时间段里的变化（具体可以参见如何通过 AI 追踪自己的情绪）。

基于以上原因，现在我的日记工作流是，白天主要在 TN 里用笔记录下 Life Log，如果在外则手动录入到 Heptabase 的 Journal 里。晚上会通过闪念笔记，基于 TN 和 Heptabase 里的记录把一天的经历讲一遍，把生成的记录一键转存到 Day One、Heptabase 和 Notion 里，其中 Notion 会自动调用 agent 来分门别类存入日报数据库。

博客

博客方面，从 Thorn 迁移到了 WordPress，并实现了把正文和 Memo、摄影画廊都放在一个网站上的需求，详见博客折腾纪录。

其他

待办

在待办软件上，过去这些年我换过好多不同的 app，从滴答清单到 Things 到 OmniFocus 之类的专业的软件都试过，但一直没找到最适合我的。

前段时间重新用起了一段时间 Notion 和 Things，但发现用来管理待办都比较尴尬。

Notion 的问题和 Tana 一样，作为一个待办软件太重了。没有人能顺畅地使用一个要花小半分钟才能打开的软件来记录和管理待办的。而 Things 的问题则在于，随着苹果自带的提醒事项越来越好用，Things 的绝大部分功能都被覆盖，而这时使用原生功能的可靠性以及间接性都远大于是使用第三方软件。

当下我的解决方案是，按照使用场景把待办分成不同的类别。

简单的，短期内强时间性的用微信提醒；
相对长期但有时间性的待办用 iOS 自带的提醒事项 app，并能自动显示在日历上
工作上的待办和任务用 Linear，
日常、非时间性、或有比较宽松时间性但没有提醒需求的待办用纸笔写在 M5 上。

通过区隔不同的适用场景，能尽可能减少决策如何分配待办时的心理负担，并能减少看到一个长长的列表时的心理压力。

Vibe-coding

由于我并不是一个程序员，vibe-coding 的使用率大概只有一个月一次，并且基本只涉及到对文件进行一些处理，大部分涉及到开发的内容用 Gemini 的网页版就可以实现。

年中的时候买了 Lenny 的一年会员，送了一年 Cursor 的会员，大部分时间都是用 Cursor 来做简单的 vibe coding。年底 Gemini 更新了之后，更是把挺多工作移到了 Gemini 线上。

倒是最近这几个星期，因为 Antigravity 白送了不少 Claude Opus 4.5 的额度，试着用了些 Antigravity 的 agent，但是效果并没有很好，便终于下定决心重新订阅了一个月的 Claude Pro，在半年之后终于用起了 Claude Code。

用了 Claude Code 之后最大的惊喜莫过于 skill 了，虽然看起来像是把 prompt 模板化，但感觉有很大的潜力可挖，可以把自己的一些工作流固化下来（话说我有什么工作流呢），并通过 AI 来实现。

Alma

年底最大的惊喜来源于 Alma，短短两周内，见证了一个极简的套壳 chatbox 如何飞速进化，从 MCP 到 skill 到 vibe-coding，感觉很快就能变成主力的 AI 客户端了，持续关注。

Mintrr

Mintrr 的更新速度和 Alma 可以算是两个极端了。当时买了这个软件纯粹只有两个原因，一个是对创作者的支持，另一个就是市面上没有好看的画廊瀑布流型的笔记软件。后者直到年底也没有第二个，但由于使用的软件太多了，短期内没有继续使用的计划，先养一段时间再说。

Raindrop

这一年里使用 Raindrop 的频率明显变低了，大部分的链接存进 Raindrop 之后也在也不会再打开。所以也没有续费 Raindrop 的会员了。

Dia

浏览器方面，自从 Arc 停更之后，就转移到了 Dia 上。比较特殊的一点是，我在 Dia 上没怎么使用过它的 AI 功能，感觉大部分都比较华而不实，如果有需要总结文章的需求，会直接调用 Youmind 的插件。我对 AI 浏览器这个业态的发展未来还是比较悲观的，并不觉得它会是一个重要的入口。当前继续使用它主要只是出于它的设计。

Dinox

Dinox 是我觉得比较可惜的一个软件。一方面是太过极客，另一方面是毕竟是国内软件，模型上没法用最好的。而且由于开发者只有一个人，并且主要的用户大部分都是当初买断的那一批，有点担心这个软件能否可持续地运营下去。

总结

相比于 2024，AI 已经在我的生产力系统里扮演了越来越重要的角色，而我对 AI 的态度也从 22 年刚兴起时的狂热，到 23 年的反思、24 年的刻意退避，到今年的去芜存菁，在思考后把 AI 融入到自身的工作流里，在保证自身主体性的前提下让 AI 更好地辅助我。也非常好奇，一年之后，当我再做一轮总结时，一切又会有什么样的变化。

2025年12月31日

Ben Thompson 最新关于英伟达财报文章的几个 take-away

当前 AI 产业最稀缺的是电力而不是算力
有人担心TPU训练的Gemini 3是对英伟达的威胁，Ben Thompson 认为这证明了 scaling law 仍有效，对英伟达是利好
经济学角度上来看，既然最稀缺的是电力，那么「token 能效比」会比 GPU/TPU 本身的价格更重要，因为在价格战的场景下，决定企业能承担的成本的是边际成本低的一方。

2025年11月25日

Transformer 的弱点

即刻上看到志达的post，联想到为何用 AI 概括一天情绪容易有偏。目前还是采取用提示词来强行约束，但是长远来看还是需要模型拥有自我学习的路由机制或抑制机制。

Transformer 的底层弱点可以用一句话概括：它不会像人这样做「减法」。

人脑有抑制机制（inhibition）：当你修车时，关于晚饭的念头会被前额叶直接「关掉」。这是硬门控 gating，信号被彻底压低到无效。

Transformer 完全不是这样。Self-Attention 的设计哲学是：
只要 token 进入上下文窗口，它就永远有权参与计算，Softmax 权重只能变小，永远不会变成真正的零。信息通路永远存在，没有任何机制能把一段上下文从计算图中完全切断。

结果就是：

它天生「包容式」（inclusive）：所有信息都要进来混一遍。

它没有「排他式」（exclusive）：不具备生理级、结构级的抑制。

所有任务都更像「加法」：不断累积、融合、平滑，而不是隔离、屏蔽、重置。

2025年11月23日

AI 社交的一点小想法

今天看到了 Second Me 的大量推广，他们现在把方向定位在用 AI 做社交。这个方向确实挺有想法的，因为一旦你在 Second Me 里面积累了很多个人数据，它会越来越像你自己。

AI 社交未来可能是个方向，但是这个方向真正并不会由 Second Me 来实现，最有可能实现的反而是大厂，无论是像谷歌还是 OpenAI。因为它们已经嵌入到我们的生活中，并且能和各种各样的 APP 进行连接，拥有各种各样的数据，而不像 Second Me 一样需要手动在它里面输入数据。

而且那些大厂有足够多的人来进行这种社交氛围运营，因为对于社交而言，运营也是非常重要的。同时这种产品也是具有网络效应的，Second Me 作为一个小产品，天生就不会有太多用户，也很难在人群中自发传播起来。可以说在社交这个领域，很难有小公司生存的土壤。

2025年11月23日

如何通过 Notion AI 追踪自己的情绪

自从 Notion 进入 3.0 时代之后，我又重新订阅起了 Notion AI，其中的原因很简单，就是 Notion Agent 的引入使得每个个体的信息库、知识库，乃至项目管理的效率大幅提升。

目前我每天频繁会使用至少 3 个 agent，来进行学习、阅读、生活管理。今天我来分享一下如何通过 AI 来追踪自己的情绪。

流程

先说一下我的做法。一般白天我会在我的手帐里以 lifelog 的形式记录我当天遇到的事情、完成的任务、遇到的有趣的事，乃至阅读中的闪念。日常手边只有手机的时候，也会通过 Flomo 来录入。每天晚上，我会通过闪念贝壳，来把这些 lifelog 通过语音转文字一口气录入给 Notion AI。

Notion AI 会调用我的一个「日报助手」agent，来对我的 lifelog 以及当天从其他各个途径录入到 Notion 的信息进行分析，而其中我设置了一个 property 是分析当天的 lifelog，判断我当天的情绪

一开始我只随便写了一句话 prompt，让 AI 分析我当天的主要情绪前些天和 Marvix 聊了之后，决定尝试一下用更科学的方式来对自己长期的情绪进行追踪。他的建议包括通过「八大情绪」来把情绪更加科学地进行整理。

根据他的建议，我写了一段 prompt （请阅读我输入的内容。基于 Plutchik 的八大情绪分类（喜悦、信任、恐惧、惊讶、悲伤、厌恶、愤怒、期待），分析我在这篇日记中体现的主要情绪。选择一个选项填入。）和标签设置之后，我试着把之前一个月的记录批量生成了一次情绪，结果却发现，为什么过去 30 天里，有 20 天我的情绪都是「快乐」？

我当然希望自己是个快乐的人，很多人也评价过我「情绪平稳」。但我很清楚，作为一个牛马，工作中必然会遇到挫折，生活中和家人的互动，乃至居家生活中，情绪也必然会有起伏，但这些波动在 AI 的总结里全都消失了，只剩下一片祥和的「快乐」。

那么显然，要么是我的输入有偏，要么是「算法」出了问题。

问题在哪里

我的输入是有偏差的

尽管日记本身是给自己记的，但是记录的过程本身却可能会发生在公共场合。为了维护在他人心中一个积极、阳光向上的形象，在记录时，我的记录会不自觉地变得更加平和，这会造成日记和实际情绪的偏差。

另一个原因则是我的输入方式的问题。当用笔记录下内容的时候，当时的情绪可能会得到宣泄。但当一整天过去，晚上通过语音进行录入时，那些负面情绪往往会已经消退了，即所谓的「褪色情感偏差」，输入到 Notion 里的内容会缺失了很多负面情感。

大语言模型的问题

在输入之外，还有一些偏差可能是由模型带来的。LLM 自带的两种特性：积极偏见（Positivity Bias）与 平均化逻辑。

积极偏见

当你把一整天的流水账丢给 AI 时，其中 80% 的内容其实是中性的维护性事务：起床、通勤、吃饭、完成任务。在没有显性的负面关键词（如「痛苦」、「崩溃」）时，AI 倾向于将“生活正常运转”理解为「快乐」。

平均化

我之前的指令是让 AI「分析这一天的主要情绪」。想象你是一个调酒师：你倒进了一份咖啡、一份白开水、一份威士忌、一份橙汁和一杯快乐水。搅拌之后，你问 AI 这杯水是什么味道？AI 尝了一口，礼貌地回答：“嗯，甜甜的，还能喝。” ——这就是那个虚假的「快乐」。

生活中的情绪不是平均数，很多时候，决定我们那一天心理状态的，往往是那一两个剧烈波动的瞬间。而这是 AI 在不经调整的情况下无法理解的。

修正

明确了问题，那下面就需要对输入和算法进行修改了。

提高输入的「信噪比」

发现问题后，我开始调整我记录 Lifelog 的习惯。

语音转文字虽然方便，但往往会丢失语气。如果我只是记录「今天老板驳回了方案，我改了第二版。」AI 读到的是「完成了任务 -> 勤奋 -> 快乐。」但当时我的真实心境可能是极度挫败的。所以现在，我在录入时会刻意增加主观形容词的密度：

「今天老板驳回了方案，我觉得很受打击，这完全是在浪费时间，但我不得不硬着头皮改了第二版。」

这一句话的改动，就能让 AI 敏锐地识别出「厌恶」或「悲伤」，而不是原本那个和稀泥的「快乐」。

并且，在一天的最后通过语音输入的时候，我也会主动保留原纪录里的一些语气词。

迭代 prompt

心理学中有一个著名的 「峰终定律」（Peak-End Rule）：人对一段经历的记忆，主要取决于情绪最强烈的瞬间（峰值）和结束时的感觉（终值），而不是整个过程的平均体验。

既然我要做的是「情绪追踪」，我就不应该让 AI 来取平均，而应该让它做「雷达」，来发现我记录中真正影响情绪的部分。

于是，我重写了我的 Prompt。我不再要求 AI 总结全天，而是要求它捕捉异常值。以下是我迭代后的 Prompt，如果你也在用 Notion AI 做类似的事，可以直接拿去用：

Role: 你是一位敏锐的心理情绪分析师。
Task: 阅读这一天的 LifeLog，基于 Plutchik 的八大情绪分类，找出这一天中情绪强度最高的那一种情绪。
Rules:
- 忽略流水账： 自动过滤掉吃饭、睡觉等常规活动，除非包含强烈的主观形容词。
- 捕捉异常值： 不要对全天的情绪取平均值。哪怕一整天都很平静，但有 15 分钟极度的「愤怒」或「悲伤」，这一天的标签应该是「愤怒」或「悲伤」。
- 负面敏感： 即使正向事件数量多，如果存在明显的负面情绪事件，请优先权衡其对心理的影响。

效果非常明显，我用 Notion AI 重新跑了过去一个月的数据，

「快乐」从 20 次降低到了 12 次，与之相对的是「自责」和「生气」的大幅上升。

虽然快乐仍是主流，但无疑更符合我日常的体感。

此外，我还添加了一个更进一步分析情绪的prompt，以帮助我更细化了解为什么会有这个情绪，强度如何，以及有什么更细微的情绪变化。

结合我的情绪，给出情绪强度【1-10】，用一句话总结引发情绪的具体事件，并描述出当天情绪的细微差别： [用更精准的词描述，如：焦虑、自豪、惆怅]」

为什么要做这些

做情绪追踪这件事的初衷，并不是为了得到一张漂亮的图表，而是为了提升对自我的了解，以针对性地改善自己的生活。

如果我的生活只有「快乐」和「不快乐」两种状态，那我的认知就是低分辨率的。通过强迫 AI 去区分我是「愤怒」还是「恐惧」，是「期待」还是「信任」，我也在强迫自己去正视那些被忙碌掩盖的细微感受。

数据有时候会撒谎，特别是当 AI 会试图讨好你的时候。我们能做的只能是尽可能地纠偏，纠 AI 的偏，也纠自己的偏。

2025年11月23日

第二次和 AI 合作写了一篇博客

第二次尝试和 AI 合作写了一篇博客为什么同样是「四处出击」，腾讯比字节更容易被骂？，内心还是有些不舒服的，毕竟虽然主要的论点来源于自己，但是论证过程、采用的叙述方式、用语都来自于 AI （虽然让它学习了我的文风），但是感觉文章的 AI 度还是过高了，毕竟在和 AI 的讨论中，我的参与度也很少。

但是这一写作方式也有好处，就是可以很快地写一些我没时间长篇写作的选题。

目前想到的把这些内容和我自己写的内容区分方式包括：

在文章开头注明 AI参与度

博客中开一个分类：AI编辑（待定）

可能这些有些矫情，但是也是在自己和 AI 间保持平衡的一点「小巧思」

2025年11月14日