玩具们 - Bowl of Dots

沉迷 Claude Code 的这半个月：Reader 改造计划

本文 AI 含量 60%

距离上一次更新博客已经过去了 20 多天。这半个月，我的大部分时间都被 Claude Code 占据了。

半个月前，我终于没忍住买了 Claude Code 100 刀的会员。买完之后，每次想到 token 额度没用完，就觉得亏。于是大部分时间都扑在了 Claude Code 上。

那么，这半个月我用 Claude Code 主要做了什么？

帮朋友做了一个选课工具。
搞了自己的打卡 app、content digest 早报邮件，家里用的小工具。
剩下绝大部分时间，都花在建造自己的阅读器上。

为什么要自己做阅读器

说起原因，得先回顾我的阅读器使用经历。

五六年前开始订阅 Readwise，后来 Readwise 出了 Reader，它便成了我的主力阅读器。

Reader 确实有不少优点：解析好、方便高亮，与 Readwise 的高亮系统集成度高，还支持不少快捷键。

但它也有让我受不了的地方。最大的问题是颜值：虽然支持浅色、深色主题切换，却不支持自定义字体和背景。它的背景非白即黑，盯久了眼睛累。另外，PDF 以外的文件上传也挺麻烦，也没法翻译外文文章。

于是我尝试用不同软件来阅读，最终形成了现在的模式：

微信文章：用「新枝」。它支持自定义背景，也能用官方设定的字体。但对国外链接支持很差。
长篇 PDF 拆书学习：用 Heptabase。

但这两者的高亮都无法与 Readwise 同步。没法同步，就意味着没法把它们集成到其他工具中。

虽然我现在重新开始用手写笔记记录感兴趣的内容，但在外面，比如通勤时阅读文章，总不能掏出本子乱写一通。这种场景下，简单的高亮还是有用的。

我之前没有任何编程经验，自然没办法改进体验。直到半个多月前的一天，我把这些困扰告诉了 Claude。

我告诉它我的诉求：

一个美观、可自定义的阅读软件
高亮能同步进 Readwise
能解析文章链接
支持上传文件

这里的「上传文件」主要是指：我用 Podwise 总结那些没时间听的播客，再通过 Claude Code 把文字稿转成播客精读稿（攒了 100 多篇了）。

Claude Code 告诉我一个我之前不知道的事：Readwise 有 Reader API，可以把文章内容导出来，还支持不少字段筛选。正巧刚订阅了 Claude Code，我决定基于这个 API，开发一个由自己掌控的阅读器。

最初的样子

第一版非常简单。我把需求告诉 Claude Code，它建议用 Astro 搭一个静态站点，把 Markdown 文件渲染出来就行。

作为编程小白，我之前选博客框架时听说过 Astro，但完全不知道它具体能做什么。Claude Code 说它的 Content Collections 功能天然适合这个场景。于是我在本地 Obsidian 用 Claude Code 把播客文字稿转换成精读稿，用脚本自动同步到 GitHub 仓库，Vercel 检测到更新就自动部署。整个流程不需要数据库，不需要后端，纯静态。

为了让阅读体验舒服一点，我让 Claude Code 帮我调样式。最后选了 Flexoki 这个护眼配色 —— 背景是淡淡的米黄色，文字是深灰而非纯黑，长时间盯着不累。字体用思源宋体，中文阅读的经典选择。终于告别了 Readwise 那个纯白纯黑的刺眼背景。

这个版本用了大概两周，每天晚上拿 iPad 打开网页读文章，感觉还不错。

但很快就不够用了

问题出在「高亮」上。

阅读时划重点是我的习惯，而且希望这些高亮能同步回 Readwise，方便之后回顾。但静态站点没有后端，高亮数据只能存在浏览器的 localStorage 里，换个设备就没了。

这让我面临一个选择：要不要把这个「小工具」改造成「小应用」？

纠结了几天，还是决定干。原因很简单：做都做了，不如做完整一点。反正有 Claude Code，我又不用自己写代码。

SaaS 改造

所谓 SaaS 改造，说白了就是加数据库和 API。

Claude Code 帮我选了 Turso 作为数据库 —— 一个基于 SQLite 的边缘数据库，有免费额度，跟 Vercel Edge Functions 配合得很好。ORM 用的是 Drizzle，据说类型安全，写起来很舒服（虽然我也不懂这些术语什么意思）。

改造后的架构变成这样：

Astro 切换到 hybrid 模式，首页还是预渲染，API 路由按需执行
文章存在数据库里，通过 API 增删改查
高亮数据也存数据库，可以跨设备同步
接入 Readwise API，定时把新收藏的文章拉过来

这一步踩了不少坑，后面会说。

功能堆叠

SaaS 改造完成后，我开始往上加功能。有些是一开始就想做的，有些是用着用着才发现需要的。每次有新想法，告诉 Claude Code，它就帮我实现。

阅读进度追踪 是第一个加的。思路很简单：监听滚动位置，防抖保存到数据库，下次打开自动恢复。还做了一个顶部的细进度条，显示当前读到哪了。

多主题支持 是标配。Flexoki 本身就有 Light 和 Dark 两套配色，Claude Code 按官方色值做了两套 CSS 变量。为了避免页面闪烁（先显示浅色再切换成深色），在 HTML head 里加了一段内联脚本，在页面渲染前就应用好主题。此外我还加入了 Nord、Ayu、Monokai Pro 等好几个主题。

批量管理 是为了解决「归档焦虑」。有时候一口气想清理掉十几篇文章，一篇篇点归档太慢了。所以做了个管理模式，可以多选后批量归档或删除。

「下一篇」按钮 是个小细节但很实用。读完一篇，点一下就跳转到下一篇，同时自动把当前这篇归档。连续阅读体验好了很多。

沉浸式翻译 偶尔面对一些长文我也会想偷懒，翻译成中文。所以我接了自己的 Gemini 2.5 Flash Lite 模型，模仿了沉浸式翻译的样式，速度还挺快。

阅读器设置面板 是后来加的。原本主题切换和字体切换是分开的，用着用着觉得该整合起来。现在点顶栏的 Aa 按钮，可以调字号、行间距、正文宽度，还能选不同的配色主题。

踩坑实录

虽然代码都是 Claude Code 写的，但做这个项目的过程中还是踩了不少坑。

iOS PWA 的字体不显示

这个问题困扰了好几天。

我用的思源宋体是从 CDN 加载的。浏览器里一切正常，但把网页添加到 iPad 主屏幕作为 PWA 打开后，字体就变成了系统默认的黑体。

一开始以为是 Service Worker 没缓存好，让 Claude Code 折腾了一圈，发现不是。后来查资料才知道：iOS PWA 在 standalone 模式下，跨域的 CDN 资源加载有问题。

解决方案是把字体文件下载到本地，直接打包进网站。一个可变字重的思源宋体 WOFF2 文件有 21 MB，但没办法，为了字体能正常显示，只能接受这个体积。

Readwise API

另一个比较大的坑来自 Readwise API。

Readwise API 在官方文档里明确表示，它主要用于个人导出自己的文章和文档。当我想批量拉取文章时，很容易触发速率限制。而且我的数据库结构跟 Readwise API 的数据格式差异不小，开发过程中反复调试。

之后为了防止 API 在公网上被滥用，我还加了密钥验证。在浏览器上使用时，需要先输入密钥，才能进行拉取和高亮等操作。而这个密钥功能整整折腾了我两周 —— 各种场景切换以及新功能的变动，都可能导致需要重复输入密钥。

直到这两天，我才终于把这个问题基本修好。

现在的样子

折腾了半个多月，我的 Reader 现在有 40 多个功能点，代码量大概一万行（当然都是 Claude Code 写的，我最多在终端里敲敲命令）。每天睡前拿 iPad 打开它读半小时文章，偶尔发现小 bug 就让 Claude Code 顺手修掉。

直到这几天，它才终于稳定下来，成了我理想中的样子：

支持主题、字体、明暗模式的切换
与 Readwise 实现了双向打通（无论输入还是输出）
支持本地文档上传
模仿「沉浸式翻译」添加了翻译功能
左侧展示文章列表，右侧展示目录
在移动端和浏览器端会有不同的呈现方式

可以说，这个产品终于接近了我想要的阅读器的样子。

而这个项目带给我最大的收获，倒不是技术层面的 —— 毕竟代码都不是我写的 —— 而是做一个「给自己用的工具」的满足感。

市面上有无数优秀的阅读应用：Readwise、Instapaper、Pocket、Omnivore（虽然已经关了）……它们功能更全、体验更好。但它们是别人的工具，而这是我的。

每一个功能都是因为我需要才加的，每一个样式都是按我的审美调的。用着用着想到「哎这里可以改进一下」，就真的能让 Claude Code 去改。这种掌控感，是用任何现成产品都得不到的。

不过，回想过去这近一个月的时间，每天晚上打开电脑，除了玩《终末地》，就是不停地对着终端自言自语，或者焦急地等待它完成任务。之前每天晚上用来阅读、练字、看视频的消遣时间，通通让位给了 Claude Code。

看起来生产力是提高了，但这种 productivity porn 真的是我想要的吗？所以目前的打算是，先用足这一个月的会员，把几个主要的日常自动化和缺少工具的场景覆盖好。之后等会员到期，降回 20 刀的普通会员，日常用用、修修 bug 足够了。

2026年2月13日

纸笔 + AI —— 截至 2025 年底的知识管理系统更新

前言

眨眼间又过去了一年，这个选题从 9 月底就打了草稿，奈何之后生产力系统又经历了一些更新（才不承认是自己懒），便一直拖到了现在。

四月曾经做过一次盘点，可以参考近期生产力玩具们使用状态更新 (2025 April)

TL;DR

Folo + Reader + Youmind + Podwise 消费信息
纸笔和 Plaud 为入口
Notion 管理信息 + 播客阅读
Heptabase 管理知识
Linear 管理工作

后文不一定会按照这里的顺序来挨个阐述，这里的内容只是作为一个汇总。

今年影响我生产力系统的重要产品/更新

Notion 3.0
Gemini 的进化
Heptabase Web Browsing & AI
Youmind 的持续进化
Plaud Pro 进入国内

AI

在这样一个 AI 时代，避而不谈 AI，未免有些掩耳盗铃。然而，AI 可以说是渗透在了我的知识管理流程的每一个角落，因此不妨把它单独拿出来，单开一个章节。

今年年初也思考过 AI时代，我们还需要个人知识管理吗？，不管答案如何，AI 必然会深深融入我们的生产力系统里。

今年在 AI 使用方面，最大的变化莫过于我订阅了 Gemini One。

纵观过去这三年，我在 AI 方面的主要订阅基本上是一年一家，从最初的 OpenAI，到去年的 Claude，我订阅了 Claude 的会员，但随着发现 Claude 的一些对中文的支持以及和各种生态集成并没有那么理想，我就转到了 Gemini。转到 Gemini 的原因，最主要的自然还是它的模型在这一年里的飞速提升。从 2.5 Pro 到 3.0 Pro 乃至 3.0 Flash，Gemini 的提升是一步一个脚印。

尤其在长文本处理上，可以说是冠绝群雄。同时，在一些文字方面的书写上，相比于 OpenAI 更是有极大的优势。而随着 Claude 在过去一两年一直把精力集中于编程方面，Gemini 在文本撰写上的优势也逐渐胜过了 Claude。

同时，它的自身生态集成也非常强大，无论是 NotebookLM 还是 Antigravity，都足以覆盖生活中方方面面的使用需求。

除此之外，套壳工具方面，去年黑五订阅的 Monica 几乎完全没用上，今年年初转到了 Raycast 旗下。Raycast AI 最大特点就是方便、快速。它和启动器的集成使得它可以通过简单的键盘操作完成从触发到详细的聊天。

而今年，它所集成的包括 MCP 以及其他一些本地端集成，更使得它的 AI 愈发易用。同时，它对新模型的集成也非常快速。

现在我已经非常习惯用 Raycast 来问答常规问题。

而另一个常用的工具则是 Notion AI。Notion AI 在 3.0 更新了它的 agent 功能之后，一跃成为了我日常使用频率最高的 AI 工具。

除了下面要提到的用它来精读一些博客专写的文字稿之外，它承担了我在日常生活管理中的众多工作。会在后续的具体专页中详述，在此就不做过多介绍。

信息消费

我日常的信息摄入来源主要有播客、订阅的 newsletter、RSS、即刻、公众号、微信读书、实体书籍等。这一年最大的特征是大幅增加了信息的质量。

相比于之前几年，小说的阅读量显著减少了，对日常刷的 feed 进行了删减，去除了一些无用的信息；另一方面，增加了高质量付费信息阅读，比如 Stratechery 和财新（其实财新去年就订了，但一直没怎么看，今年则坚持每一期都阅读）；此外，开始关注更多博客这种有「人味」的内容，并得益于 AI 的帮助，大幅增加了播客的「阅读」。

做得不好的地方莫过于，在书籍方面阅读量保持着消费速度远远低于书架的膨胀速度的状态，好在，年底随着拥有了自己的工作空间，书籍的阅读意愿和时间空间大幅增加，明年有望实现触底反弹（笑）。

播客

在过去的这四五年间，听播客已经成为我日常通勤、锻炼、做家务时的习惯。之前我一直用的客户端是小宇宙，也没什么原因，主要就是一个是它有评论区，另外一个就是它的界面 UI 足够好用。

有很多人会认为播客的信息密度太小，并不值得以它作为信息输入的来源。这点我确实同意，毕竟大部分人听播客都是把它作为打发时间的一个工具。

但不得不承认的是，播客本身也是我们拓展自身知识面的一个重要途径。也许有人会说，在 AI 时代，拓展知识面有什么作用呢？毕竟 AI 都知道，想问的时候问一下就行。

这点我不敢苟同。拓展自身知识面的另外一个原因是让我们能够发现知识和知识之间的关联。很多事情，当你不了解的情况下，你就不会产生这种边缘与边缘之间的碰撞。而这些碰撞往往是最容易触发出创作的火花的。当然，这是另外一个话题，在此也不做过多阐述。

但是这一年里，我会发现我的播放列表越攒越多，从一开始的三四十到后来的接近 100，直到逼近 200。在前年的年初，我发现了 Podwise 这款工具。那时候它还相当简陋，而且只有网页版，作用很简单，就是可以把播客语音转文字，并且生成摘要以及一些对应的大纲、金句等等。

中途它推出了手机版，我也试用过一小段时间，但它的播放逻辑、UI 等等和小宇宙也有挺大差距，加上价格也比较贵，也就没有长期使用。在之后的一年时间里，我更多的是在小宇宙上积攒一些想要听的播客，每个半年或一年就开通一个月的 Podwise 会员，集中到 Podwise 里处理。

但这样的处理方法毕竟摩擦挺大，频繁在两个软件之间切换，一是心智和操作成本高，二是难免存在错漏或重复操作。

而今年，当我重新试用了一段时间 Podwise 之后，决心还是把自己的播客客户端从小宇宙转移到 Podwise 上来。这里面有几个原因：一个是它的客户端现在已经完全达到了可用的状态，而且开发者对于用户反馈回复得非常及时，也乐于做一些改进。小宇宙之前也推出了它的会员。这会员可以说非常鸡肋。除了一个没有什么用的播客总结之外，它既不支持把总结以及书签内容导出到我其他的知识管理软件中，同时也缺少挺多在国内收不到的播客。

相比之下，Podwise 里面的操作流就会非常顺滑。我每天早上都会打开 Podwise，浏览一遍最新的播客列表，把自己想听的内容 —— 主要是那些体育类的、陪伴类的，或者关键在于播主的讲述类的内容 —— 放入播放列表。还把那些信息类、知识类的播客直接要不用一点点数来进行语音转文字，要不把那些已经转文字的热门内容给一键转发到 Notion 里。

而在 Notion 里，我专门设定了一个 agent，目的是将播客文章结合它的语音转文字，一键转写成一篇长篇的精读文稿。

之所以不直接读 Podwise 的总结，是因为它在细节和摘要之间缺乏中间形态。要么只看摘要，获取不到重要信息；要么就像大海捞针一样在文稿里找自己想要的内容。

而 Notion AI 正好能填补这个空缺。这样一来，我不用再读那些冗长杂乱的语音转文字原稿，而是能以顺滑且不遗漏关键信息的方式来阅读播客内容。

而且，随着 Notion AI 支持了 Opus 4.5 之后，这个流程愈发顺滑，精读内容的转写精准度也越来越高，已经成为了我的信息摄入的最主要来源之一。

为什么用 Youmind（以及我以后还会继续用吗？）

在年初的时候用早鸟价格（200 多）买了一年多的 Youmind 会员，但这一年里使用 Youmind 还是断断续续的。直到现在，对于 Youmind 之后如何使用还是比较犹豫的。毕竟它的大部分功能会被其他软件部分覆盖，而它的很大一部分内容我并没有使用的需求，甚至对我而言，Youmind 有些华而不实。

一方面，很多 Youmind 的功能能被 Notion AI 和 NotebookLM 覆盖了，目前它所着重推广的系列功能，无论是画图还是一些快捷的 prompt，这些长久来看都可以被 skills 来取代，而它所做的不过就是把这些包装得更加精美、更加用户友好。

但其实回过头来看，这种用户友好的 UI 也正是它的优势。很多产品虽然在一开始只是被看作套壳，最典型的比如 Models，但这种审美、UI 的便利性、对用户需求的洞察，其实自身也是一种护城河的体现。

当你的 UI 做得足够友好，并且能持续保持领先，其他人就很难追上你。

当前我使用 Youmind 最主要的方式还是把一些比较长篇的文章，或者是一些看理想课程以及端传媒之类的长篇文章，导入到 Youmind 里面。通过它的浏览器插件进行剪藏之后，在里面精细阅读，并通过定制化的 prompt 生成卡片或进一步解读。

而它的 craft 功能，也就是用来创作和收集资料的功能，却并不是我日常使用的重点。因此，目前我也有些纠结，等明年初到期之后是否要继续续费。毕竟 Youmind 第二年的定价是 10 美元起步，还是挺高的。到底是买它，还是干脆把这钱拿来买 Claude Pro，用 Claude Code 来完成相应的工作，其实是一个值得思考的问题。

此外，过去一年你很明显能看到预博在尝试把它的个人作为一个 IP 进行营销，通过个人营销来带动产品的推广。这确实是一个很好的思路，但这也会把创始人自身的三观中的一些缺陷放大出来。比如，明显能看到预博有一些强行营销的文字发出来，能感觉到他在哗众取宠。之前也有文章写过，就不详细叙述了。

总之，Youmind 在我的生产力系统里所扮演的角色还是一个无法确定的状态。我会再继续观察两三个月，看看之后会不会有其他的想法。

Reader & Folo

两者可以作为对比组来看。我使用 Reader 也已经有好多个年头了。除了无法自定义字体之外，Reader 作为一个阅读器可以说是无可挑剔的。整体的 UI、用户逻辑，包括 Fit 和 Library 的设置，都非常出色。

对于多种文件格式的支持以及 Highlight 功能，目前而言都没有什么替代品。我用它主要是用来读一些 Newsletter 长文。之前曾经试着用 Reader 来读过一些书籍，但整体体验其实没有特别好。之后可能还是把书籍更多放在微信读书和 Heptabase 里阅读。

Folo 则是另外一个方向，它就是用来读 RSS 的。它的好处是，对于一些值得深度阅读的文章，可以转存到 Reader 里进一步阅读。

而 Folo 本身在 RSS 的各种方面其实做得都挺优秀。奈何年底搞了波骚操作，虽然一开始他没有把商业化模式想好，是一个挺遗憾的事儿。但仓促商业化造成的危害对产品其实更大，尤其是强行把 AI 功能和产品功能进行捆绑。

虽然之后推出了 Basic 版的会员，但是这种把 RSS Hub 开源的 RSS 工具跟 Folo 的会员捆绑其实也挺败好感的。我也在考虑等这一期会员到期之后，把 Folo 迁到 QiReader 上去。那个便宜很多，而且在阅读的界面上也挺优秀的，并且由于是 webapp，在各个端上都可以非常优秀地支持阅读。

唯一可惜的是，那些通过 RSSHub 来订阅的源可能没法继续阅读了。不过也还好，大部分时候都是用 Folo 来阅读各种博客内容的，而各个博客自己的 RSS 还是做得比较完备，并不需要使用到 RSSHub。

输入端

重新开始使用又放弃的 Flomo

吸引我重新开始使用的 AI，恰好是让我放弃使用的源头。

我也从四年前就开始使用 Flomo 了。中间断断续续试过挺多速记产品，但用下来，使用最友好的界面、最简单的仍然是 Flomo。中途也和少楠提过挺多建议，包括要加上语音转文字和一些 AI 功能。当然，还有很多人都关注的 Markdown。

最终 Markdown 没有实现，但 AI 和语音转文字功能都加上了，这也是吸引我重新用回 Flomo 的原因。然而，实际使用了几个月下来，发现 Flomo 在这两方面做得都有点不尽如人意。他号称尽量保持语音输入的原意，不做过多修改，实际看下来却并不如此。他做的修改其实还是挺多的，并且会对原文的一些名词强行进行一些修正。不知道是不是他自己的设置和国产的模型的自身问题所致。（语音转文字软件的思考可见语音转文字正在改变我们的生活——兼简要横评市面上的语音转文字笔记软件

而 Flomo 力推的另一个功能「AI 洞察」，在最早的时候，我用它来进行洞察时确实有过一些 AHA moment，发现它的洞察能够反映我内心的一些思想变化。但用得多了，发现不知道是模型的能力所致，还是 AI 会陷入一种自证的漩涡。每次的洞察结果其实都差不多，而且由于它相关笔记的算法并没有特别精确，进行 AI 洞察的来源其实是不足的。这就导致每次 AI 洞察总会关联到一些莫名其妙的事情上去。时间久了，虽然偶尔能有 AHA，但这种 AHA 的频率是相当之低的，可能十几二十次才能有一次觉得这 AHA 确实有用，其他的更多只是不停地自我重复而已。

于是我又一次抛弃了 Flomo，而这一次并没有选择投入到哪一个新的速记软件中去，反而我回归了最原始的纸和笔。

纸和笔

其实我并不是一个喜欢用纸和笔的人。究其原因，当然是从小我的字就一直不大好看。

但自从几个月前被一些漂亮本子种草之后，再加上使用这些工具上的不便，我重新燃起了使用纸和笔的念头。要用纸和笔，自然首先是要好好写字。我也在这几个月重新开始了练字，从纠正握笔开始，慢慢地练。至少目前来看，写的字相比于以前已经有一些进步。

本子上我主要使用的是 TN 和 Plotter 的 A6 和 M5。TN 主要用作周记的日程以及每天的 Life Log 记录。Plotter 的两个本子中，M5 用作日常的代办列表等等，而 A6 则是自己的草稿本以及灵感本。平时工作以及阅读时，我就把它铺在面前，想到什么就写什么。之后再定期把这些灵感摘抄整理到 Heptabase 里面。而之前提到的 Life Log，后续会在 Notion 的部分详细说。

使用纸和笔记录时，实际上相当于对所记录的内容进行了一轮思考与重组。这有点类似于少楠之前所说的，记笔记是记给自己的，需要用自己的话重新来讲一遍。

相比于语音，手写更适合对内容进行深度思考与处理。而且，手写还有一个好处，就是没有文字的局限性，可以随意地画一些线条来勾勒相互连接，或者画一些示意图，这些都是软件所不能达到的。

当然，在这过程中，我也不免陷入了差生文具多的一些怪圈，包括像买各种纸和钢笔，有点发烧的迹象。也只能安慰自己，工欲善其事必先利其器。在这个折腾的过程中，也能给自己找到一些乐趣。

Plaud + 闪念贝壳

虽说不再用 Flomo 记录语音转文字，但语音转文字仍是我日常工作生活中不可缺少的一环。无论是上课的录音，还是一些会议纪要，这些我都会通过今年新买的 Plaud Pro 来进行录音。

很多人说 Plaud Pro 不就是个录音笔吗？有人把它的优越性归功于背后的系统，而对我而言，Plaud Pro 确实就是个录音笔，但市面上找不到比它更好的录音笔。它能直接把会议转录成文字，这属于附加项，但归根结底，它是一款做工精良、交互顺畅、能直接贴在手机背面的录音笔。

Plaud 的便捷程度确实能帮助我在不同场景下方便地录音。之后，我会把它放到闪念贝壳里进行语音转文字，这样就不用付昂贵的会员费来转录了。毕竟国内版的转录和总结用的还是国内的模型，效果并没有很好。

转录完之后，我会把语音转文字稿放到 Gemini 预先设置的 Gem 里梳理。目前用下来，整个流程还是非常通畅的。

详见 AI 录音硬件是个伪需求吗？（Plaud Note Pro 购买复盘）

管理端

从一开始，我就不是「all in one」的拥护者。一直秉承着重器轻用的理念。

但是，重器轻用也要有一个逻辑，即什么样的东西需要被分开来使用。同时，也要照顾到怎样处理好软件和软件之间信息的流转。

尤其是在当今信息供给爆发的年代，我们周围的信息越来越多，日常接触的内容也越来越多。那么，如何管理这些内容？怎么样把这些东西和自己日常的生活和兴趣关联起来？这就成了过去一直在思考的话题。

最终，我还是把这些信息进行了简单的二分法，所以收集到的可以阅读的都是信息，而只有我自身经过理解并梳理过的东西才是我自身的知识。经过这么简单的分解后，选取工具也就变得简单了起来。

从 Tana 回到 Notion

从功能的复杂性可定式化程度上而言，毫无疑问，Tana 是远远超过 Notion 的。但自从 Notion 更新了 3.0 之后，我就毅然决然地放弃了 Tana。

首先，除了 Tana 的移动端，尤其是我主力操作端 iPad 端基本上是残废以外，Tana 最大的弱点自然是它虽然有 AI，但没法对整个知识库进行梳理。而 Notion 的 AI 跟自身的架构集成得要深很多。之前我也写过文章分享过在 Notion 里设置的一些 agent。

最近在看了二一的教程之后，我更是把这些 Notion agent 通过路由集中起来，这样也避免在各种 agent 里面来回切换，极大地提高了我使用 Notion 的效率。

现在我会把各个软件，包括像是新知从微信里面收集的文章、从小红书里收集的帖子、从 Plaud 里面收集的会议记录和讲座记录、从 Podwise 收集的播客转文字稿、BibiGBT 收集的视频转文字稿，这些东西都会总到 Notion 里面。同时，也通过 Notion 来管理自身的一些信息项的笔记，包括菜谱、家庭的一些记录、英语单词学习、订阅的记录、网络安全相关知识的学习、prompt 收集。此外，还有零零散散各种生活中的一些数据库都会汇总到 Notion 里进行结构化管理。

总体上看，Notion 就像是我生活中的信息收集器。我们常说 AI 时代最重要的是上下文，而 Notion 正是扮演着这个上下文中心的角色，AI 则辅助在这个中心里输入、输出、管理，并能方便地与其他工具集成 —— 比如需要提取信息时，可以通过 MCP 从 Notion 调取。

放弃又重新开始使用的 Heptabase

作为 Heptabase 的第一批用户，看着 Heptabase 一步步虽不快，但踏实地走到当前这一状态，还是有点遗憾的，毕竟 Heptabase 当前的状态离 Alan 当时的愿景还有不少差距。但不可否认的是，Heptabase 的本体，一个用于中观研究的白板，它的生态位是任何其他软件所无法取代的。

去年底，Heptabase 到期之后，我没有续费。当时是觉得，白板是个伪需求，并没有什么文章或书籍需要用白板来拆解。在这一想法下，我重新用起了颜值更高的思源笔记，把课程笔记、写作都放到了思源里。但用了一段时间之后，发现 Siyuan 对 AI 的支持实在是一般，相比之下，年底 Heptabase 密集上了一批 AI 相关的功能，其中就包括了最重要的通过 AI 检索全库内容。

此外还上了 Web Tab 这一个极大拓展了使用场景的功能。更重要的是，无论是纸笔还是电子，我都坚持做 Daily Notes，而在 Heptabase 里，daily note 可以以中观的视角被呈现，后文也会在「日记」的部分详述。

总的来说，我最终还是回到了 Heptabase 的怀抱，把所有自己吸取到的知识、观点都放到 Heptabase 里，并且自从有了 MCP 之后，从 AI Chatbot 创建卡片也变得非常方便了。这让 Heptabase 能真正成为我的知识中心。

输出端

iA Writer

之前的这些年，我的写作软件一直在变，也尝试过不少，或专业或不专业的。专业的像 Lattics、Ulysses 都曾尝试过。也曾在各种笔记软件里面试过写作，像是 Obsidian、思源，还有 Logseq 里面的长文写作插件也都尝试过。

一直听说过 iA Writer 的大名，直到今年终于痛下决心买了 iA Writer。买它原因主要还是它的界面设计 UI。非常的优美简洁，虽然没法自定义字体，但是它本身的颜值就足够高了。而在写作上，一切都从极简出发，帮助人能够专心在写作本身，而不是其他的稀奇古怪的功能上面。而它通过 iCloud 的同步方式也非常的方便。现在每一篇文章我都是通过 iA Writer 记录选题、完成撰写来写出来的，写完之后再把它粘到 Heptabase 和 Notion 里面去，并发布到自己的博客里。

日记

前面也说过，我有记自己 life log 的习惯，之前都是在 Tana 里面做 life log。但是 Life Log 有个关键点很多家都没有做好，那就是和其他日子的联动，需要能通过越简单的操作实现越好。因为，写 life log 经常会需要参考之前的 action，这样才能让 life log 发挥作用，并且能让一个个日程的点连成一条线。

举个例子，在 Roam Research 和 Logseq 里，这种连点成线是通过上下滚动可以实现，Heptabase 则可以在白板里以日历的形式插入 Journal，能在一屏上看到多个日历。

Notion 里，则可以通过 AI 把一天的日程分门别类输入到表格里，在数据库里看每个类型的 life log 在时间段里的变化（具体可以参见如何通过 AI 追踪自己的情绪）。

基于以上原因，现在我的日记工作流是，白天主要在 TN 里用笔记录下 Life Log，如果在外则手动录入到 Heptabase 的 Journal 里。晚上会通过闪念笔记，基于 TN 和 Heptabase 里的记录把一天的经历讲一遍，把生成的记录一键转存到 Day One、Heptabase 和 Notion 里，其中 Notion 会自动调用 agent 来分门别类存入日报数据库。

博客

博客方面，从 Thorn 迁移到了 WordPress，并实现了把正文和 Memo、摄影画廊都放在一个网站上的需求，详见博客折腾纪录。

其他

待办

在待办软件上，过去这些年我换过好多不同的 app，从滴答清单到 Things 到 OmniFocus 之类的专业的软件都试过，但一直没找到最适合我的。

前段时间重新用起了一段时间 Notion 和 Things，但发现用来管理待办都比较尴尬。

Notion 的问题和 Tana 一样，作为一个待办软件太重了。没有人能顺畅地使用一个要花小半分钟才能打开的软件来记录和管理待办的。而 Things 的问题则在于，随着苹果自带的提醒事项越来越好用，Things 的绝大部分功能都被覆盖，而这时使用原生功能的可靠性以及间接性都远大于是使用第三方软件。

当下我的解决方案是，按照使用场景把待办分成不同的类别。

简单的，短期内强时间性的用微信提醒；
相对长期但有时间性的待办用 iOS 自带的提醒事项 app，并能自动显示在日历上
工作上的待办和任务用 Linear，
日常、非时间性、或有比较宽松时间性但没有提醒需求的待办用纸笔写在 M5 上。

通过区隔不同的适用场景，能尽可能减少决策如何分配待办时的心理负担，并能减少看到一个长长的列表时的心理压力。

Vibe-coding

由于我并不是一个程序员，vibe-coding 的使用率大概只有一个月一次，并且基本只涉及到对文件进行一些处理，大部分涉及到开发的内容用 Gemini 的网页版就可以实现。

年中的时候买了 Lenny 的一年会员，送了一年 Cursor 的会员，大部分时间都是用 Cursor 来做简单的 vibe coding。年底 Gemini 更新了之后，更是把挺多工作移到了 Gemini 线上。

倒是最近这几个星期，因为 Antigravity 白送了不少 Claude Opus 4.5 的额度，试着用了些 Antigravity 的 agent，但是效果并没有很好，便终于下定决心重新订阅了一个月的 Claude Pro，在半年之后终于用起了 Claude Code。

用了 Claude Code 之后最大的惊喜莫过于 skill 了，虽然看起来像是把 prompt 模板化，但感觉有很大的潜力可挖，可以把自己的一些工作流固化下来（话说我有什么工作流呢），并通过 AI 来实现。

Alma

年底最大的惊喜来源于 Alma，短短两周内，见证了一个极简的套壳 chatbox 如何飞速进化，从 MCP 到 skill 到 vibe-coding，感觉很快就能变成主力的 AI 客户端了，持续关注。

Mintrr

Mintrr 的更新速度和 Alma 可以算是两个极端了。当时买了这个软件纯粹只有两个原因，一个是对创作者的支持，另一个就是市面上没有好看的画廊瀑布流型的笔记软件。后者直到年底也没有第二个，但由于使用的软件太多了，短期内没有继续使用的计划，先养一段时间再说。

Raindrop

这一年里使用 Raindrop 的频率明显变低了，大部分的链接存进 Raindrop 之后也在也不会再打开。所以也没有续费 Raindrop 的会员了。

Dia

浏览器方面，自从 Arc 停更之后，就转移到了 Dia 上。比较特殊的一点是，我在 Dia 上没怎么使用过它的 AI 功能，感觉大部分都比较华而不实，如果有需要总结文章的需求，会直接调用 Youmind 的插件。我对 AI 浏览器这个业态的发展未来还是比较悲观的，并不觉得它会是一个重要的入口。当前继续使用它主要只是出于它的设计。

Dinox

Dinox 是我觉得比较可惜的一个软件。一方面是太过极客，另一方面是毕竟是国内软件，模型上没法用最好的。而且由于开发者只有一个人，并且主要的用户大部分都是当初买断的那一批，有点担心这个软件能否可持续地运营下去。

总结

相比于 2024，AI 已经在我的生产力系统里扮演了越来越重要的角色，而我对 AI 的态度也从 22 年刚兴起时的狂热，到 23 年的反思、24 年的刻意退避，到今年的去芜存菁，在思考后把 AI 融入到自身的工作流里，在保证自身主体性的前提下让 AI 更好地辅助我。也非常好奇，一年之后，当我再做一轮总结时，一切又会有什么样的变化。

2025年12月31日

AI 录音硬件是个伪需求吗？(Plaud Note Pro 购买复盘）

自从以 Plaud 为首的 AI 录音软件在国际市场崭露头角，越来越多的人开始关注这个领域，也有越来越多的厂商进入这个赛道。尽管社交平台上不乏质疑声，但至少这是个逐渐升温的市场。

我的探索历程

最初，我在 2022 年底发现了 Rewind（现已更名为 Limitless）。它推出了一款名为 Pendant 的颈挂式智能硬件，号称可以记录生活中的所有输入。我第一时间预订了这款产品，但它经历了一次又一次的跳票，直到今年才大规模发货。而我在 2024 年就已经取消了预订。

期间，我也尝试过传统大厂的产品，走了不少弯路，比如购买 DJI Mic Mini 来充当录音笔。最终，当 Plaud 这款相对昂贵的产品进入我的视野时，我立刻被它的颜值和功能吸引，果断入手。

起初我想买海外版，也看了很多评测。就在准备下单前一天，Plaud 上新了 Plaud Note Pro，我按捺住了冲动。一周后，Plaud 宣布在国内上市。我曾纠结于国内版和海外版的选择——海外版可以使用国外模型，而国内版因合规要求只能使用国内模型。综合考虑后，我最终选择了国内版，将其作为录音硬件使用，搭配自己订阅的 Gemini 模型。

AI 录音软硬件是真需求吗?

回到核心问题：AI 录音软硬件是否是刚需？我们可以从两个维度来理解这类产品的定位：

便携录音笔
AI 场景入口

我需要一个便携录音笔吗？

从第一个维度看，经过实际体验，答案毫无疑问是**「要」**。

主要原因在于，手机虽然是最方便的录音工具，录音效果也不错，但它会被随时占用。长时间录音时，录音功能很容易被其他软件抢占，导致录音暂停，甚至后台被杀，无法保存录制内容。

与此同时，我有一个常见的需求：日常通勤或晚上锻炼时，我经常骑电动车或公路车，时长半小时到一小时。这期间，我会戴着一只 AirPod。

由于苹果系统的限制，戴着耳机时，录音系统会自动选择最后接入的设备作为麦克风。也就是说，戴上耳机后开始录音，耳机的麦克风就会成为默认选项。

AirPods Pro 的麦克风质量远逊于手机自带麦克风，尤其在通勤和骑车场景下，风声和周围噪音会让录音几乎无法使用。

这种场景下，一个既能便携地吸附在手机背面、又能独立分拆的麦克风，自然成了我的需求之一。

另一个场景是：在外听讲座或参加快速会议时，拿出手机录音显得很不礼貌，也容易遭人拒绝。而吸附在手机背后的麦克风，影响程度会小得多。

这也是我没有选择 Plaud Note Pin 这类装饰型产品的原因——装饰虽小，但仍然显眼，一旦被认出来就会很尴尬。

我需要一个硬件产品作为 AI 场景入口吗？

答案是需要，但 Plaud Note Pro 并不是我理想中的产品。

之前我也看过 Plaud 创始人许高以及莫浩宇在博客访谈中的分享。他们并未将 Plaud 定位为单纯的硬件公司，而是希望通过积累用户日常生活中的上下文数据，让人们逐渐依赖 Plaud 及其背后构建的生态数据库。

但对我而言，我是否愿意将所有上下文、所有 context 都托付给 Plaud？至少目前，答案是否定的。我的上下文不仅包括日常语音，还涵盖各种剪藏、快捷输入、主动记录的笔记，以及日常的存储数据库等。Notion（结合 Notion AI）是我这半年来最主要的个人场景整合工具之一，这点我会在之后关于生产力系统的文章中详细说明。

在这种情况下，我显然不希望将所有数据都绑定在 Plaud 这个产品内。这也是我选择 Plaud 国内版而非国际版的原因。使用国际版意味着需要支付更多费用来获取最优模型，而它自己的 APP 目前使用体验还比较差。因此，我倒不如只使用它最基础的语音转文字功能，提取出转写文稿。

我用当前最好的大模型——我订阅的 Google Gemini 2.5 Pro，来对这些语音转文字素材进行总结，再录入到 Notion 中。从效率上并没有损失太多。而且即使用完本月语音转文字的配额，我还有其他买断制语音转文字产品，可以进行语音转文字转写，之后再在 Gemini 里整理。

这样，我既能获取最好的模型，达到想要的效果，同时又能保证所有内容、所有上下文都在统一的场景下得到管理。这对我而言，无疑比将所有内容都托付给 Plaud 更具吸引力。

所以，AI 录音硬件是一个伪需求吗？

对于我而言，答案很明显：并不是。而我相信，在现实世界中，有许多与我有类似需求、面对类似场景的人，同样需要 AI 录音硬件为他们的日常工作生活赋能。

然而，我需要的不是生态而是工具。

不可否认，Plaud 和 Limitless 这类公司的愿景极为宏大。可以想见，他们作为生态系统所要达成的目标，在可预期的未来是有可能实现的。然而，OpenAI 之类的公司也必然会设法抢占这一市场。而 Plaud 之类的公司在之后走向开放，比如开通更多自动化 API 功能，也许是一个思路。

这些 AI 录音硬件公司当下要做的，唯有将产品尽可能打磨至极致。就像 Plot 那样，把产品打磨成一件艺术品——继承苹果过往的美学基因，让人因设计而买单，而非仅因功能而买单。这或许是他们能够走下去的一条路径。

那么，AI 录音硬件是伪需求吗？它不是。但市场空间能有多大，取决于这些公司能看到多远，走到多远了。

2025年11月10日

博客折腾记录：Thorn – WordPress

正如之前看到很多博主所说的，每一个写博客的人,总会不免经历在不同博客平台上到处折腾的过程。曾经我也觉得自己是想要认真写一点东西的，奈何看看我在不同笔记软件和各种生产力工具之间来回折腾的「斑斑劣迹」,博客平台的折腾也迟早是一个不可避免的话题。

最早其实我尝试了几个不同的平台，从 Gridea 后来到了 Notionnext。之前也详细写了两篇文章博客和笔记软件一样，就是个不停折腾的过程和博客从 NotionNext迁移到 Thorn,介绍为什么用 NotionNext，以及从 NotionNext 迁移到了 Thorn的经历。而最近我终于下定决心离开 Thorn，换一个平台。

为什么离开 Thorn？

Thorn 的几个痛点

我把博客托管放到 Thorn 也有一年时间了，先稍微总结一下之前 Thorn 让我感觉到的几个不舒服的点：

多端同步功能不稳定 – 经常出现隔段时间就需要在不同的电脑上重新登录的情况，而且文章后面总是会出现红色的小叉，让人胆战心惊；
RSS 功能残疾 – 在常用的一些 RSS 客户端上基本上很难抓取到新的内容；
不能自定义字体 – 这对于我这个颜值党来说还挺致命的，无论是笔记软件还是博客网站，能自定义字体对我而言绝对是个大加分项；
发布流程比较奇怪 – 需要有一个奇怪的拖拽动作，整体的操作逻辑也并不是非常顺畅；
不支持外部图床 – 我平时使用的是腾讯对象存储，这导致我在不同平台上（思源笔记和 Notion）上的内容无法直接复制到 Thorn 里；
不支持移动端 – 手机端虽然不是强需求，但是无法在 iPad 上使用就是个硬伤了。我日常的创作大都是在 iPad 上完成，而这个缺点强行拆分了创作和发布这两个步骤，于是便时常会出现，创作完成后就，一想到要移到电脑上重新编辑，进行发布，就会感到烦躁，甚至懒得继续创作的情况。

但总体而言，Thorn 的颜值还是非常高的，而且在部署、存储、设计这些方面在大部分时候也很在线，这也是之前一直没有下定决心放弃它的原因。

那为什么最终我还是决定要放弃 Thorn 呢？

其实原因很简单：

Thorn 的更新其实停滞了有很长一段时间了。从作者那里听来的是，他之后会把精力投入到开发新产品上去，新产品会逐步取代 Thorn。但这里面就存在几个问题。

不可预测的新旧产品的过渡期

一个问题就是，Thorn 这个产品本身还是挺好用的，虽然它的多端同步功能做得比较一般，而且需要在本地下载，但至少它是个比较成熟的产品。奈何它里面也有一些 bug 一直没有得到比较好的修复，目前来看作者也并没有动力去修复它们。

新产品上线到完全继承 Thorn 的功能，肉眼可见还有挺长一段时间，并且可能要以半年到一年来计算。在此期间我不得不要忍受 Thorn 的那些不好的使用体验。

新产品的不确定性

新的产品虽然看起来功能非常强大，但是成本也很高，目前的定价是每个月 20 美元。我已经订阅了好几个笔记 / AI 产品，没有需求为它额外投入那么多的成本。此外，也不知道作者是否能在新产品上把上文提到的 Thorn 作为一个博客工具的主要问题解决。毕竟新产品看起来是一个以 AI 为主导的软件，明显作者的重点也放在了 AI 之上。

新平台的选择

既然选择了要换平台，那必然先要明确我的需求。之前无论是 NotionNext 还是 Thorn，都是相对定制好的模板，虽然可以自己选择一些主题，但自己改造的空间比较小。

其实这样看来，一开始 Notion Next 还是做得挺不错的，无论是字体还是它提供的一些主题都挺多。以后如果想要再换过去的话，可能 Notion Next 也是比较好的考虑方向。不过 Notion Next 也跟 Thorn 有一个类似的问题，就是它的 RSS 非常残疾。

最终方案：WordPress

既然要想给自己增加更多的自主权、更多的修改余地，那么实际上也就仅有两个选项了：一个是选择 WordPress，另外一个就是静态网页。

WordPress 是一个非常大众化的选择，之前也看到好几个装修得非常漂亮的 WordPress 个人博客。

其实如果代码能力比较强的话，使用静态网页也能实现类似效果。但是问题在于，我自己并不是一个有代码基础的人，而且可能也没有那么多的精力来对相关内容进行太多维护。无论是搞 Git，还是把各种内容上传到 GitHub，其实对我而言操作的成本还是挺高的。

于是综合考虑，我就放弃了 Hexo 和 Hugo 这些方案，选择直接在 WordPress 上搭建。

搭建过程

参考与选择

这里我参考了衛斯里之前在他的一篇博客中关于用 WordPress 搭建博客流程的经验。

因为我自己本身是有一个域名的，因此我就跳过了购买域名的环节。我的域名是之前在 NameSilo 上买的，主机是在 Hostinger 上购买的。

之所以不选择一些 VPS 或者是其他一些主机，主要是因为我没有什么代码知识，对于自己以后对它们的维护，或者是安全还是其他一些维护并不是很有信心，所以就暂时依靠 Hostinger 的服务吧。一买就买了 4 年，希望至少在这 4 年里能够比较稳定一点。

意外的迁移顺序

这是初期一个我没有预料到的情况。本来我想的是把所有的博文都转移好到 WordPress 上之后，再把域名切过去。但是 Hostinger 以及 WordPress 的设置和流程中会需要先把域名切过来，这样它才能比较顺畅地进行访问。

所以我干脆一不做二不休，直接就迁移了过来。之后我发现这确实是一个比较明智的决定，毕竟慢慢把文章迁过来其实花费时间并不会太久，而这样能让我比较顺畅地直接在网站上进行一些装修。最终整个迁移过程花了大约两周的时间，主要是文章得一篇篇搬家，不然时间会更短一些

博客装修

设计灵感

说到装修，我这边是参考了之前 Jack 和 Another Dayu 的经验，尤其是 Another Dayu，我对他的博客的审美还是非常喜欢的。

虽然我对自己的博客会有一些要求，主要是喜欢放一些封面图，但整体还是比较具有一个极简的风格。这点上他们有不少值得我学习的地方。

内容分类

博客的 type 上，基于 wordpress 的博客终于实现了我一直以来想要实现的一个需求，即希望能够把博文和我自己日常的一些随想、一些摘抄能够区分开来。

在博客创作本身上，我之前尝试过周报（没坚持下来）、攒大稿子、memo 这几种不同的方式，发现都不是特别适合自己，因此还算是在继续摸索中。目前来看，短期内会考虑短中长三者同时进行的模式。

短内容

首先是设定了一个分类叫做「Memos」，像我的一些日常摘抄，平常可能会先放到 Flomo 里，然后我会定期挑选一些值得分享的摘抄或者是自己的灵感想法，收录到 Memos 里面而不进入首页。这种一般是比较短小，或者说暂时没有什么动力来写成长文的，但是它们又相对而言比较真诚，也算是把自己的一些零散的内容做一些输出分享。而且在 Blocksy 这个主题里面，它的分类的内容展示还可以选择一些类似于瀑布流的展示方法。瀑布流的展示方法还是挺漂亮的，但这也会导致一个问题，就是其他分类内容会相应地也会呈现那种瀑布流的样式，而那些长文如果比较长的话，这个展示也会非常难看。因此对于其他每一个分类，我是选择新建页面，而不是直接展示分类内容，只展示标题和适当的摘要。

与之类似的是「Lifelog」，主要存储的是日常的一些零散日记。

专题（中长篇文章）

在我的选题库里攒了一大堆可以写成长篇的选题。而现实是，一想到要花那么长的时间精力在长篇内容上，很多时候就会丧失了开始的动力。

因此后续我会基于具体的主题，无论篇幅长短，原子化地写一些中短文，并定期写一些长篇内容。这样才能维持一定的更新频率，也能保持写作的热情。

视觉设计

说到博客本身，目前我自己选择的是思源宋体。当然这是因为我之前没有在实用的国内的 CDN 里面找到我最习惯用的几种字体。而霞鹜文楷虽然看起来不错，其实现在有点烂俗了，最终选择了思源宋体。

背景看起来是白色，其实我选择的是我在各种阅读器最喜欢的白磁。它比白色略微加一点灰度，让视觉上更不容易疲劳。

此外还加了段 css，得以在 2 级和 3 级标题下方加一条类似于 GitHub 风格的分隔线。

未来规划

除此之外，之后还考虑在博客里面加上自己的相册，放一些自己的摄影作品。可能后面看看是不是把自己的一些运动记录等等也都放上去。这些就不急，可以之后学一学 Dayu 的一些做法。

此外，之前每次写文章总是会花一些时间用 AI 生成封面图，事后看起来其实这个行为用处不大，会让首页显得杂乱。之后可能会减少用封面图的频率。

总之，迁移还在进行之中，后面可能还会对它的布局做一些进一步的更改。而且我现在才玩 Blocksy 这个主题仅仅几天时间，后面等更熟悉了可能也会有一些新的变化。

希望大家能够喜欢我这次博客的迁移。等迁移完成了，可能会再根据情况看是不是写一篇新的文章吧。

2025年10月30日

语音转文字正在改变我们的生活——兼简要横评市面上的语音转文字笔记软件

自从 Whisper 模型出现以来，语音转文字就成了我的写作流程中非常重要的一环，之前也写过一些文章分享了 AI 语音转文字的一些用法。而随着越来越多人开始使用语音转文字、越来越多相关的软件出现，这一「便捷」的输入方式也为越来越多人所熟知。在以前文章中也提到过，人工智能可能对人类社会生活方式造成许多改变，包括日常创作、人际交往乃至工作方式都迎来了诸多变化。最近我发现，这些变化已切实地体现在我身上。

近期写作上的一些变化

以前写文章的时候，我通常是有想法就直接用手机打开 Flomo 记录灵感，有空时在就随便找个咖啡店、或者在高铁、飞机上用iPad上打字成文。但最近在记录灵感时，我越来越多地通过语音来记录了，而使用语音时，出于「语音尴尬症」等原因，下意识地会避免利用一些在公共场合的零散时间进行片段的输入。更多是希望能找到一个相对空闲的时间、相对独立的地点，用语音来完成整体草稿的撰写。

这其实和我一开始想的「语音有利于片段化的输入」这一想法出现了很大的区别，也引发了进一步的思索——语音输入和键盘输入的区别到底有哪些，而语音输入对我们又会产生什么样的影响。

语音输入 vs. 键盘输入

思维模式

如果用一个简单的比喻来描述什么是键盘输入和语音输入，以及他们之间的区别，文字输入其实有点像我们是在一块砖一块砖地来「建一座房子」。在这个过程中，我们可以随时停下来审核结构，发现不满意的地方就拿掉，然后重新垒上，同时，我们可以交替着在多个地方开始垒墙。这个整个过程是异步、非线性的过程。在这个过程中，我们会经常需要做修改、拼接等等。经常写作的人也会有这种感受，我们会对每一个句子、每一个段落、每一个词进行琢磨，当我们写完一句话时会回头看看，删掉几个字，或立刻做出修改。

相比之下，语音输入更像一条「河流」。思想如水流，说出的话直接奔涌向前。我们无法让河流暂停，回到上游修改水流，只能保持它从头到尾流动。这过程同步且线性，需要不受打扰的环境。

为何会有这种差异？一个原因是认知摩擦力不同。打字时，我们经历思考、选词造句、寻找按键、拼写，然后看到文字出现，整体是一条很长的链条。语音输入则更容易进入心流状态，因此我们希望有个不受打扰的环境，一旦进入状态就不停下。写作时注重的会是思维的连贯表达，而非单个词语的完美与否。

同时，打字和语音输入调用的思维模式也不同。书面写作偏向逻辑结构和分析，讲述则偏向故事思维。讲故事追求连贯完整，写作的逻辑思维则完全不同。

我们并非说河流模式一定比建筑模式好，或更代表时代发展方向。相反，这是每个创作者面临的取舍。

效率

语音转文字技术对写作最直观、最可量化的影响，毫无疑问在于对效率的颠覆性提升。人类说话的速度远超打字，那自然，只要有足够的内容储蓄，能够维持输出强度，那么自然在相同的时间下，就能够输出更多的文字。不过需要注意的一点是，语音转文字也导致了编辑负担的转移。在起草阶段所节省的时间，一定程度上被转移到了编辑阶段。

正如上文所说，口述生成的初稿往往是未经加工的「原材料」，需要大量重写和结构调整才能成为合格的书面语。因此，语音转文字带来的生产力提升，其实并非简单地缩短了总时间，更多是重构了时间分配。

对于那些在编辑上比较苦手的人来说，实际上可能并不能减少他们总的输入时间。而真正的效率提升，属于那些能够成功适应新的两阶段工作流程，并掌握相应编辑技能的写作者。

对文字本身的影响

语音转文字技术对写作带来的转变远不止于效率，它也在潜移默化地改变文字本身的特质。

既然文字来源于口语，那写作出来的文本也自然会更加倾向于对话式的风格。这种风格在某些博客、介绍性文章中自有其优势，能营造出一种亲切、自然的氛围，但若讲述者本身不擅长讲故事，则有可能会囿于流水账的困境。

这也就引出了语音转文字所带来的潜在问题，即会导致行文冗长、结构松散。在我的语音转文字写作中就经常出现这个问题，由于思考和写作是同时进行的，而人在思考的时候会不自觉地重复自己的观点，以保证逻辑的连贯性。当这种思维落在纸面上，就很容易会出现大段的重复。

影响不止于写作？

语音转文字所带来的影响不只局限于写作，它对于我们人与人之间的沟通，乃至于人与生活之间的互动都会带来很大的改变。

人和人之间的沟通模式

举个例子，语音转文字对工作中人与人之间沟通就会有很大的影响。以前当我们开会时，除非额外注明有人来专门做会议纪要，不然很多时候会议的内容是无法追踪的，人们相对而言就可以更加畅所欲言一些。而随着语音转文字技术的运用，所有的会议都可以留痕，这也就导致人们在线会议时会更加谨慎，更加注重自己的措辞，对于自己所抒发的内容会有更多审慎的考虑，会避免随意输出可能对自己或他人不利的内容。

这一方面使得同事与同事或者说不同部门之间的沟通变得愈发困难，但在某种程度上也增加了线下人与人之间沟通的重要性。在工作中，人们可能更加会倾向于线下的会议，或者说在茶水间等非正式场合的碰面。所以说，语音转文字技术在工作中可能会导致地理位置相近的人之间的关系变得更加紧密，而对于位置相对较远的人而言，反而会加深他们之间的隔阂。

人和社会之间的交互

语音输入正在重塑人们执行日常任务的方式，培养了新的行为习惯和用户期望，例如，人们期待技术能够提供即时、准确和个性化的响应。然而，这种行为转变也面临障碍，包括用户对设备全部功能认知不足，以及在公共场合使用语音命令的社交尴尬感。

而对于人与社会，以及人与社会中的一些事物的交互而言，也带来了很多的改变。语音转文字的效率大大优于传统的写作，人们在工作中也会更加依赖语音转文字，这就导致了人们工作范式的一定改变。很明显，在那些所有人坐在一个场合进行工作的场景下，语音转文字可能并不适用。人们会避免自己的隐私被探听，同时也担心会影响到别人。因此，在工作场所里，人们可能会需要更多个人的空间，或者更多可以短暂使用的个人空间，如电话间等。而这也同时进一步导致了人们工作节奏的加快。由于信息产生和处理速度的提升，人们的工作压力也会进一步增加，并且也会要求人们掌握更多的语音输入技巧。由于语音天生是流逝的，它也会要求人们学会怎样说出结构化的内容，这对人们的思维模式的要求其实更高了。

对社会的深层影响

而对社会交互的深层影响而言，优点自然在于，它在功能上进一步增加了信息的民主化程度。由于不善于打字的人也因此能够更加轻松地创作内容，在一定程度上降低了内容创作的门槛，同时也为那些文盲、不擅长书写打字，或者有手部残疾的人提供了一个相对公平的表达渠道。

而对于文化而言，语音转文字带来的可能更多是一些负面影响。相对而言，社会公平虽然在一定程度上缩小了阶级之间的不公平，但是对于不同语言、不同族群人之间的公平程度反而有可能是一种放大。那些使用少数语种或者有特殊口音的人会因此丧失快速输出的机会，和主流人群之间的差距会进一步扩大。而且语音转文字在主流语言上的优势也会随着语料增加而进一步增加，一些地方语言很有可能会加速消亡。当然，这里面也有一些反例，人工智能也可以用来保护或识别一些比较古老的语言，这取决于人们如何使用人工智能技术。

第三个变化更多在于认知模式上，人们通过语音随时记录想法，这改变了大脑处理信息的方式，就像我们之前所说的「建筑」和「流水」之间的区别。这长期对于人们的思维方式也会有负面影响，一旦人们习惯于随时随地记录自己的语音，自然的记忆能力反而可能会被削弱。

简要横评常见的语音转文字软件

下文会对我使用过的一些语音转文字软件进行一些简单的评述。特此声明，我仅评测我付费使用过的产品，且不打总分，因为不同维度对不同人来说有着完全不同的权重。篇幅所限，每个软件仅作简单评述，如有需要详细介绍，可以在评论区留言，后期有时间了可能会写更详细的文章。

语音+笔记

TL;DR

	Audiopen	Voicenotes	闪念贝壳	Flomo	Dinox
价格	⭐	早鸟⭐⭐⭐⭐⭐订阅⭐	买断⭐⭐⭐⭐订阅⭐⭐	⭐⭐⭐	买断⭐⭐⭐订阅⭐⭐
UI/设计	⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐
输入便捷度	⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐	⭐⭐⭐
AI 能力	⭐⭐⭐⭐	⭐⭐⭐	⭐⭐⭐	⭐⭐⭐	⭐⭐⭐⭐⭐
上传录音	⭐⭐⭐	⭐⭐⭐	⭐⭐⭐⭐
集成能力	⭐⭐⭐	⭐⭐	⭐⭐⭐⭐⭐	⭐	⭐⭐⭐⭐
附加功能	⭐	⭐⭐⭐	⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐⭐
开发者能力	⭐⭐	⭐⭐⭐⭐	⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐
未来预期	⭐	⭐⭐⭐⭐	⭐⭐	⭐⭐⭐⭐	⭐⭐⭐

Audiopen

在所有语音转文字笔记软件中，Audiopen 应该是最早出圈的一个产品。早在2023年它就诞生了，作者从来没有编程经验，通过 vibe coding 创造了这款产品。

由于它当时昂贵的定价，也激起过一些讨论。Audiopen的 UI 以及语音转文字的准确度在所有产品中都是最佳的。去年，它也开发出了 app 端，在易用程度上也很优秀。它的后端集成做得也挺好，可以自动把转录及AI修改好的内容发送到 Notion，或通过 webhook 发动到其他自己想要管理的软件之中。综合来看，作为这个行业里的先驱，除了价格较贵之外，没有什么值得吐槽的问题。

Voicenotes

如果你错过了 Voicenotes 早期的 50 美元早鸟价买断的话，那这可能是语音转文字笔记软件用户最大的遗憾之一。

Voicenotes 在所有笔记软件中可以说是综合了价格、 UI、设计逻辑、后期的集成等最好的一个产品。Voicenotes 的设计非常克制且优雅，无论是极简的设计还是对于 AI 改写的克制，在使用便捷度上是首屈一指的。

它既支持在 App 中进行转录，也支持上传语音文件进行转录。除此之外，Voicenotes 还支持通过一个叫 Pages 的功能来把自己的语音转文字发布出去，形成自己一个非常微型的博客。我也把它作为我个人博客的一个补充，记录一些我个人的日常闪念。同时，它也支持 AI 问答等功能。

值得一提的是，Voicenotes 的作者是 Buy me a coffee 的作者，因此信誉度相对可靠，暂时不用担心跑路。

综合下来，Voicenotes 是我在所有笔记软件中使用语音转文字的频率最高的。而且它同时支持网页端、手机端以及苹果手表端的输入，这让它的使用场景得到了大大的拓展。近期，它也更增加了在桌面端的快捷输入，并且更加扩展了它自己的使用场景。

闪念贝壳

闪念贝壳其实是先在海外做起来之后才拓展到国内的，在外区它的名字叫 Ideashell。作者不愧是设计出身，它的外观设计非常优美，UI也很简洁美观，对颜值党来说用着非常舒服。

而另外一个特色则是它与其他各种软件的集成。打开软件（或通过小组件/action button)，录入一段语音，生成的内容，可以被非常便捷地立刻发送到包括从微信、提醒事项到 Notion、Obsidian、熊掌记、Craft、滴答清单、Day One等一系列笔记软件中去，在操作的便捷度上毫无疑问是在所有软件中最佳的。

此外，闪念贝壳支持上传录音文件进行转录，并且支持区分不同发言人，这个功能常被我用于临时会议记录。

Dinox

如果说闪念贝壳是典型的设计师作品，那么 Dinox 则是典型的工程师作品。

如果要论各种与 AI 相结合的功能最齐全、设置最复杂的产品，Dinox 非他莫属。它支持从语音转文字到后续的结构化处理、相关笔记、AI 聊天等一系列功能，甚至还支持手机端检测存储，并且包括 S3 等不同的对向存储。

可以说，所有你能设想的与笔记相关的功能在 Dinox 都有。但自然，缺点也是存在的：它的操作设置过于复杂，入门相对较为困难，且当前阶段 bug 较多；在美观上与其他几款产品相比略有缺失。同时，由于作者想法很多，整体作品割裂感比较强，并没有一个明确的产品特质。

但是，作者的更新频率以及响应速度非常之快，几乎每隔几天就有一个新版本，可以说是未来可期的一个选择。

Flomo

其实早在 AudioPen 流行之后，我就和少楠提过在笔记软件中加入语音转文字的想法。但当时他们觉得需要先研究语音转文字是不是一个笔记软件的刚需，以及如果真的加入了，如何进行最符合他们产品逻辑的设计，谁料这一研究就是两年。

对于他们这个解释，一开始我和其他挺多人一样，觉得他们只是出于成本考虑而拒绝做出一些新的尝试。也因此，我尝试了其他挺多速记软件。

几个月前，Flomo 终于加入了语音转文字。并且我也很欣慰地看到他们确实在里面融入了自己的想法。相比于那些着重于语音输入后，对笔记进行很多基于不同prompt调整的软件而言，Flomo 不支持自定义prompt（对不少人来说这是个缺点），非常注重写作者原来的结构，仅去除了一些常见的口辟等。

这其实也和我对于笔记的看法不谋而合。之前我也尝试过通过很多预先设置好的 prompt 来对自己的语音输入进行大幅度修改，但最后却发现这些修改过的笔记虽然看起来更加精致，但很多情况下并不能反映我自己的原意。亦或者，当我事后回顾的时候，总感觉这些笔记有些陌生。正如少楠和Lightory 想传递的笔记理念，只有那些在我们用自己的理解记下来的内容，才是我们当下最真挚的表达。我们自己通过思考来进行的重新编辑，也能让我们对自己的笔记有更深刻的印象。

此外，这半年支持的 AI 搜索和最近引入的 AI 洞察也很有想法，能帮助用户发现笔记和笔记之间的关联——虽然 Voicenotes和Dinox也支持类似的功能，但从易用程度以及完成度上来看，后两者只能称得上有这个功能，远远不算好用。

说了这么多，Flomo 当然也有一些问题，比如说他的语音笔记最长只能支持五分钟，对生成的内容会进行自动审核，替换掉一些不当语句，并且不支持同步到其他软件等。但从使用的易用性上，以及语音转文字这一功能本身的实现的完成度上，Flomo 还是做得很好的。

其他：Get笔记、即我笔记、Reflect、Tana、Workflowy等

这里提到的这些笔记软件并不代表市面上所有支持AI语音转文字的软件，还有几款可以简单提一下。

如果把市面上的语音转文字软件分成两类，一类可以算是所谓的「AI 原生」笔记软件，另一类则是「AI+」笔记软件

其中，Get笔记和即我笔记，以及这两年在即刻、小红书上各种独立开发者各种宣传的层出不穷的新软件大都是在AI语音转文字出现之后而诞生的。他们在从初始阶段就兼顾到了语音转文字的开发，但因为我使用的不多，也建议大家去找其他的评测。

而后面提到的这几款Reflect、Tana、Workflow则是基于已有的笔记软件的基础上，把语音转文字融入他们的工作流。其中，Tana毫无疑问是其中做得最好的一款。AI 已经成为其完整工作流中的一环。它既支持会议的转录，也支持日常的手机端以及电脑端的语音输入。此外，Tana还能在输入之后用AI对语音转文字的内容进行进一步修改，自定义化非常强。

但由于这几款都需要比较昂贵的订阅费，在性价比上，如果只是把它作为语音转文字软件而言，相对会比较低。不过，如果能把它们与自己的工作流结合起来，或者作为自己的知识库所在，那是可以考虑的选择。

语音转录输入法

桌面端的语音转文字输入法也有不少选择，最主流的包括 Superwhisper、Wispr Flow等，甚至 Voicenotes 近期也推出了 Mac 端的输入法软件，只需按住快捷键，就能直接把语音转文字输入到当前的文本框内。

由于我日常输入不依赖于 Mac，对这方面没有很深的研究，可以参考Edison的这篇文章来了解更多的细节 https://linux.do/t/topic/833194。

语音输入是 AI 时代的唯一正解吗？

语音转文字软件确实加快了我单一文稿撰写的速度，例如这篇文章有 50% 的部分是通过语音输入完成的初稿。但回头看来，寻找具有仪式感的环境进行语音输入这一行为反而对我创作构成了新束缚。

以前我能在等地铁、午休时花几分钟，用手机或iPad快速写出文章一部分。然而习惯于用语音写初稿之后，我的零散输入时间反而变少了。

未来创作中我可能需要区分不同类型文字，采取不同写作方式。对偏向故事型、记录型的内容，使用语音可能更方便；对偏向书面信息的写作，找个安静地方写可能更好。更或者，在大部分情况下，我都会更加倾向于用打字的方式来进行写作。因为无论是在摘录闪念，亦或是在长篇梳理自己想法的时候，这种字斟句酌的输入方式都更有利于我理清自己的思路。并且，它能更加有一种创作的真实感以及仪式感。毕竟，有时候仪式感本身也是创造力的来源之一。

而对于每个创作者以及记录者而言，根据自己所处环境、惯用设备而选择最适合自己的创作方式，是每个创作者都需要面临的课题

2025年8月1日
1 条评论

精疲力尽的一个月；明日方舟新主线；Voicenotes Pages

历经半年，终于拼好了乐高哈利波特城堡。途中经历了丢件、丢贴纸、申请补寄被拒、重新申请、等待从丹麦发货这一系列波折，终于还是一鼓作气拼完了。然而这时候才发现家里没有地方可以放它，于是只能继续征用餐桌了⋯⋯

距离上一次更新已经快一个月了。这一个月里，工作上忙着转岗、交接之前的事，同时还忙于安排德国大领导的团建。生活方面更别提了，正在装修的新房子，光是挑选各种装修公司就耗费了我大量精力。更别提在双方之间沟通协调、消除误解、达成共识。完全没有心思也没有精力去做其他事。

也因此，这个月内基本上没有怎么进行阅读，最多也就是刷刷一些社交媒体之类的。之后有空会再更新一篇关于清明节去日本追樱花的游记。

明日方舟新主线

从日本回来后，终于抽出时间把明日方舟最新的主线剧情《离解复合》过了一遍。这次的主线和前面这一两年的主线有些类似，暴露出了不少问题，阅读体感明显没有支线来的顺畅。游戏在叙事层面上出现了明显的割裂感，这种割裂感主要体现在主线与支线故事之间的风格反差上。

方舟的 sidestory 和故事集一直保持着一种接地气的现实主义风格，讲述具体的地缘政治冲突和小人物的命运。这些故事往往能引起玩家的共鸣，因为它们描绘的世界虽然偏向架空，但总体上还是能感觉到身边会发生的故事，依然能让人感受到真实的人性。

而主线剧情却在科幻元素的运用上越走越远。从伦蒂尼姆章节开始，虽然战争场景的描写还算到位，但到了「离解复合」，科幻感已经完全喧宾夺主了。种种强行植入的设定让人感觉像是在用“机械降神”的方式解决剧情难题，为概念而概念的倾向很明显。

人物塑造方面的问题更值得讨论。凯尔希的死亡场景确实颇具感染力，特别是配上《遗尘漫步》的BGM时确实让人动容。但普瑞赛思的角色塑造就显得相当粗糙了，给人一种“为了有反派而反派”的感觉，缺乏立体感和成长性。至于凯尔希的性格转变，节奏也显得过于仓促，整体的剧情也像是强行往王道的方向靠，情感渲染和道理阐述都缺乏足够的铺垫与过渡。

这种叙事上的断裂感，某种程度上反映出游戏在平衡“硬核科幻”与“现实主义”两种风格时遇到的困境。原本那种克制而细腻的叙事风格，在追求更宏大的科幻主题时反而丢失了。

希望这个章节的问题只是为了铺垫之后的故事而出现。毕竟单从剧情的角度上来说，方舟的剧情叙事风格是我在各种手游里最喜欢的了（叠个甲，FGO、1999、米哈游的几款以及市面上大部分有名二游都玩过），还是期待之后方舟的剧情能再续之前哥伦比亚、叙拉古、巴别塔系列的辉煌吧

Voicenotes Pages

Voicenotes 最近又更新了一个 pages 功能，其实之前这段时间我基本上已经启用了 Voicenotes，都在使用闪念贝壳和 Dinox，毕竟之前被 Voicenotes 的「明镜点点」给搞怕了😂。

不过随着最近这次更新，发现 Voicenotes 的 UI 也有了不少变化。之前它的 UI 确实还比较简陋。但几次更新下来，完成了从简陋到极简的转变。

关于Voicenotes的Pages功能，我觉得它确实能很好地作为个人博客的补充形式。这让我想到了椒盐豆豉博客的内容组织方式：将内容分成了两个维度：一个是需要沉淀的长文博客，通常月更或者双周更；另一个则是类似日记的碎碎念区域；还包括Telegram Channel的日常收藏与灵感分享。

这种内容分流的方式是个挺好的参考。如果把所有零散的想法都塞进博客，内容会显得杂乱无章。Pages功能恰好提供了一个轻量级的平台，可以承载这些零散的思考。

不过这里也要提到立青分享的一个观点：卡片化内容并不适合作为最终输出形式。这种碎片化的记录可能会削弱创作完整内容的动力，也不利于形成系统的思考。但如果我们转换思路，把这些语音记录当作收集思路的工具——用来捕捉当下的想法和感悟，之后再整理成完整的文章——这倒是一个不错的方法。

这个过程有点像是在海滩上捡贝壳再串成项链——语音是一个相对随意、零散的媒介，特别是在没有预设框架的情况下。而文字创作则需要更完整的逻辑链条。如何把这些零散的“贝壳”串联成一串完整的“珠链”，正是从卡片笔记到成文的过程。

目前我打算先试用这套系统一段时间，也考虑在个人网站上添加Voicenotes Pages的链接，专门放那些不需要写成长文的日常 capture，或者作为之后长文的素材。如果Pages未来能支持图文功能，可能会更贴合我的使用需求。

2025年4月18日

近期生产力玩具们使用状态更新 (2025 April)

近期玩具一栏

重新开始使用 Heptabase

近期我重新开始使用Heptabase，正如Alan所指出的，当进行专题研究时，白板确实是最为合适的工具。在使用Tana时，虽然在记录单独笔记或进行信息输入时，通过标签管理可以实现流畅的工作流程，但当需要从中观层面梳理和理解事物时，便显得有些力不从心。在这种情况下，白板无疑是最佳选择。

终于开始搭建个人影音库了

这两天，我终于开始着手一个搁置已久的项目：在笔记软件里搭建个人的影音数据库，或者说是个人的数据资产和娱乐hub。这个想法虽然由来已久，但一直处在纠结和犹豫中。

回想起来，在我还使用Notion的那段时间，就经常看到社区里有人用它来搭建个人数据库。比如我很喜欢的博主椒盐豆豉，她就在Notion上维护着一个影音数据库。当时看到这些精美的数据库时，我心里却冒出一个疑问：既然已经有豆瓣这样完善的在线娱乐服务平台，为什么还要费时费力地重新搭建一套呢？

这个困扰一直延续到最近。当我发现了新兴的影音评论网站NeoDB时，最初的想法也是准备在这个平台上构建自己的数据库。但后来的选择却出人意料 – 我还是决定回到笔记软件来实现这个构想。

促使我做出这个决定的关键因素是定制性需求和美观性。在任何第三方网站上，你都只能在预设的几个字段范围内活动 – 写写短评，标记一下”想看”或其他状态，而难以进行更深度的个性化定制。相比之下，在自己的笔记软件里，可以做的事情要丰富得多：可以记录更深入的观点，设定内容的领域分类，最重要的是能够与其他笔记建立有机的联系。

在视觉呈现上，笔记软件提供的看板视图也明显优于大多数网站采用的上下滚动式展示方式，能够呈现出更优雅的内容组织效果。

基于这些考虑，我最终选择了在 Tana 中搭建这个数据库。这样不仅能够与我日常的笔记流程完美融合，未来还计划将其整合到个人博客中，形成一个更完整的个人数据管理系统。

开始使用 Youmind

最近我还开始重新体验玉伯的新产品 Youmind，逐渐理解了它的独特定位。它并非传统的知识管理工具，而是一个面向创作的项目管理平台。这种定位让我想到了长期以来对工具的一些思考。

在此之前，我曾尝试用 Minttr 来积累写作素材。它的瀑布流设计虽然赏心悦目，但实际编辑体验却并不理想。不过在那里建立的写作素材库倒是出乎意料地实用，是目前让我比较满意的功能之一。

Youmind 的项目导向型管理方式很有特色。与我现有的写作素材库相比，它的优势在于可以容纳更丰富的内容形式，不局限于文字材料。这让我看到了新的应用场景：可以把听到的播客片段、看到的精彩视频都收集进来，这是传统写作素材库难以实现的功能。

这两天和玉伯聊的时候了解到，他们近期会有一波比较大的更新，重点是在于编辑体验上。他们可能会考虑采取类似于Cursor的形式，来帮助用户更好地进行创作，这就与他们现在的这个仅仅着重于信息收集的模式有了一定的区别。另外，可能还有包括对于board看板的一些新的更新。

信息管理-知识管理-创作管理

这个话题让我联想到知识管理、信息管理和创作管理这三个概念的区别。知识管理服务于个人长期的知识积累，收录的都是经过理解和消化、确信未来有用的内容。信息管理则更符合现代人的收藏倾向，重点是确保需要时能快速检索到相关内容。

可以说，知识管理注重整理和内化，信息管理侧重检索能力，而创作管理则着眼于激发创意和内容整理。这三者之间虽有重叠，但将它们分开处理可能是更明智的选择。

在当前的工具体系中，我主要使用 Heptabase 进行项目研究，用 Tana、新枝和 Youmind 进行信息收集。真正的知识会沉淀在 Heptabase 中。另外，我使用 Readwise Reader 进行高亮标注，这些内容会通过 Readwise 同步到 Heptabase 和 Tana。最终的创作则在 Youmind 和思源中完成，思源笔记的本地化特性提供了很好的存档功能，写作体验也相当不错。

Links + Notes

近期发现了城堡阅读，这一个前利器社区的作者运营的独立杂志，会有不少链接来源于他的分享。此外这部分的标题也参考 Neo 的形式改成了 Links+Notes 这一更直观的表述。

供给匮乏年代

做产品要多看刚需

供给丰饶年代

特别是有了 AI 作为生产力之后

做产品要看柔需 ——玉伯

DeepSeek 的文章大部分是一眼能看出来的，OpenAI 的也能比较容易分辨出来，相较之下 Claude 在这方面还是更拟人一些。

当身边的人都表达了对哪吒的喜爱的时候，就很难找到机会表达出自己的看法。近期热度降下来了，终于能看到一些反面的声音。这篇虽然是完全从女性主义的角度分析，还是 cover 了大部分令我感觉不适的点的。

2024中文播客数据

平均年龄 31 岁，收入一万六，本科学历占比 91%，人均每周收听 4.8 小时 74.9% 有为播客付费的意愿，63% 过去一年曾经付费。-

-中文播客听众使用的内容平台前三是：b 站、小红书、公众号

-收听场景前三是：通勤、家务、运动。

-持续收听播客的最大理由是开拓视野，打破信息差；而放弃挺播客的最大理由则是对主播内容逐渐失去兴趣。

-创作者方面，做播客的前三个理由是：个人兴趣、分享知识和有价值的内容、内心深处强烈的表达欲。

-另外很多人相比苹果播客的简洁，更喜欢小宇宙开放的评论区，这不禁让让我觉得在播客方面，小宇宙就是网易云音乐。

请叫我播客收听人群平均画像😂。好奇的是明年平均年龄是会增加还是维持不变。

2025年4月18日
1 条评论

在软件早期，交互和可拓展性哪个更重要？

这几天没忍住，还是把闪念贝壳的终身会员给买了。

虽然它的语音转文字质量确实跟 AudioPen 和 Dinox 都有差距，毕竟它们俩用的是Whisper，而闪念贝壳国内版用的应该不是。但是从设计逻辑、美观程度和交互应用性上，感觉它还是挺有优势的。

由此我想到之前一直在考虑的一个问题：在软件的初期阶段，是更应该注重交互UI的美观程度，还是应该在保证基础的交互功能的前提下，往极高的可扩展性方向发展。

以闪念贝壳和Dinox为例，前者无疑在交互UI的设计上达到了顶尖水平，甚至优于许多苹果原生应用。而 Dinox 则更像是一个未经修饰的毛坯房，虽然其背后的构思和未来的产品愿景宏大，且不乏独到的创意，但在UI设计和交互上却有明显不足。

这就引出了一个问题：我们是否应该期待这种交互上的不足在未来得到改善？毕竟，长期而言，交互和UI设计对用户体验有着深远的影响。使用软件时的感受和心情，往往决定了我们使用它的意愿。

闪念贝壳专注于语音转文字这一场景，并在此基础上深入挖掘，这是它的核心价值所在。而对于这个问题，并没有一个定论，更多的是取决于用户对于交互和UI设计的容忍度和重视程度。对于一些更为“极客”的用户来说，只要功能足够强大，其他的不足也就不那么重要了。

目前现在就属于几种不同的软件混用的一个状态吧。

仔细想来，我发现自己在软件选择上，总是倾向于那些自定义选项较少，但外观设计却颇高的产品。初接触一个新产品时，我往往会偏爱那些具有丰富自定义功能的产品，因为在学习过程中，我能够感受到一种获得感。这种获得感，在某种程度上，正是促使我投入更多时间研究产品的动力。

这或许也是某些产品增加用户粘性的一种策略。然而，随着使用时间的增长，我逐渐意识到，产品本身的实用设计才是关键。就像苹果一样，虽然Windows或Android系统提供了更多的自定义选项，如果你愿意折腾，也能打造出功能强大且外观美观的系统。

但如果我们只是为了满足最基本的需求，那么产品经理引导我们使用软件的方式，可能才是最符合我们基础需求的。简洁的设计，往往能更好地服务于实际需求。

Captures

AI 的分类模式

The 3 AI Use Cases， Gods, Interns, and Cogs：

神：超智能人工实体，自主执行任务；主要是以炒作和焦虑的方式影响我们；
实习生：受到监督的副驾驶，与专家合作，对错误容忍度高，专注于定义明确的基础工作（如整理文档、填充细节、提供参考等）。是目前交付最多价值的人工智能类型，能让小团队交付远超以往。
齿轮：极好地执行单一任务，通常作为管道和接口的一部分。对错误容忍度低，所以多半是微调或者小模型，所以成本低。比如云平台、审核平台等； ——The 3 AI Use Cases， Gods, Interns, and Cogs——少楠产品沉思录

稀缺循环

丰饶时代造成我们注意力短缺的原因：

机会：即可能性，确保自己不错过「有价值的东西」，但在丰饶时代会导致过度囤积；
不可预测奖励：为了无法预测的奖励不断重复，如刷视频，得到点赞等；
快速重复：容易做到的行为，带来即时满足，而导致忽略长期有价值的活动； ——少楠产品沉思录

别让代理指标异化了思维

运用接近真实世界的代理指标能让一些模糊的感受变得可以衡量，比如亚马逊用退货率来量化用户体验。但代理的问题是，过度量化可能会与实际脱节，让人忘了设置这种代理的目的，为了优化数字而优化。这也是为什么做一些战略项目的时候，需要行研和用研、定量和定性相结合，通过人和人的交流来避免过度依赖代理 ——少楠产品沉思录

As news becomes entertainment, markets become the news

Robinhood 创始人 Vlad Tenev 很有意思的发言。之前我对于博彩行业的人士基本只局限于体育行业，通过赔率来关注转会市场或者一些重要比赛的预测，这基于一种认识，即博彩公司往往能在这些领域掌握一些普通人不了解的消息。

博彩网站他们的这种基于市场的行为，有时候并不只是因为他们有更多的信息来源，很多时候更来源于一种去中心化的市场交易，当去中心化的信息能得到快速汇总的时候，进而能更准确地体现事情的真相。

尤其是在美国大选这种场景之下，来源于各个不同地区的投票所产生的去中心化的行为，对于市场的预期也会产生非常直接的影响。甚至于长久以来博彩网站所能影响的面，或者说它能反映的领域也会越来越多。

相比于越来越娱乐化的各种新闻媒体，他们愈发需要通过故事才能吸引人们来进行阅读，而在这种短平快的移动互联网的大背景下，往往反映速度最快的市场更能体现人们对于“纯粹”的新闻的追求。

2024年12月5日

博客从 NotionNext迁移到 Thorn

在上一篇博客个人博客问卷里我也提到过，虽然我的博客搭建在 notion 上，但是我也一直考虑搬迁的问题。之前主要考虑的是通过 cursor 辅助来编写一个静态博客。然而，最近也看到了有博客里写到了他的个人博客遭到了攻击，花了很大力气才恢复了博客的正常运转。加上确实没那么多时间来折腾自己写代码+部署，就一直没开始静态博客的尝试。

先聊一下我对 NotionNext 不满意的地方吧。首先就是界面有点廉价感。一般来说要么就是极简风也挺好看的，但是 NotionNext 的大部分主题在白底上总是会有一些奇怪的动效，看起来不是很高级简约。而且，自从 4.0 的某一次更新之后，自定义字体就突然失效了，对于我这个颜值控来说，能够自定义字体还是挺重要的。

还有个问题就是 RSS 的支持。静态网页每次更新文章都要重新部署一下才能更新 RSS，这点我是很能理解的。但是 RSS 的时间信息和格式的解析问题还是挺多的，并且挺要命。无论是具体的格式解析，还是博客名解析都有问题。

这么多问题累积下来之后，其实我一直有想换一个博客部署方式的想法（其实之前也想过，详情可见博客和笔记软件一样，就是个不停折腾的过程。但确实一直没有找到特别合适的替代品。正好上周在少数派里随意闲逛时，我看到了一篇文章，讲的是 Thorn 在经历了三年后终于要正式发布了，顿时眼前一亮。毕竟我上一次使用它已经接近一年前了。当时感觉这个软件还有很多bug，文章的编辑体验也不是很好，而且站点管理显得比较繁复。

【送码】三年之期，Thorn 正式版现已推出。 – 少数派

这次重新使用了一下，发现它真的进步了很多。无论是经过重新设计的博客站点，还是后台的编辑系统，都比之前有了长足的改进。而且它的站点托管方式也非常友好。在简单尝试了几天之后，我立刻决定，这就是我一直想要的博客拓展托管平台。于是我马上购买了一个月的试用，现在基本上确定后面要继续使用它了。可能不久后就会再买一个一年的套餐，看看它是否可以支持长期使用。

重新启用思源笔记

就像我之前说过的，博客和笔记软件对我来说都像是玩具。它们不仅能帮我记录想法，更能带来乐趣，就像游戏、音乐等娱乐活动一样。

这两天我重新开始使用思源。之前因为同步不稳定，我差点放弃了它。但上周末上课时，我重新发现了思源的优势——特别是它的悬浮窗口和虚拟引用功能，这些都是 Heptabase 和 Tana 目前所不具备的。

今天我原本只是想打开 Obsidian 来存储博客文章。但用过之后，还是觉得它的界面不够美观，而且同步功能（尤其是移动端）很不方便。当我重新尝试思源后，立即被它的功能吸引住了。

最终，我把所有博客文章都导入了思源。不仅如此，我还用思源的数据库功能复制了一份 Notion 里的数据库结构。这样一来，我的写作流程就更清晰了：先在 Ulysses 完成草稿，然后在 Notion 和思源各存一份，最后发布到博客网站上。

2024年11月19日
1 条评论

Follow & Arc

Follow 是 RSS 的复兴还是自嗨？

最近各种群里都在密集地分享着 Follow 的邀请码。恍惚间似乎回到了一年多前 Arc 刚开始流行时候的场景。但随之而来的问题就是，Follow 最终会发展到什么样的地步？

且不说后文会提到的 Arc 虽然在数码圈非常流行，但距离真正的”破圈”还是有一定的距离。相比之下，Follow 作为一个更加小众的产品品类，具体有多大的发展空间？是否他只是填补人们臆想的一种信息摄入场景？

张一鸣在 10 年前 Google Reader 关闭前曾经对 RSS 形式的软件表达了不看好。他的观点无疑是符合他的产品观的。他所中意的产品一直是为了满足最多人的需求，因此必然需要降低人们的使用门槛，实现傻瓜式的交互。而这种产品观和 RSS 软件这种，需要用户主观上对内容进行挑选的模式有着截然不同的产品走向。

听了一期关于 RSS 的播客讨论，我之前一直以为 RSS 是很多作者喜欢的方式。因为理论上，一旦作者被算法的大流淹没，不仅丧失了创作方向的自主权，还需要迎合越来越多人的喜好。

然而，听这些创作者的想法后，我发现 RSS 可能并不是一个理想的方式。对作者来说，RSS 并不能带来激励。他们只能看到今天又多了一个通过 RSS 订阅的人，却无法知道这些订阅者的身份，无法进行深入分析。而激励始终是一个问题。

现在，Follow 通过发币的形式进行尝试，可以看看是否能让 RSS 走出这个困境。

Arc 停止运营，意料之中？

这两天在很多群里看到了关于 Arc 要逐步停止维护升级，团队要把重心移到一款新的、以 AI 为主导的横向标签排布浏览器软件上去。这算是一个意外却又在意料之中的消息吧。

其实从 Arc 这个产品推出之初，就可以看出 The Browser Company 是一家非常注重营销的公司。这暗示着它的经营成本一定相当高：一方面它有不少员工，另一方面在营销上投入了大量成本。然而，在获得一定融资后，Arc 浏览器并没能找到一个合适的盈利方式。

正如他们在文章或采访中所说，Arc 浏览器的受众其实比较窄，并没能如他们所期待的那样成为市面上的主流浏览器。它虽然在某些圈子里小有名气，但主要还是在生产力爱好者或注重美观的早期用户中传播较多。更多人觉得它还是有些小众，因此用户规模相对有限。

Arc 的盈利困境也值得深入探讨。传统浏览器的盈利模式主要依赖于搜索引擎默认设置带来的收入。然而，这种模式需要庞大的用户基础作为支撑。对于用户规模有限的 Arc 来说，这条路径显然不太现实。另一方面，提供高级功能的增值服务模式在浏览器领域也面临挑战，因为大多数用户对基本浏览功能的需求已经得到满足。这种困境促使 The Browser Company 重新思考其产品定位和商业模式。

这有点像他们最初将软件移植到手机端时的情况。起初，他们只是简单地将浏览器伴侣搬到了手机上，但很快发现这种做法并没有凸显出自己产品的特色。所以他们后来重新开发了 Arc Search 这个软件。到目前为止，Arc Search 仍是我非常喜欢的一款软件。它在使用便捷性上，各方面都强于现在的默认浏览器。我甚至把它放在了手机屏幕底部的四个快捷栏里。

不管怎么说，对于 Arc 可能会逐渐停止更新维护，我还是感到有些惋惜。毕竟它在使用逻辑和美观上确实比之前的 Edge 等浏览器有很大提升。而且纵向标签的排布也很符合我的操作习惯。

现在只能期待他们团队后续推出的 AI 相关软件的使用效果如何了。不过可以预见的是，既然他们之前没有找到合适的盈利方式，那么之后的 AI 浏览器软件很可能会采取收费模式。在这种情况下，是否有必要使用它就成了另一个需要考虑的问题了。具体情况还是要等新产品发布后再做观察。

2024年11月1日