边听明日方舟歌单边摸鱼;AI 对人和社会互动的影响

终于从团建的忙碌中解脱,能静心做些喜欢的事了。之前提到要将 Voicenotes 整合进博客工作流,实践后体验确实不错。特别是发现 Voicenotes 能与 Readwise 互通,其价值又上了一个台阶。目前来看,Voicenotes 除了偶尔理解有偏差,整体表现相当不错。

这周另一有趣尝试是接触了 Vibe Coding。说来也巧,正好赶上 Lenny’s Newsletter 的福利活动,订阅即可获得 Cursor、Replit 等主流 Vibe Coding 工具一年使用权。 作为编程新手,我借此机会实际体验了 Cursor。目前只用它写了个简单脚本,确实感到很便捷。不过用它开发完整应用程序还是有些犹豫。可能需要先打好编程基础,才能更好利用 Cursor。

我之前也订阅了 Genspark 这类 agent 工具。对编程新手来说,简单试用后,感觉 agent 工具可能更友好。不过现阶段还是先专注学习和实践,等积累更多经验后再总结体会,说不定那时才会发现 agent 的局限。

此外,最近一直在调整工作流,发现必须调整当前的输入方式。现在每想记个笔记,都得粘贴到好几个地方(如新枝、Tana、Dinox、Voicenotes、Heptabase),因为可能在多处汇总或搜索。这种状态不可持续,甚至不如当初统一在 Drafts 输入,再一键分发,现在先做了几个 Drafts action,后面看如何整合。

此外,这两天也在试用 Calflow。之前一直想要找一些时间管理的工具,但是像 3×3 之类的工具也一直不大好上手,而且颜值也不怎么样。这两天在小红书上从一个 notion 博主那里顺藤摸瓜,找到了 Calflow 这个软件,感觉挺有前景,考虑用一段时间试试。


音乐在工作和学习中的不同

前两天工作时,照常打开网易云,播放明日方舟歌单,不知不觉就过了近两小时。一边工作一边多次被感动。Rap 有 Yanking 和桥夹克里夫的 boss 曲(mai 竟然是作曲+编曲!),《总辖之愿》太好听了(才知道最后四个关卡名连起来是“恩怨纠葛,散于星辰之间;留下之人,推开未来之门”)。

听着听着,想起一个有趣的问题:发现听音乐工作,效率会极大提升。哪怕中间会因音乐的旋律、情感、歌词而下意识看评论或停下工作专心听歌,但整体工作效率反而提升了,很顺畅地就进入了心流状态。

而这和我平时认真学习时的感觉正好相反。认真学习时听音乐,有时反而让我分心,无法集中注意力。于是我问了问 Gemini Pro 2.5,想看看这个问题是否有较科学的解释,结果挺有意思。

AI 表示,工作场景下,音乐之所以有助益,是因为工作本身重复性高,不需太多密集思考,大多是自动化操作,占用认知资源少。这样一来,注意力尚有余裕,音乐反而能屏蔽环境干扰,让我们更容易把注意力保持在工作上。同时,由于多数工作任务我们已熟练,不需深度分析,内在认知负荷较低;音乐带来的积极情绪,反而能促进认知资源的有效利用。

学习则不同,它本质上需要高度集中注意力。音乐会分散注意力,争夺认知资源,带来较高的认知负荷。

近期对 AI 对人和社会影响的摘抄和思考

近期阅读中,有不少关于 AI 对人和社会影响的摘抄与思考,这里分享些简单感想,若有时间再详细展开。

AI 会提高还是降低人的思维能力?

最近在即刻上看到,有人认为 AI 对人类思维方式构成一大威胁。它会给人一种思考幻觉。AI 出现前,普通人与各领域精英的最大差异,在于能否结构化地思考和输出。而目前的 AI,尤其是最新的,结构化能力较强。它们会拆解问题、任务并逐步完成,展示结构化过程,让用户误以为自己也能结构化思考。

这对经验或知识不足的人来说,其实比较危险,因为它取代了他们锻炼结构化思维的过程。他们在学习和提升中会失去一些附带收益,这些收益有时是纯知识,有时是锻炼出的思考能力。从某种意义上讲,这会让人的成长缺乏所谓的 context,而 context 在完成工作和个人学习成长中都非常重要。因为你有时假装获得了能力,但 AI 并不知道你实际经历过什么。同时,这种 context 也是我们未来应对不同事物时的潜在经验与知识,这些无法通过 AI 获得。

这让我想起 Neo 在其 newsletter 中介绍的一篇文章。该文根据微软和卡内基梅隆大学的调查,分析了 AI 工具如何从不同维度重塑人类工作方式。在 AI 时代,人虽将部分功能让渡给 AI,但人的作用反而更核心,集中于验证信息、整合输出、监督任务。人的工作变得‘高抽象’和‘高风险’,需要更强的判断力,并承担更多决策风险。

AI 真的带来了平权吗?

讨论新技术影响时,会发现 AI 与科幻小说、游戏中描绘的某些技术(常导致赛博朋克世界)既相似又不同。在那些世界观里,新技术常由政府秘密研发,某些人率先秘密使用,从而获得对普通人的巨大优势。而 AI 的情况是,AI 平权是 AI 时代的默认特征,还是只是历史发展过程中的一个短暂“黄金时期”?当前 AI 发展初期,是自下而上发展,所有人平等使用同等智能的 AI。但当 AI 发展到一定程度,若普通人可用的 AI 能力触及企业成本上限,且富人能用金钱购买到显著更优的 AI 时,社会阶层问题恐将重现。

AI 时代,语音的影响被忽视了

另一项观察是,我发现许多 AI 开始强调语音交互。这种交互一方面极大地方便了用户操控电脑、手机及 AI,另一方面,它会重塑每个人的工作习惯,乃至人际交互模式与社交关系。

例如,以往在工作空间,每个人的工作都相当私密。而一旦工作转为通过语音沟通,人与人的工作空间就必然交织。这种交织目前看来无所谓好坏,但必然影响人在工作中如何把握与他人的距离。也许将来大家会更注重隐私,甚至可能反而更少关注隐私。这些都值得继续研究。

AI时代,我们还需要个人知识管理吗?

最近看到了一篇文章 人工智能与没有斑点的长颈鹿,作者提到,人工智能的训练原理导致,所有答案都趋向主流,继而抹杀各种非主流的观点与个性。

而在日常生活中,随着 Deepseek 的迅猛发展和广泛应用,长辈们开始将其视为AI的代名词,并逐渐将这些工具融入日常生活中。

对于那些此前较少接触人工智能技术的人群而言,他们自然倾向于直接向AI提出各种问题,更令人担忧的是,他们往往将AI的回答视为绝对真理。这一现象令我想起之前关于知识管理的讨论,有观点认为AI代表了知识管理的终极形态,即个人知识收集是没必要的,因为AI可以提供答案。

遇到问题问AI就行了?

虽然我坚信应该将AI有效整合进我们的知识框架中,每个人都应培养使用这些工具的能力——但这种整合应该是对个人知识管理和独立思考的补充,而非替代。

“遇到问题为何不直接询问AI?”我们越来越常听到这一表述,而这一普遍看法存在显著的逻辑缺陷。

许多问题并不存在单一、确定的答案,然而AI系统通常提供看似权威的响应。这并非表示AI始终产生相同的答案,而是当前大型语言模型的架构——主要基于主流材料训练——自然会生成反映主流观点的输出。因此,非主流观点在AI回答中因训练数据中的权重较低而被削弱。

文明的真正丰富性往往体现在这些非主流的、长尾的内容领域。当我们集体放弃独立思考,忽视多样化的视角、观点和事实诠释时,文明发展和个人成长都将受到深远影响。

知识获取路径的转变

另一个引人深思的视角认为,AI对新生代最具革命性的影响在于从根本上改变了知识获取方式。历史上,人们主动搜寻知识——回溯更远,互联网前的世代甚至在开始搜索前就需要投入专门的学习过程。今天的技术演进已逐步简化了信息获取流程,实现了直接检索答案而完全绕过搜索阶段。

这一转变本身好坏并无定论,但出于每个人锻炼思维的角度来看我们必须主动收获、处理并内化知识,探索多元视角,最终形成自己的观点。

在我个人的知识管理实践中,我优先将那些能激发思考的内容归档至知识仓库。AI主要作为组织和搜索助手,而非权威答案来源——这一关键区分保留了我对我的知识筛选的自主性,并能充分利用AI的优势,来增加效率。

再谈语音转文字软件的发展方向

对于 AI 来说,语音交互是一个不可或缺的核心功能。

这几天在群里看到很多人分享他们使用语音与AI交互的场景。例如,在带孩子的时候,可以直接抬起手腕对着手表说话,或者随便在手机上点一下。这种情况下的交互非常自然,不会干扰其他行为。

还有一种场景是骑车通勤时,在等红灯的时候,随手抬起手腕与AI互动,这是一种输入阻力很小且非常自然的行为。如果此时需要在手机上通过键盘输入,阻力就会很大,也不符合自然需求。

语音转文字软件进一步的发展方向是以语音作为核心,在此基础上实现更多地互动,以达成个人 Agent地效果。当年 Siri 想走的就是这条路线,但可惜Siri的智能化程度太低,语音转文字的效率也一般。

Dinox

最近发现了一个新的语音转文字的软件 Dinox,而且初步使用下来,它在多种程度上都可以说是目前为止语音转文字和笔记功能结合得最好的。它在保证了一定的语音转文字识别准确度的基础上,在后续的功能开发的多样性上是目前其他软件所无法比拟的。

某种意义上可以说它是一个功能加强版的 Flomo。得到的 Get 笔记走的也是这条路线,但是对 AI 的使用更为克制,只用在内容输入和搜索方面,而 Dinox 则聚焦于后续的处理

首先,在界面方面,Dinox 的界面和 Flomo 比较类似,都是由卡片加标签组成。但是,它的输入方式除了手动输入之外,最显著的就是通过语音转文字输入。而且在输入之后,会有 AI 进行简单的整理。如果还有需要的话,还可以自己手动选择一些更详细的 prompt 进行整理。

在后续的处理上,可以说集合了很多软件的优点,也有自己独特的 killing feature。它可以通过语音搜索或者进行聊天,同时,还可以通过一些定制化的 prompt,将自己的文字转换为待办,或转化为表格形式,并且能够手动设定表头。此外,还有不同的卡片盒,可以说在卡片笔记的方面,无论是前期的录入还是后期的整理,都有非常好的设计。而且对后期的搜索与关联也做得非常完善。像前文提到的语音搜索,以及它自己还提供了相关卡片功能,可以说是在这个领域里目前为止做得最完备的之一。

当然,它现在上线一个多月,还有不少的 bug,但感觉未来还是可期。还忘了说一点,它还支持导出到 Notion 和 Obsidian,感觉可以持续使用一阵子。

Me.Bot

前几天和MeBot的产品经理聊了聊,探讨了一下对于今后这类产品发展的展望。其实,这也是我第一次比较深入地思考与接触类似于AI Companion,或者说更多类似于这种Agent 的类型的AI产品。

在常见的语音转文字功能之外,它还加入了很多输入和输出方面的功能。输入可能既包括语音转文字、录音,对链接的爬取、对图片的识别等等;输出方面也支持生成待办事项等功能。总体而言,它希望能够成为用户的统一输入输出中心,作为用户的辅助而存在。可以说,这是一个更加完备、UI也更好看的Dot。但未来这个产品的发展前景到底如何,仍然很难说。

在不远的将来,更多的公司会试图在手机端结合这类各种功能,而不需要以软件的形式存在。当然,也很难说这些手机端的模型能做到什么样的水平,有有种可能软件的调教才是最好的选择。

当我们讨论速记产品时,到底什么是速记?

平时我们讨论笔记软件的应用性时,常常关注它是否打开速度快,能否便捷地与其他软件同步等功能。或者,我们可能会研究一个软件是否有助于思考。今天我想讨论一种特殊种类的笔记软件,即记录型笔记软件。

本文部分灵感来源于瑾呈 goidea 的一篇文章,他的系统性笔记流程与我相似。他将笔记分为两类:信息采集,以及专题思考。前者他使用Tana,后者使用Heptabase。大多数人日常使用笔记软件时,主要涉及三个个场景:输入,整理和输出。

今天我们聚焦于输入环节,探讨当我们谈论速记时到底在谈论什么。

速记包含了什么

通常我们要求速记能够精准快速地记录当时的所思所想,方便日后整理。但速记本身不仅仅是文字和图片。在我看来,数据本身的文字和图片只是一个表象。只有将这些记录与当时的情境结合,才是完整的记录。

记录必然有一定的场景或情形激发需求。可能是一段音乐,一个播客,一篇文章,甚至是跑步时脑海中闪过的念头。当你回顾这些记录时,将文字和图片与这些因素结合,才能重现当时的场景。这种回顾能帮助你更好地回忆思维过程,同时有助于信息解锁和关联。

用一个形象的比喻,当我们进行记录时,只记录了冰山浮在水面上的部分,而更多的信息潜藏在水面之下。

近期关注的软件 – Jotmo

在速记领域,最近比较关注的有两个软件,一个是语音输入的Dinox,一个是Jotmo。今天先讲一讲 Jotmo。

尽管在当前阶段,它相较于其他软件,尤其是Flomo,只是改变了输入方式,从传统的文档、卡片式记录变成对话框式输入,但从长远来看,它的愿景还是很有体系的。

Jotmo 希望成为一个能快速全面记录你当下所思所想和 context 的软件。很多时候,我们记录的文字和图片并不能完整反映当时的 context。举个例子,当我们想找以前拍的一张照片时,通常需要借助拍摄地址,通过地图寻找。这些记录场景,包括地址、心情等因素,和记录的文字一起,共同构成了我们的记录内容。

从长远规划来看,Jotmo 希望尽可能多地记录发生场景。在他们的roadmap上,短期内会增加语音转文字作为补充输入方式;长期则考虑接入播客、心率等健康数据,以及目前已支持的时间、地址、设备等多种因素,并尽量自动化采集。这在我看来非常有前景,不仅限于现在表现出的类似flomo 的前端。

如果它能长期发展良好,我看好它能成为快速记录场景下的新兴的有前途的产品。目前,它和新枝一样,都处于养成系状态。心知更多是剪藏摘抄类产品,而Jotmo 则可能成为替代flomo 的记录自己想法的新选择。

Short Form

“麦克纳马拉谬误”,即我们尝试去量化我们认为重要的事物,但最终却只关注了可以被量化的事物,从而偏离了真正的目标。

媒体内容的数字存档工作框架(密苏里大学):

  • Availability(可获得性),也即内容有没有被保存下来;
  • Identity(标识性),也即保存下来的内容是否有独一无二的标识;
  • Persistence(持久性),也即存储系统是否可靠;
  • Renderability(呈现性),也即能不能呈现出内容在媒体上最初发表时的样子;
  • Understandability(可理解性),也即受众能不能按照原意来理解存档下来的内容;
  • Authenticity(真切性),也即信息是否真实未经篡改。

AI 让折腾笔记软件走到了尽头吗?

距离上一次更新已经过了一个多月了。最近忙于工作中的一个项目,基本没有空摸鱼了(笑)。这回趁旅行途中正好有空,梳理一下过去这半年多来对笔记的思考的变化。

对 All-in-one 的祛魅

上个月在即刻上,有人提到今年似乎不再追求笔记工具的 all-in-one 和本地优先等功能,甚至双向链接也用得越来越少了,使用笔记的时候,更加关注内容而不是功能。细细想来,我自己也有类似的体会,近半年来,除了用 Heptabase 系统地读书听课,大部分时候使用笔记的场景都是简单的摘抄总结,不会主动地去在不同笔记间建立链接。

过去这些年,我一直在换笔记工具,从十年前的 Evernote 到Bear、Craft,再到21年的Obsidian、Logseq、Siyuan、Heptabase、Tana和Notion。之前影响我切换的原因主要是功能问题,比如支不支持双链、块级双链、大纲还是文档式,还有在线还是离线等等。每当发现某个软件有某些新功能,总是会下意识地迁移一遍数据,试图能用它来all-in-one地作为我唯一的笔记工具。诚然,某些功能确实是刚需,尤其是支持同步到不同电脑以及手机和iPad的支持,但是大部分功能其实更多的只是锦上添花罢了。

当然,颜值和UI也是很重要的因素。我开始用Bear就是因为觉得它长得好看,平时没事干就喜欢换主题,似乎每换一次主题就能让心情变得更好一些。后来放弃Craft的原因之一也是它能自己调节的余地很小。包括我之前也用了一段时间的Logseq和Siyuan。Logseq的电脑端可以调得很好看,手机端却不支持主题和插件,这让我有点纠结。又比如最近发现了几个好看的Obsidian主题,我就立马回到Obsidian的怀抱去用了一段时间。

但是总体而言,遵循着重器轻用的原则,现在我基本固定下来了使用笔记的几个模块。即语音输入(AudioPen),灵感/摘抄(Flomo),剪藏/阅读(新枝/Readwise),深入学习思考(Heptabase),工作(Tana),数据后台(Notion)。后文中我也会详细讲讲AI在这些模块中又发挥了什么样的作用。

AI 对我的笔记流程产生的改变

AI 的出现,让笔记的管理愈发分化成了信息管理和知识管理两部分。AI 大大简化了信息的获取、分类、总结、搜索。

语音输入

AI对笔记流程最显著的影响莫过于在信息获取环节增加了语音输入这一渠道。在过去,由于语音识别的不准确,语音输入其实是一个成本非常高的动作,我们需要逐字对识别的错误做修改,删改语气词与重复增加标点符号,分段等等。而随着Whisper之类模型的涌现,以及一些支持通过AI对语音笔记进行初步修改的产品的出现,使得语音输入成为了一个重要的输入来源。

我在的一些群里最近也集中讨论了语音笔记价值的问题(起源于许多语音笔记软件如AudioPen、VoiceNotes和SlaxNote纷纷出现)。一些人认为语音笔记的价值不大,因为某些内容如果没有用文字记录下来,就说明这些内容对你并没有特别大的价值。你把它说出来并存储起来,只是类似于“稍后读”,最终可能再也不会读。也有的人认为,当你决定进行语音输入时,其实已经在心中进行了一次筛选。用语言表达出来的过程,实际上也是一次思考和提炼。因此,这些内容依然是有价值的。(以上这段就来自于语音输入后AI改写,AI味还是稍有些浓,以后会继续试试修改一下prompt。目前感觉自带promote效果最好的还是AudioPen)

而对于语音输入亟需提升的地方,因为人们并不是每时每刻都能在家里有一个安静的地方进行语音输入,或者说有的人很多时候是带着 AirPods,这时候他的麦克风效果其实是很差的。因此,语音输入最重要的功能,其实是它在嘈杂环境下的识别能力。

总结与分类

我曾经发表过一个暴论,认为AI的总结是个伪命题。

一般认为,AI 总结有以下几个应用场景:消费内容之前的“预览”,消费中的提炼,以及消费以后的总结记录

这三者看起来是一个东西,但是其实不是。

目前最常见的产品,及用AI速读公众号文章可能是个伪命题。这个需求是被创造的,认为通过把文章转发给一个AI助手,能够让我们快速识别一篇文章是否值得读。 然而,对于大部分人而言,可能其实并没有这个需求。只看标题及文章开头两段,大部分情况下就能知道这篇文章到底是不是需要精读。需要精读的文章自然会存到”稍后读”助手之类的地方,然后仔细精读。 而对于那些看标题来说可能并不值得读的文章,还不如直接跳过,因为它可能本身里面也很少有干货,并不需要通过AI助手来总结里面相关的内容。 所以,这个需求更多的是一个被创造出来的需求,使用的时候也并没有什么比较大的意义。 另外一个思路是,能凭借标题和前两段内容分辨出一篇文章是否值得读的人,本身不是这类服务的受众。更进一步,“大部分人能凭借标题和前两段内容分辨出一篇文章是否值得读”本身是个伪命题

在使用了一段时间类似的产品之后,现在看来,这种说法有些片面。在某种程度上,AI的总结在事前分类方面起到了重要作用,让人能区分哪些内容值得阅读,哪些可以略过。这一点我依然认同。

举个具体的例子,

我可以算是一个播客爱好者了,在小宇宙上关注了几十个播客。然而每天听播客的时间总是有限的。就和稍后读软件里的文章数量一样, 我的小宇宙播放列表里的播客也越攒越多,最近突破了 200 大关。可想而知,每天不到一小时的通勤时间肯定没法听完这么多的播客。

去年黑五趁着打折,薅了两年的 Podwise 会员,但是过去几个月用的次数比较少。最近痛下决心准备好好清理一下播放列表。

Podwise 的 standard 会员等级每个月可以转录并总结 20 次播客,并且可以无限量地阅读其他用户已经转录完的播客。实际用下来,除了过于古早的播客(早于 2023 年上半年),或者过于小众,大部分的播客都已经被其他用户转录过了。我清理到2023年10月,大概 100 多个播客,才用完了一个月的 20 条的份额。

这类总结最主要的功能还是对长篇内容提取大纲,以辅助筛选。尽管文字、视频、音频的信息密度个油不同,但是面对一些长篇的内容时,还是会力有不逮,总结出来的内容非常空洞,甚至连辅助筛选的作用有时候都起不到。

检索

此外,AI在信息检索上也非常有用。最近,我发现Notion AI的Q&A功能大大改变了我的笔记流程。它让我可以将所有笔记,无论是摘抄、剪藏还是自己的蓝图,都导入Notion AI进行统一检索。这样,我可以更放心地使用最优秀的软件,而不必担心数据分散在各处的问题,后端处理完全交给Notion。

以上只是我这半年对笔记的一些思考与记录,有些杂乱,纯粹当做记录下来,以后有空再整合成文章吧

Short Form

玉伯对笔记的思考

前几天听玉伯的播客,提到了他和飞书的一位员工的聊天,内容颇有意思。他认为文档软件和笔记软件是完全不同的品类。笔记是为个人服务的,而文档则是为多人协作而设计。因此,文档软件更类似于即时通讯软件,甚至可以说文档是结构化的消息,而消息是碎片化的文档。

文档软件与笔记软件有很大区别。文档软件的发展前景在于融合更多协作🥱内容。例如,Notion近期收购了Cron这样一个日历软件,就是向协作方向迈出的一步。未来,它可能会推出更多即时通讯类产品,当前没推出可能与国外Notion和Slack、Discord等IM软件的良好融合有关。但最终,协作类软件必然会成为一个独特的品类。

从用 Podwise 处理播客列表谈对 AI 总结工具的看法

我可以算是一个播客爱好者了,在小宇宙上关注了几十个播客。然而每天听播客的时间总是有限的。就和稍后读软件里的文章数量一样, 我的小宇宙播放列表里的播客也越攒越多,最近突破了 200 大关。可想而知,每天不到一小时的通勤时间肯定没法听完这么多的播客。

去年黑五趁着打折,薅了两年的 Podwise 会员,但是过去几个月用的次数比较少。最近痛下决心准备好好清理一下播放列表。

Podwise 的 standard 会员等级每个月可以转录并总结 20 次播客,并且可以无限量地阅读其他用户已经转录完的播客。实际用下来,除了过于古早的播客(早于 2023 年上半年),或者过于小众,大部分的播客都已经被其他用户转录过了。我清理到2023年10月,大概 100 多个播客,才用完了一个月的 20 条的份额。

对podwise之类的AI总结的看法

用处:

  • 筛选
  • 寻找观点,回去听/找transcript

有两个有意思的东西:

一个是消费内容之前的“预览”,还有一个是消费以后的 takeaway

这两个看起来是一个东西,但是其实不是。

用AI速读公众号文章可能是个伪命题。这个需求是被创造的,认为通过把文章转发给一个AI助手,能够让我们快速识别一篇文章是否值得读。

然而,对于大部分人而言,可能其实并没有这个需求。只看标题及文章开头两段,大部分情况下就能知道这篇文章到底是不是需要精读。需要精读的文章自然会存到”稍后读”助手之类的地方,然后仔细精读。

而对于那些可能并不值得读的文章,还不如直接跳过,因为它可能本身里面也很少有干货,并不需要通过AI助手来总结里面相关的内容。

所以,这个需求更多的是一个被创造出来的需求,使用的时候也并没有什么比较大的意义。

另外一个思路是,能凭借标题和前两段内容分辨出一篇文章是否值得读的人,本身不是这类服务的受众。更进一步,“大部分人能凭借标题和前两段内容分辨出一篇文章是否值得读”本身是个伪命题

To tag or not to tag, it is a question

最近读到一篇来自 UNTAG 的有趣文章

标签必须死:一条被忽视的标签管理原则

作者在其中对笔记软件中的标签功能提出了质疑。他分享了自己使用标签的经历,

在我有些过于简化的划分中,标签可分为指示性标签和描述性标签,两类标签都是临时的,最终要么随着项目结束而移除,要么在熟悉某个领域后而不再有意义。

然而,他发现这种标签系统总是在不停地变化,实际上并没有起到它所应该有的作用。对我们的笔记管理并没有产生太大的帮助。

这篇文章可能有点极端,几乎完全否定了标签的作用。但这也让我想起了我自己在使用标签时的困扰——记笔记时我可能给笔记打上了很多标签,但是在记完笔记后,却几乎从来没有用上过他们。

标签的真正目的是什么?

那么,标签在笔记软件中的真正目的是什么呢?或者说,在过去这些年里,我们使用标签主要是为了它的哪些特质与功能?我认为主要有以下几个功能:

<aside> 💡 标签可以方便我们检索信息

</aside>

我们常常给一个笔记打上不同的标签,因为这个笔记并不只属于某一个特定的类别,而是涵盖了多个维度和不同类型的内容。我们希望在不同的场景下都能找到这张笔记,这样就大大增加了检索的便利性。比如,我有一个关于“苹果的设计理念”的笔记,我可能会给它打上“设计”、“原则”、“UI”、“消费品”等标签,这样无论我在哪个场景下,只要我想到这个笔记,我都能通过相关的标签找到它,无论笔记原文里是否含有这些相关的领域。

<aside> 💡 标签可以补充笔记的内容,给笔记提供上下文(context)

</aside>

比如,当我们写一条笔记时,可能只是描述了一个具体的现象或观点,但它所针对的具体话题或领域并没有在笔记中明确体现出来,或者有时候,并不能体现出我们是在什么场景下记录下了这条笔记。因此我们需要使用标签来补充这个笔记,以便之后和其他笔记产生视觉上的关联。同样是上面的例子,如果我是在读《乔布斯传》的时候记下的这条笔记,我就可以给他打上相应的“阅读/乔布斯传”的标签,以提供上下文的维度。

说到底,标签的主要作用就是方便我们日后重复使用笔记。那么,这个功能是否一定要通过标签来实现呢?

AI 的角色和标签的未来

AI 的引入无疑可以在一定程度上解决这个问题。但是,在实际使用中,我们发现由于向量数据库的特性,很多时候用自然语言检索数据库时,并不能找到所有的笔记,只能找到在它理解之中最相关的一条或几条笔记,这也是 AI 目前固有的缺陷之一。当我们试图检索内容的时候,希望的肯定是所有相关的内容都能被找到,而不是只能找到相对最相关的内容,而这是当前阶段 AI 很难做到的。

在这种情况下,标签就显得尤为重要了。它能保证任何打上这个标签的内容都能被找到,这是一种相对于 MECE 的一种存储方式。我不知道随着 AI 功能的发展之后这个问题是否能得到解决,但至少在短期内,标签仍然有它存在的意义和价值。

除此之外,上文提到的“提供上下文”的能力在很多时候还是 AI 所不能替代的。但是可以很欣喜地看到,像是 Lazy、Rewind 之类的软件在努力给出他们的解法。但是短期内,标签在这方面还是能发挥作用。

总的来说,虽然 AI 在不断发展和改进,但在笔记世界中,标签仍然占有一席之地。作为一种可靠而高效的信息分类和检索工具,可以在一定程度上补充了 AI 的局限性。看来,标签还会在我们的笔记中继续存在,但我也希望能够自由地记笔记而不需要思考标签的那一天。

新的日式拉面店 & Notion AI 重塑工作流

元气屋试吃

南京靠谱的日式拉面店并不多,之前比较靠谱的只有 D9 街区的 Ramen 满吉和据说口碑不错但位置偏远的江河叔叔。最近在小红书上看到北门桥新开的一家叫“元气屋”的店。老板娘和她父亲曾在日本长居,刚回国不久。这家店目前还在试营业阶段,正根据顾客的反馈调整拉面配方。我今天尝试了一下,觉得相当不错,有潜力在南京的拉面市场上经营下去。

他们的拉面有三种口味。首先是传统的天然豚骨拉面,味道相对较淡,针对中国人的口味作了适当调整。叉烧和面条味道非常好。老板娘说喜欢浓郁口味的可以尝试北海道味增拉面或鱼介拉面。他家的食材都很新鲜,而且拉面硬度可按需调整,这点在南京还是很少见的。所有菜品都是手工制作,连油淋鸡也是选用新鲜鸡肉去自己加工的,没有使用任何预制菜,老板娘和她父亲在这方面相当坚持的。

祝他家能长久经营下去吧,想吃靠谱的日式拉面太难了,毕竟谁想去德基楼下花六七十块吃味精拉面啊😂

因为 Notion AI 重新升级了知识管理体系

近期 Notion AI 推出了 Q&A 功能,让我对自己的知识管理体系进行了新的升级。核心架构仍然是三个层次:采集、组织、输出(谈谈理想中的 AI 笔记软件应该长什么样 – 以 Notion、Tana、Mem 为例)。不过,我现在把部分采集工作转移到 Notion。在 Notion 中,我借鉴了 Frank 的方法建立了一个看板,用于记录 Task 和 Notes。同时,我也在期待 Frank 推出的新 Capture 软件。

目前,我的输出主要通过 Logseq 和 Flomo 进行快速记录,而更偏向于纯粹采集的内容,则通过 Notion 来整理。这样一来,Logseq 和 Flomo 中的内容更加清晰有序。当然,Heptabase 依旧是我的整理工具,但我不再需要将那些资源性质的 Capture 内容迁移到 Heptabase 中。

至于输出方面,因为我的博客系统也是基于 Notion 搭建的,这样可以进一步优化与博客系统的整合,提高工作效率。

OpenAI 开发者大会后如何在 AI 领域生存

如何在 OpenAI 阴影下生存

OpenAI 在 Dev Day 发布的内容,让人感觉有点像 Intel 和微软的结合。它一方面通过大规模的资本投入,形成了一定的市场门槛,这某种程度上是有可能被挑战的。另一方面,它像微软一样推出了自己的“操作系统”,而在这个领域基本上呈现“赢者通吃”的局面。

在这样的背景下,要挑战 OpenAI 的地位,一种方法是为特定领域提供与 OpenAI 截然不同的解决方案和优势。比如说 Character,他们在情感智能上进行了大量投入,使得他们的 AI 与 OpenAI 的产物截然不同。

另一种策略是,在 OpenAI 的基础架构之上构建独特的应用软件。这种软件是 OpenAI 自身不会开发的,同时用户面临较高的转移成本。Adobe 就是一个最佳示例,它开发的专业设计软件的产品力是 OpenAI 难以企及的。我们也注意到,即使是微软,也很难开发出极为优秀的生产力软件。

再有,就是挖掘用户数据的潜在价值,这是一个相对难以捉摸的领域。像过去那些提供滤镜服务的厂商,虽然他们也收集了大量用户数据,但并未形成强大的网络效应。而 Instagram 这类软件,则成功地创造了网络效应。当然,这在一定程度上也取决于运气的成分。

来源:https://m.okjike.com/originalPosts/654b2305dc2460410c56b836

谁能从 GTPs 中获益?- Alchian花生

从 GPTs 这个趋势中能够获益的人主要有以下三类。

首先,那些在某一特定领域有深厚专业知识和经验的人。他们对自己所在的行业或职业有深入的理解,并积累了丰富的数据和认知。他们能够利用这些优势,制作出更优质的 GPTs。例如,如果他们是小红书的资深博主,或者是法律界的专业人士,他们就能够根据自己的专业知识和理解,制作出符合相应行业需求的应用。

其次,那些对用户需求有深刻洞察的人,也就是所谓的真正的产品经理。他们能够准确把握用户面临的问题,并通过 AI 来解决这些问题。

最后,那些逻辑思维能力强且在 AI 实现方面有丰富经验的人。这部分人的存在主要是因为目前的 AI 仍然存在一定的调教门槛。虽然随着 AI 技术的进一步发展,这部分人的优势可能会逐渐降低,但是在一段时间内,他们因为技术优势而产生的优势仍然存在。

总的来说,无论是专业知识、用户洞察还是技术实现,都是从 GPTs 趋势中获益的关键因素。

足球和博彩,开发者陷阱,OpenAI 开发者大会

足球和博彩的关系

关联 UAW罢工,赌球与博彩,过度简化

足球和博彩的密切关联,在于多方面的原因。首先,足球相比其他运动,拥有最广泛的受众群体。然而,足球的观众层次和素质相对较为参差,这使得他们更容易受到博彩业的影响。其次,足球的商业化规模巨大,但高度的商业化并不意味着所有足球俱乐部都有足够的商业赞助。因此,很多中等或中下等水平的足球俱乐部不得不接受博彩公司的投资或广告来维持运营。

除此之外,足球比赛的不确定性很高,这恰恰符合博彩的本质需求。再加上足球比赛中可投注的元素非常丰富,不仅限于进球或比赛结果,这满足了博彩对多样性的需求。这些因素共同作用,造成了足球与博彩业的深度绑定。

拒绝博彩赞助对球队的影响

确实,许多联赛已经开始禁止博彩公司成为球队的胸前赞助商。从短期来看,这可能会对球队的财务收入造成影响,因为他们失去了一笔重要的资金来源。然而从长期角度来看,禁止博彩广告可能有助于提升球队的品牌价值。长期依赖博彩公司的广告可能会让一些粉丝感到不满,这对球队的长期发展和粉丝基础的扩大是不利的。同时,失去这些“快钱”可能会促使球队回归到商业市场中的正常估值,避免过度依赖博彩资金,这可能有助于促进球队朝着更健康、更可持续的方向发展。

来源:足球无双播客

“开发者陷阱”(The Builder’s Trap)

什么是开发者陷阱呢?开发者陷阱指的是在开发过程中过于纠结于技术实现细节,而忽视了产品的核心功能和用户需求的困境。这种陷阱容易让开发者沉迷于技术的探索和优化,最终导致项目进度延迟和功能失去焦点。

(View Source)

这两天在收到了 Zettelbox 作者 Bear 的最新 newsletter。我之前也用了 Zettelbox 一段时间,觉得作为一个苹果端的原生知识管理工具,有很大的发展空间。但是后来发现,和其他独立开发者或开发团队相比,开发者的更新速度很慢,而且经常拖延,于是也就没有继续使用了。

在他的 newsletter 中,他坦诚自己之前陷入了所谓的 ”开发者陷阱“。例如,他先前不断寻求解决各种设备间通过 iCloud 同步的问题,但研究过程中,他不断发现新了解技术似乎能更好地解决这个问题,于是投入时间去学习,然后又发现新技术。因此,他不断推迟最终的交付时间,几个月过去了,仍未能成功更新。

在这种情况下,采用一种更为敏捷的开发方法可能更为合适,首先交付一个能满足基本需求的 MVP(版本,然后再根据不同的技术进展进行更新。然而,许多开发者常常没能意识到这一点,进而,由于长时间的延迟,导致丢失了现存或潜在的用户。

对于普通人来说,类似的“开发者陷阱”也同样存在。例如,对于那些热衷于生产力或知识管理的爱好者,他们往往会陷入不停地比较不同软件的优势,并深入研究的陷阱中;或者总是想办法在不同的软件间迁移笔记。但他们忽略了最关键的一点,那就是这些工具本应服务于我们自己的记录和创作。这在某种意义上,也是一种“知识管理陷阱”,知识管理爱好者实际上只是在“玩”工具而已。

OpenAI 开发者大会

今日凌晨,OpenAI 的开发者大会如期而至。许多人仿佛回到了 OpenAI 发布插件系统时的情景,纷纷预感着又一次“App Store 时刻”的来临。对此,我的态度既谨慎又乐观。

之所以谨慎,是因为 OpenAI 过往在产品力展现及构建插件系统过程中的一些令人困惑之举,例如插件市场审核的不完善、缺乏有效的宣传和运营策略,这些都让我对它们的运营能力抱有疑虑。

然而,乐观是由于在直觉上,这种就像我们日常使用的 Agent 或 Copilot 一样的形态似乎更适合 ChatGPT。回想我使用 Poe 时,最顺手的便是其中的各种 Bot。而ChatGPT 虽能进行多轮对话,但几轮下来便容易忘记最初的 Prompt,而融合 Bot、文档处理以及集成知识库的 GPTs 模式,则更契合人类的认知模式,也更易融入我们的日常生活和工作中。

目前我只能试用 Assistant 功能,尚未亲手体验具体的 GPT s功能。期待未来能亲自构建一些专门为我写作和其他工作生活服务的 GPTs 应用。