在 AI 时代,做「有机」的创作者

上个月看到 orange.ai 的公众号文章,提到了 AI 时代的「有机」的概念。并且他直接把公众号的名字改成了「有机大橘子」,也算是非常有行动力了。

在食品中,有机的东西总是更贵些。而在各种表达被人工智能占据的场域,手搓无添加的内容成了稀有物,这何尝不是一种「有机」。

那么,在 AI 内容生产中,什么才叫有机呢?我们常说 AI 写的东西没有人味儿,这其实就在于,AI 输出东西时,他只有 intelligence, 没有 context,那么自然就缺乏生命力。虽然现在越来越多的大模型引入了记忆功能,但它毕竟不能代表我们所有的思考,无法记录人和人之间的互动,没法记住肌肤被夏日灼热的空气覆盖的感受。这些细小的细节构成了我们生而为人的真实感,思考加上感受,才能构成真实而自我的表达。之前在Context 的重要性;小红书+淘宝1中也写过一些感想。

表达本来就是一种力量,一种可以用来确认自己活着的权利。

那为什么我还会把 AI 应用于我的日常写作之中呢?这需要先区分开写作和编辑的区别。如以前文章所描述,无论写作才去的是流水式还是建筑家的模式,写作出来的内容、其内核还是来自于我们自己。AI,可能是通过如语音转文字等手段提高了输入效率、抑或是在后期编辑中快速修正表达、格式,本质上还是通过把标准化、重复性劳动外包给 AI 来提高效率,而其内核、表达的方式还是自己的。

当然,在这个过程中,有时候 AI 编辑和自己写作之间的那条「线」会比较难以划分清晰。AI 在编辑过程中所占的比重应该有多少这一问题也没有定论。有些创作者会认为,只要主题是自己的,论证过程全由 AI 来完成也无所谓。甚至有不少 Newsletter 作者选择了只由自己挑选阅读的文章,简介、评论都放手给 AI 来完成。

仅从我自己的价值观和审美上来看,对于上述的用法我并无法苟同。其实在 AI 辅助写作上我也尝试了不少方法,应用 AI 的比例也经历过不少反复。例如,在 AI 刚刚大行其道时,我也曾尝试过全由语音输入,让 AI 改写文字,调整逻辑、语法等。虽然这一方法看起来仍保留了我作为创作者,在观点输出上的主体性,但经过一段时间,我却发现,一个人的文风、用词也是构成「表达」的重要元素。

在这一过程中,Flomo 的产品哲学也给了我一些思考的引导。他们的 AI 语音转文字力求尽量保留创作者的文字,只去除一些口癖。这种记录方式有利于记录者回忆起记录时的场景,显得这些记录更像是自己的。

这其实和上文提到过的 context 也有关。「表达」不止是观点,更涵盖了与之相关的表达方式,只有两者相加,叠加上场合、地点、天气等众多因素,才构成了完整的表达。我们在创作中可能难以完全复刻所有的 context,但至少通过更「有机」一些,能让更多的 context 得到保留,能让我们产出的内容更像我们自己。

自行车比赛正在 F2 化吗?

这是我前些日子刷即刻的时候,看到有人讨论自行车比赛越来越无聊的时候发散出的想法,纯属瞎想,没有事实/数据支撑。

自行车比赛越来越难看了吗?

如果你曾关注过过去这一两年的公路自行车比赛,那么不可避免地会经常看到诸如「波加查/UAE」又赢了之类的评论,乃至于会有不少人开始诟病,是否现在的自行车比赛变得越来越难看了。

这里我们不去讨论某些具体运动员/车队过于强大,掩盖了其他车手的光芒的问题,毕竟这一现象在所有运动里都存在(人们会质疑乔丹损害了NBA、林丹损害了羽毛球吗?)。而且自行车运动的特殊性,也使得不同类型的车手都有竞争属于自己的赛段的机会。

当我们排除掉这些因素之外,会发现自行车比赛和 F2 有着不小的相似之处。

自行车比赛正在「F2化」?

如上文所说,相比于讨论波加查的强大是否使得自行车比赛失去观赏性,不如聚焦于一个最近偶然想到的一个比喻,即自行车比赛是否正在「F2 化」。

这里没用 F1 做比较,是因为自行车虽然有不同的品牌,但是器材的差距远小于 F1,更接近于统规赛,在此基础上,各个车队的调教、策略、经验以及车手的个人能力会发挥更为重要的作用。

现代自行车比赛中无线电的运用实际上在一定程度上缩小了车手间经验的差距,所以我们能看到越来越多的年轻车手出现在总成绩竞争的前列,而不像传统意义上,自行车手要到30岁左右才能达到个人能力与经验的巅峰,这和 F2 里,年轻人的能力往往比老人更强有类似之处。

「F2化」下也存在贫富不均

  • *但「统规」并不能防止自行车比赛里的贫富不均。**最强的车队比如 Visma 和 UAE 能通过无线电、强大的电脑计算来制定精确的策略,车手的经验以及偶然性被一定程度上抹杀了。虽然这能更好地方便一些有观赏性的策略的实施,比如空中加油(比如今年环意,范阿尔特完美的空中加油,同事导播前期故意不给他镜头也增加了戏剧性)。但小车队夺冠的可能性也减小了,同时减少的也包括车手头脑博弈所导致的观赏性。

(参考知乎[失落的优雅的回答](波加查一骑绝尘连续称霸环法赛场,是否对公路车运动观赏价值带来负面影响? – 失落的优雅的回答 – 知乎 https://www.zhihu.com/question/1929593186029895862/answer/1936378297043883664))

但为什么这些年有时候会感觉 F2 比自行车比赛更有意思呢?

这可能是因为,在 F2 比赛中,虽然存在着各种各样的高科技、车队指挥、类似的车辆,但个人的驾驶技术、驾驶风格仍然是影响力最大的因素,重要的是头脑。而在自行车比赛里,体能、爆发力、恢复能力这些非头脑因素才是最重要的影响因子。换句话说,人们欣赏体育竞技,虽然很多人会喜欢精妙的团队配合,但是最能激起肾上腺素的永远是那些属于人本能的部分。

可能这也是为什么那么多人喜欢前两年的波加查的原因吧,那些没有道理的进攻往往让人热血沸腾,也许这在某种意义上才代表了体育的初心?

最后用 Flomo AI 洞察的一段话作为结尾吧。

体育比赛卖的是“竞争”,可“竞争”的核心从来不是“谁的策略更精确”(F1可能是个特例),而是“谁的人更有韧性、更有勇气”。说到底,我们热爱的比赛,从来不是“机器的精确对决”,而是“人的故事”——那些汗水、那些意外、那些“明知不可为而为之”的勇气,才是让我们热血沸腾的原因。技术可以让比赛更高效,但不该让比赛变成“机器的游戏”;信息可以让决策更科学,但不该让决策变成“数据的奴隶”。

突然想起之前谈到F1大电影时,觉得剧情“不能带脑子看”,可还是愿意二刷IMAX——不就是因为那些“人的故事”,那些“速度与激情”的瞬间,比剧情更动人吗?

—— Flomo AI 洞察

明日方舟2025夏活「墟」简评 & 简单聊聊娱乐产业中的文化挪用

剧情简评

习惯了方舟夏活=阳光沙滩的公式,今年的「墟」终于有了些不一样。通关之后,整体的感官还是不错的,剧情水平在今年的一众剧情里可以排到超大杯下,略高于「红丝绒」。它一反常态地抛弃了过去夏活那种活温馨、或搞笑的假日氛围,转而用一种沉静又略带伤感的笔触,成功地描绘出了东国的另一面。

这次活动最成功的地方,就在于它对各种「昭和」文化标签的运用。这种大规模的意象堆砌,很容易搞成一个缝合怪式的四不像产物(「昭和米国物语」这种用堆砌刻板印象来解构文化的不算),但「墟」却没有,反而通过这些元素,精准地营造出了一种独特的「物哀」美学。

比如三船对「漂亮」的病态追求、烟花大会下充满宿命感的决斗,这些情节都指向了某种绚烂而短暂的、带着毁灭倾向的日式美学。对神明的塑造也很有特色,祂们并非主动干预世事,而是「因事情发生而显现」,这种超脱感一下就摆脱了脸谱化的窠臼,让整个故事的文化基底显得非常扎实。

文化挪用

说到这里,我想多聊几句关于「文化挪用」的话题。 很多游戏和电影在处理异国文化时,特别容易犯一个毛病,就是把各种文化符号当成一个免费的素材库,随便拿来拼接。他们看中的往往只是这些符号的「形」,而不是其背后的「神」。

好莱坞电影里,我们看腻了白人主角在日本/中国学会人生哲理顺便拯救世界的套路,异国风情只是主角个人成长的背景板。游戏里也一样,基本一提到日本就是赛博朋克、武士、忍者、黑道,仿佛这个国家除了这些标签之外就空无一物。这种做法,本质上是一种猎奇和消费,它看似是在展现文化,实则是在加深刻板印象。

而「墟」的难得之处,就在于它没有停留在「借用」,而是尝试去「理解」和「转译」。它没有把重点放在展示一个奇观化的东国,而是去捕捉那个时代一种共通的情绪——经济泡沫下的虚假繁荣与落幕时的集体感伤。它所探讨的「物哀」,也并非东国独有,而是一种能让所有文明背景下的玩家都能体会到的、关于「美好事物终将逝去」的无常感。

最好的「文化挪用」是找到文化中最能引发普世共鸣的内核,然后用自己的方式,把它讲给更多人听。

这方面其实和原神有些类似。之前也有挺多人批评说《原神》对于各种文化往往只是选取了它的一些文化标签,用这些标签,或者说这些刻板印象,来表达它的故事。

实际上,当我们深入它的剧情,抛开那些低幼的成分不谈,实际上它所渲染的更多的是一种该种文化所处的一种情境,一种 context。它不是要用这些标签来显示它借用了某种文化,而更多的是要用这些标签辅助于它讲一个符合该种文化的故事。

剧情的问题

但话说回来,虽然「墟」在文化层面做得比较出色,它在具体的剧情和人物上,还是暴露了一些老问题。

这种问题主要集中在澪和更纱身上。澪还好,人物的动机是说得通的,但整个角色弧光给人的感觉就是不完整,缺乏足够的铺垫让她的人物转变变得可信。而更纱则是一个彻头彻尾的「机械降神」,她的出现过于突然,轻易就解决了核心矛盾,这种写法虽然方便,但也让整个故事的严谨性大打折扣,给人一种编剧为了解决问题而强行安排一个工具人的感觉,和之前「离解复合」里普瑞赛思那种「为了有反派而反派」的问题有异曲同工之妙。

总而言之,「墟」是一次非常大胆且成功的尝试。它在主题和氛围上达到的高度,足以让它成为今年我最喜欢的活动之一。人物塑造上的瑕疵虽然可惜,但也可以看作是为后续的东国故事埋下的伏笔。

语音转文字正在改变我们的生活——兼简要横评市面上的语音转文字笔记软件

自从 Whisper 模型出现以来,语音转文字就成了我的写作流程中非常重要的一环,之前也写过一些文章分享了 AI 语音转文字的一些用法。而随着越来越多人开始使用语音转文字、越来越多相关的软件出现,这一「便捷」的输入方式也为越来越多人所熟知。在以前文章中也提到过,人工智能可能对人类社会生活方式造成许多改变,包括日常创作、人际交往乃至工作方式都迎来了诸多变化。最近我发现,这些变化已切实地体现在我身上。

近期写作上的一些变化

以前写文章的时候,我通常是有想法就直接用手机打开 Flomo 记录灵感,有空时在就随便找个咖啡店、或者在高铁、飞机上用iPad上打字成文。但最近在记录灵感时,我越来越多地通过语音来记录了,而使用语音时,出于「语音尴尬症」等原因,下意识地会避免利用一些在公共场合的零散时间进行片段的输入。更多是希望能找到一个相对空闲的时间、相对独立的地点,用语音来完成整体草稿的撰写。

这其实和我一开始想的「语音有利于片段化的输入」这一想法出现了很大的区别,也引发了进一步的思索——语音输入和键盘输入的区别到底有哪些,而语音输入对我们又会产生什么样的影响。

语音输入 vs. 键盘输入

思维模式

如果用一个简单的比喻来描述什么是键盘输入和语音输入,以及他们之间的区别,文字输入其实有点像我们是在一块砖一块砖地来「建一座房子」。在这个过程中,我们可以随时停下来审核结构,发现不满意的地方就拿掉,然后重新垒上,同时,我们可以交替着在多个地方开始垒墙。这个整个过程是异步、非线性的过程。在这个过程中,我们会经常需要做修改、拼接等等。经常写作的人也会有这种感受,我们会对每一个句子、每一个段落、每一个词进行琢磨,当我们写完一句话时会回头看看,删掉几个字,或立刻做出修改。

相比之下,语音输入更像一条「河流」。思想如水流,说出的话直接奔涌向前。我们无法让河流暂停,回到上游修改水流,只能保持它从头到尾流动。这过程同步且线性,需要不受打扰的环境。

为何会有这种差异?一个原因是认知摩擦力不同。打字时,我们经历思考、选词造句、寻找按键、拼写,然后看到文字出现,整体是一条很长的链条。语音输入则更容易进入心流状态,因此我们希望有个不受打扰的环境,一旦进入状态就不停下。写作时注重的会是思维的连贯表达,而非单个词语的完美与否。

同时,打字和语音输入调用的思维模式也不同。书面写作偏向逻辑结构和分析,讲述则偏向故事思维。讲故事追求连贯完整,写作的逻辑思维则完全不同。

我们并非说河流模式一定比建筑模式好,或更代表时代发展方向。相反,这是每个创作者面临的取舍。

效率

语音转文字技术对写作最直观、最可量化的影响,毫无疑问在于对效率的颠覆性提升。人类说话的速度远超打字,那自然,只要有足够的内容储蓄,能够维持输出强度,那么自然在相同的时间下,就能够输出更多的文字。不过需要注意的一点是,语音转文字也导致了编辑负担的转移。在起草阶段所节省的时间,一定程度上被转移到了编辑阶段。

正如上文所说,口述生成的初稿往往是未经加工的「原材料」,需要大量重写和结构调整才能成为合格的书面语。因此,语音转文字带来的生产力提升,其实并非简单地缩短了总时间,更多是重构了时间分配。

对于那些在编辑上比较苦手的人来说,实际上可能并不能减少他们总的输入时间。而真正的效率提升,属于那些能够成功适应新的两阶段工作流程,并掌握相应编辑技能的写作者。

对文字本身的影响

语音转文字技术对写作带来的转变远不止于效率,它也在潜移默化地改变文字本身的特质。

既然文字来源于口语,那写作出来的文本也自然会更加倾向于对话式的风格。这种风格在某些博客、介绍性文章中自有其优势,能营造出一种亲切、自然的氛围,但若讲述者本身不擅长讲故事,则有可能会囿于流水账的困境。

这也就引出了语音转文字所带来的潜在问题,即会导致行文冗长、结构松散。在我的语音转文字写作中就经常出现这个问题, 由于思考和写作是同时进行的,而人在思考的时候会不自觉地重复自己的观点,以保证逻辑的连贯性。当这种思维落在纸面上,就很容易会出现大段的重复。

影响不止于写作?

语音转文字所带来的影响不只局限于写作,它对于我们人与人之间的沟通,乃至于人与生活之间的互动都会带来很大的改变。

人和人之间的沟通模式

举个例子,语音转文字对工作中人与人之间沟通就会有很大的影响。以前当我们开会时,除非额外注明有人来专门做会议纪要,不然很多时候会议的内容是无法追踪的,人们相对而言就可以更加畅所欲言一些。而随着语音转文字技术的运用,所有的会议都可以留痕,这也就导致人们在线会议时会更加谨慎,更加注重自己的措辞,对于自己所抒发的内容会有更多审慎的考虑,会避免随意输出可能对自己或他人不利的内容。

这一方面使得同事与同事或者说不同部门之间的沟通变得愈发困难,但在某种程度上也增加了线下人与人之间沟通的重要性。在工作中,人们可能更加会倾向于线下的会议,或者说在茶水间等非正式场合的碰面。所以说,语音转文字技术在工作中可能会导致地理位置相近的人之间的关系变得更加紧密,而对于位置相对较远的人而言,反而会加深他们之间的隔阂。

人和社会之间的交互

语音输入正在重塑人们执行日常任务的方式,培养了新的行为习惯和用户期望,例如,人们期待技术能够提供即时、准确和个性化的响应 。然而,这种行为转变也面临障碍,包括用户对设备全部功能认知不足,以及在公共场合使用语音命令的社交尴尬感 。

而对于人与社会,以及人与社会中的一些事物的交互而言,也带来了很多的改变。语音转文字的效率大大优于传统的写作,人们在工作中也会更加依赖语音转文字,这就导致了人们工作范式的一定改变。很明显,在那些所有人坐在一个场合进行工作的场景下,语音转文字可能并不适用。人们会避免自己的隐私被探听,同时也担心会影响到别人。因此,在工作场所里,人们可能会需要更多个人的空间,或者更多可以短暂使用的个人空间,如电话间等。而这也同时进一步导致了人们工作节奏的加快。由于信息产生和处理速度的提升,人们的工作压力也会进一步增加,并且也会要求人们掌握更多的语音输入技巧。由于语音天生是流逝的,它也会要求人们学会怎样说出结构化的内容,这对人们的思维模式的要求其实更高了。

对社会的深层影响

而对社会交互的深层影响而言,优点自然在于,它在功能上进一步增加了信息的民主化程度。由于不善于打字的人也因此能够更加轻松地创作内容,在一定程度上降低了内容创作的门槛,同时也为那些文盲、不擅长书写打字,或者有手部残疾的人提供了一个相对公平的表达渠道。

而对于文化而言,语音转文字带来的可能更多是一些负面影响。相对而言,社会公平虽然在一定程度上缩小了阶级之间的不公平,但是对于不同语言、不同族群人之间的公平程度反而有可能是一种放大。那些使用少数语种或者有特殊口音的人会因此丧失快速输出的机会,和主流人群之间的差距会进一步扩大。而且语音转文字在主流语言上的优势也会随着语料增加而进一步增加,一些地方语言很有可能会加速消亡。当然,这里面也有一些反例,人工智能也可以用来保护或识别一些比较古老的语言,这取决于人们如何使用人工智能技术。

第三个变化更多在于认知模式上,人们通过语音随时记录想法,这改变了大脑处理信息的方式,就像我们之前所说的「建筑」和「流水」之间的区别。这长期对于人们的思维方式也会有负面影响,一旦人们习惯于随时随地记录自己的语音,自然的记忆能力反而可能会被削弱。

简要横评常见的语音转文字软件

下文会对我使用过的一些语音转文字软件进行一些简单的评述。特此声明,我仅评测我付费使用过的产品,且不打总分,因为不同维度对不同人来说有着完全不同的权重。篇幅所限,每个软件仅作简单评述,如有需要详细介绍,可以在评论区留言,后期有时间了可能会写更详细的文章。

语音+笔记

TL;DR

AudiopenVoicenotes闪念贝壳FlomoDinox
价格早鸟⭐⭐⭐⭐⭐订阅⭐买断⭐⭐⭐⭐订阅⭐⭐⭐⭐⭐买断⭐⭐⭐订阅⭐⭐
UI/设计⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
输入便捷度⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
AI 能力⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
上传录音⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
集成能力⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
附加功能⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
开发者能力⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
未来预期⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐

Audiopen

在所有语音转文字笔记软件中,Audiopen 应该是最早出圈的一个产品。早在2023年它就诞生了,作者从来没有编程经验,通过 vibe coding 创造了这款产品。

由于它当时昂贵的定价,也激起过一些讨论。Audiopen的 UI 以及语音转文字的准确度在所有产品中都是最佳的。去年,它也开发出了 app 端,在易用程度上也很优秀。它的后端集成做得也挺好,可以自动把转录及AI修改好的内容发送到 Notion,或通过 webhook 发动到其他自己想要管理的软件之中。综合来看,作为这个行业里的先驱,除了价格较贵之外,没有什么值得吐槽的问题。

Voicenotes

如果你错过了 Voicenotes 早期的 50 美元早鸟价买断的话,那这可能是语音转文字笔记软件用户最大的遗憾之一。

Voicenotes 在所有笔记软件中可以说是综合了价格、 UI、设计逻辑、后期的集成等最好的一个产品。Voicenotes 的设计非常克制且优雅,无论是极简的设计还是对于 AI 改写的克制,在使用便捷度上是首屈一指的。

它既支持在 App 中进行转录,也支持上传语音文件进行转录。除此之外,Voicenotes 还支持通过一个叫 Pages 的功能来把自己的语音转文字发布出去,形成自己一个非常微型的博客。我也把它作为我个人博客的一个补充,记录一些我个人的日常闪念。同时,它也支持 AI 问答等功能。

值得一提的是,Voicenotes 的作者是 Buy me a coffee 的作者,因此信誉度相对可靠,暂时不用担心跑路。

综合下来,Voicenotes 是我在所有笔记软件中使用语音转文字的频率最高的。而且它同时支持网页端、手机端以及苹果手表端的输入,这让它的使用场景得到了大大的拓展。近期,它也更增加了在桌面端的快捷输入,并且更加扩展了它自己的使用场景。

闪念贝壳

闪念贝壳其实是先在海外做起来之后才拓展到国内的,在外区它的名字叫 Ideashell。作者不愧是设计出身,它的外观设计非常优美,UI也很简洁美观,对颜值党来说用着非常舒服。

而另外一个特色则是它与其他各种软件的集成。打开软件(或通过小组件/action button),录入一段语音,生成的内容,可以被非常便捷地立刻发送到包括从微信、提醒事项到 Notion、Obsidian、熊掌记、Craft、滴答清单、Day One等一系列笔记软件中去,在操作的便捷度上毫无疑问是在所有软件中最佳的。

此外,闪念贝壳支持上传录音文件进行转录,并且支持区分不同发言人,这个功能常被我用于临时会议记录。

Dinox

如果说闪念贝壳是典型的设计师作品,那么 Dinox 则是典型的工程师作品。

如果要论各种与 AI 相结合的功能最齐全、设置最复杂的产品,Dinox 非他莫属。它支持从语音转文字到后续的结构化处理、相关笔记、AI 聊天等一系列功能,甚至还支持手机端检测存储,并且包括 S3 等不同的对向存储。

可以说,所有你能设想的与笔记相关的功能在 Dinox 都有。但自然,缺点也是存在的:它的操作设置过于复杂,入门相对较为困难,且当前阶段 bug 较多;在美观上与其他几款产品相比略有缺失。同时,由于作者想法很多,整体作品割裂感比较强,并没有一个明确的产品特质。

但是,作者的更新频率以及响应速度非常之快,几乎每隔几天就有一个新版本,可以说是未来可期的一个选择。

Flomo

其实早在 AudioPen 流行之后,我就和少楠提过在笔记软件中加入语音转文字的想法。但当时他们觉得需要先研究语音转文字是不是一个笔记软件的刚需,以及如果真的加入了,如何进行最符合他们产品逻辑的设计,谁料这一研究就是两年。

对于他们这个解释,一开始我和其他挺多人一样,觉得他们只是出于成本考虑而拒绝做出一些新的尝试。也因此,我尝试了其他挺多速记软件。

几个月前,Flomo 终于加入了语音转文字。并且我也很欣慰地看到他们确实在里面融入了自己的想法。相比于那些着重于语音输入后,对笔记进行很多基于不同prompt调整的软件而言,Flomo 不支持自定义prompt(对不少人来说这是个缺点),非常注重写作者原来的结构,仅去除了一些常见的口辟等。

这其实也和我对于笔记的看法不谋而合。之前我也尝试过通过很多预先设置好的 prompt 来对自己的语音输入进行大幅度修改,但最后却发现这些修改过的笔记虽然看起来更加精致,但很多情况下并不能反映我自己的原意。亦或者,当我事后回顾的时候,总感觉这些笔记有些陌生。正如少楠和Lightory 想传递的笔记理念,只有那些在我们用自己的理解记下来的内容,才是我们当下最真挚的表达。我们自己通过思考来进行的重新编辑,也能让我们对自己的笔记有更深刻的印象。

此外,这半年支持的 AI 搜索和最近引入的 AI 洞察也很有想法,能帮助用户发现笔记和笔记之间的关联——虽然 Voicenotes和Dinox也支持类似的功能,但从易用程度以及完成度上来看,后两者只能称得上有这个功能,远远不算好用。

说了这么多,Flomo 当然也有一些问题,比如说他的语音笔记最长只能支持五分钟,对生成的内容会进行自动审核,替换掉一些不当语句,并且不支持同步到其他软件等。但从使用的易用性上,以及语音转文字这一功能本身的实现的完成度上,Flomo 还是做得很好的。

其他:Get笔记、即我笔记、Reflect、Tana、Workflowy等

这里提到的这些笔记软件并不代表市面上所有支持AI语音转文字的软件,还有几款可以简单提一下。

如果把市面上的语音转文字软件分成两类,一类可以算是所谓的「AI 原生」笔记软件,另一类则是「AI+」笔记软件

其中,Get笔记和即我笔记,以及这两年在即刻、小红书上各种独立开发者各种宣传的层出不穷的新软件大都是在AI语音转文字出现之后而诞生的。他们在从初始阶段就兼顾到了语音转文字的开发,但因为我使用的不多,也建议大家去找其他的评测。

而后面提到的这几款Reflect、Tana、Workflow则是基于已有的笔记软件的基础上,把语音转文字融入他们的工作流。其中,Tana毫无疑问是其中做得最好的一款。AI 已经成为其完整工作流中的一环。它既支持会议的转录,也支持日常的手机端以及电脑端的语音输入。此外,Tana还能在输入之后用AI对语音转文字的内容进行进一步修改,自定义化非常强。

但由于这几款都需要比较昂贵的订阅费,在性价比上,如果只是把它作为语音转文字软件而言,相对会比较低。不过,如果能把它们与自己的工作流结合起来,或者作为自己的知识库所在,那是可以考虑的选择。

语音转录输入法

桌面端的语音转文字输入法也有不少选择,最主流的包括 Superwhisper、Wispr Flow等,甚至 Voicenotes 近期也推出了 Mac 端的输入法软件,只需按住快捷键,就能直接把语音转文字输入到当前的文本框内。

由于我日常输入不依赖于 Mac,对这方面没有很深的研究,可以参考Edison的这篇文章来了解更多的细节 https://linux.do/t/topic/833194。

语音输入是 AI 时代的唯一正解吗?

语音转文字软件确实加快了我单一文稿撰写的速度,例如这篇文章有 50% 的部分是通过语音输入完成的初稿。但回头看来,寻找具有仪式感的环境进行语音输入这一行为反而对我创作构成了新束缚。

以前我能在等地铁、午休时花几分钟,用手机或iPad快速写出文章一部分。然而习惯于用语音写初稿之后,我的零散输入时间反而变少了。

未来创作中我可能需要区分不同类型文字,采取不同写作方式。对偏向故事型、记录型的内容,使用语音可能更方便;对偏向书面信息的写作,找个安静地方写可能更好。更或者,在大部分情况下,我都会更加倾向于用打字的方式来进行写作。因为无论是在摘录闪念,亦或是在长篇梳理自己想法的时候,这种字斟句酌的输入方式都更有利于我理清自己的思路。并且,它能更加有一种创作的真实感以及仪式感。毕竟,有时候仪式感本身也是创造力的来源之一。

而对于每个创作者以及记录者而言,根据自己所处环境、惯用设备而选择最适合自己的创作方式,是每个创作者都需要面临的课题

为什么塔勒布的“最不宽容者获胜”在AI时代不管用了?

2018年,欧盟 GDPR 的实施掀起了全球数据保护的新浪潮。这部被称为”史上最严格数据隐私法”的法规不仅改变了欧盟境内的数据处理规则,更通过”布鲁塞尔效应”,将其影响力扩展到全球范围。然而,当欧盟试图将这种监管模式复制到人工智能领域时,情况似乎有了微妙的变化。

2023年12月,欧盟就 EU AI Act 达成初步政治协议,标志着全球首个综合性AI监管框架的诞生。这一时刻让人不禁想起2015年12月GDPR文本达成一致的场景。然而,与GDPR相比,AI法案面临的挑战似乎更为复杂,科技巨头的反应也更加激烈。

什么是“最不宽容者获胜”?

最简单的例子,为什么前些年,我们发现,越来越多的产品、越来越多的饭店开始贴着清真认证标签?答案在于一个简单的不对称性:穆斯林消费者只能吃清真食品,而非穆斯林消费者可以吃清真食品。

当穆斯林人口达到一定比例,或者占有一定舆论声量的时候,食品生产商面临一个选择:要么生产两条产品线,要么统一采用清真标准。由于清真认证的额外成本相对较低,而维护两条生产线的成本较高,理性的选择是统一采用清真标准。

这就是”最不宽容者获胜”的精髓:当转换成本较低时,整个系统会向最严格的标准倾斜。

放在现实生活中,则体现为当一个坚定不妥协的少数群体与一个较为灵活的多数群体相遇时,整个系统往往会向少数群体的偏好倾斜。

GDPR:理论的初步验证

GDPR的实施过程似乎验证了塔勒布的理论。作为”不宽容的少数群体”,欧盟通过GDPR设定了严格的数据保护标准。尽管科技巨头最初表示担忧,认为需要大规模调整政策和程序,但最终还是选择了合规。

这种合规不仅仅是因为高额罚款的威胁(最高可达全球年营业额的4%),更重要的是,维护多套数据处理系统的成本远高于统一采用GDPR标准。结果是,许多公司不仅在欧盟市场采用GDPR标准,更将其推广到全球业务中。这就是所谓的”布鲁塞尔效应”——欧盟的监管标准成为了事实上的全球标准。

AI法案:理论的滑铁卢?

然而,当欧盟推出AI法案时,科技巨头的反应却截然不同。与GDPR时期相比,它们对AI法案表现出更为强烈和一致的反对态度。这种差异化的反应背后究竟隐藏着怎样的逻辑?

GDPR主要被视为一项数据治理和隐私合规的挑战。它规范了数据处理方式,但并未从根本上改变科技公司的商业模式。相比之下,AI法案被认为直接触及了AI技术的核心——它不仅规范了数据如何使用,更涉及可以用数据构建什么,以及谁对其效果负责。

对于GDPR,大型科技公司虽然面临高昂的合规成本,但也从中获得了意外的战略利益。GDPR的复杂性为小型竞争对手设置了准入门槛,从而巩固了大型企业的市场地位。这种”二阶效应”影响了它们的决策逻辑。

而AI法案则不同。科技巨头认为,这项法案可能会从根本上威胁其在AI领域的领导地位和未来增长潜力。它们担心严格的监管会削弱欧洲AI模型的竞争力,甚至可能将市场份额让给其他地区的竞争对手。

相似表象下的本质差异

要理解这个谜题,我们需要深入到细节中。GDPR和EU AI Act看似相似,实则有着根本性的差异。

首先是合规的确定性问题。GDPR的要求相对明确:获取用户同意、提供数据删除选项、确保数据安全等。虽然实施起来繁琐,但至少企业知道该做什么。相比之下,EU AI Act充满了模糊地带。什么算”高风险AI应用”?如何证明一个深度学习模型是”可解释的”?当技术本身还在快速演进时,如何制定固定的合规标准?

更关键的是对核心业务的影响程度。GDPR主要改变的是数据处理流程——你仍然可以做社交网络,仍然可以投放广告,只是需要先获得用户同意。它就像是给汽车加装安全带,麻烦但不影响汽车的本质功能。而EU AI Act直接触及产品的核心。它可能要求你的AI模型必须是可解释的,但对于依赖深度神经网络的现代AI来说,完全的可解释性在技术上可能根本无法实现。这就像要求汽车必须能够飞行——不是改进,而是改变本质。

谁是”最不宽容者”?

在GDPR的案例中,欧盟作为”不宽容的少数群体”,成功地将其数据保护标准推广到全球。然而,在AI法案的博弈中,局面变得更加复杂。

一方面,欧盟仍然试图扮演”不宽容者”的角色,坚持其对AI的伦理和安全标准。另一方面,科技巨头在捍卫其核心利益和创新自由时,也表现出了极高的”不宽容”程度。它们通过密集的游说活动、公开表态,甚至威胁撤出欧洲市场来表达立场。

这场博弈的结果可能不会是一方的完全胜利,而是一个反映多方相对力量的复杂妥协。塔勒布的理论在这里提供了理解影响力动态的视角,但现实世界的结果往往更加微妙。

时间窗口的不同

2018年和2024年的科技产业格局已经大不相同。当GDPR推出时,数据确实重要,但还不是生死攸关的问题。失去一些数据收集能力令人痛苦,但不会让Facebook或Google失去竞争优势。那时的数字经济已经相对成熟,需要的是规范而非突破。

但2024年的AI竞赛完全是另一回事。我们正处于AI革命的早期阶段,每个月都有突破性进展。在这个时刻被监管束缚手脚,可能意味着永久性地落后。更重要的是,中美AI竞争的大背景让一切变得更加复杂。当你的中国竞争对手可以不受限制地开发AI,而你却要满足各种”可解释性”要求时,这种劣势可能是致命的。

成本结构的差异也值得深思。GDPR的合规成本虽然高昂——大公司可能需要花费数百万欧元进行技术改造和法律咨询——但这是一次性投入加上可预测的维护成本。企业可以制定预算,分配资源,然后继续前进。

EU AI Act的成本却充满不确定性。不仅是金钱成本,更是机会成本。当你为了满足”可解释性”要求而不得不使用较简单的模型时,你失去的创新机会如何量化?当你的竞争对手推出了更强大的AI助手而你还在等待合规审查时,市场份额的流失如何计算?这种不确定性让企业难以做出理性的成本收益分析。

道德制高点

还有一个常被忽视的因素:公众认知。GDPR打着保护隐私的旗号,容易获得道德制高点。即使是最激进的科技公司也很难公开反对保护用户隐私。但AI监管不同。限制AI发展很容易被框定为”阻碍进步”、”扼杀创新”。在一个将技术进步视为信仰的时代,这种叙事对监管者不利。

谁掌握了权力?

更深层的变化在于权力结构的演变。在清真食品的案例中,个体消费者没有议价能力。但在AI时代,科技巨头掌握着一张王牌:退出威胁。当苹果说”我们不在欧盟发布AI功能”时,受损的不仅是苹果,还有数百万期待新功能的欧洲iPhone用户。当足够多的科技公司做出同样选择时,压力开始转向监管者。

这种动态在GDPR时代并不明显,因为没有公司真的敢完全退出欧盟市场。但在AI时代,”功能性退出”成为可能——你仍然在欧盟销售产品,只是不提供最先进的AI功能。这种策略既避免了完全退出的极端后果,又对监管者施加了压力。

如果我们用博弈论的语言来描述,GDPR时代的博弈相对简单:遵守规则失去一些数据优势但保住市场,不遵守则失去整个欧盟市场。选择显而易见。

但AI Act创造了一个更复杂的博弈。遵守可能意味着在全球AI竞赛中永久落后,不遵守只是暂时失去部分欧盟市场功能。当长期的技术领先地位和短期的市场准入发生冲突时,越来越多的公司选择了前者。

未来呢?

有趣的是,这个故事还远未结束。GDPR刚推出时也曾遭遇强烈反对,但最终大多数公司还是选择了合规。EU AI Act是否会重演这个剧本?

可能的情景包括:监管者和企业最终达成某种妥协,出现”欧盟特别版”的AI产品;或者欧盟坚持立场,导致欧洲在AI时代进一步边缘化;又或者,其他地区跟进欧盟的监管思路,最终形成全球统一标准。

没有放之四海而皆准的社会理论。塔勒布的”最不宽容者获胜”在特定条件下确实成立——当转换成本较低、参与者权力不对称有利于”不宽容者”、没有可行的退出选项时。

但当这些条件改变时,当”宽容者”变成了拥有议价能力的科技巨头,当转换成本高到令人却步,当退出成为可信威胁时,理论的预测就需要修正。

更重要的是,时机至关重要。GDPR来得正是时候——数据经济已经成熟,需要的是规范。而AI Act可能来得太早——当技术仍在快速演进时,过早的规范可能扼杀创新。这就像在莱特兄弟刚发明飞机时就制定详细的航空安全法规,结果可能是飞机永远无法起飞。

从更宏大的视角来说,当我们谈论清真食品时,我们在讨论消费选择。当我们谈论GDPR时,我们在讨论隐私权利。但当我们谈论AI监管时,我们在讨论人类的未来,即,谁将主导下一次技术革命,以及这场革命将如何展开。

一个文科生的职业生涯转型之路

为什么要写这篇回顾

其实很早以前就想对自己的职业生涯以及其中的各种转型做一个深度回顾。最近正好听到以前的好朋友兼同事 tiantian 的播客,她现在成为了小宇宙上的一位主播,在一档节目里正好聊到了30岁的职业转型这个话题。这让我觉得,是时候梳理一下自己这些年的职业历程了。

历程

迷茫的起点:从联合国实习到互联网公司

回想职业生涯的最初期,刚毕业的我其实相当迷茫,不知道自己以后能够干什么。在这种状态下,我申请了联合国开发计划署在土耳其的一个实习项目。现在回头看,这其实是在拖延自己做职业选择的时间,同时参与的各种各样的面试——从顶级咨询公司到大型外企的管培生项目,也可以算是当时迷茫的一个佐证。有些面试有了不错的进展,但更多的则是杳无音信。

最终,我进入了一家头部互联网公司的国际化产品部门,负责内容安全政策工作。能够获得这个机会,很大程度上要归功于之前在联合国的经历。这份工作可以说是我之后各种职业转型的起点和基石。回过头来看,我后续的各种工作其实都汲取了这份初始工作中的某些元素。

第一次转型:从政策专员到项目管理

在内容安全岗位工作一段时间后,由于一些原因,包括与直属领导在理念上的分歧,以及对方认为我的能力与其期望存在差距,我开始寻求转变。恰好在此之前,我参与过一些大型项目的管理工作,表现还不错,于是顺理成章地转型成为了部门的PMO,负责推进各类项目。

这段时期其实大部分时候都挺有成就感的。我的PMO工作做得相当不错,逐渐成为了部门里的”救火队员“。每当遇到各种棘手的问题或者难以推进的项目,大家第一个想到的就是找我来处理。长期在同一家互联网公司工作的经历,让我积累了大量的”组织知识”(Institutional Knowledge)——知道遇到非标准化的情况应该找谁,应该怎么做,以及在一家流程还不够完善的互联网企业里,如何解决各种复杂问题。

然而好景不长。随着部门架构的调整,加上公司战略的变化,大量招聘开始偏向外企和咨询公司背景的人才。整个工作环境开始变得复杂起来,原本简单直接的协作方式被各种繁复的流程所取代。我手上的工作也越来越繁杂难以处理,最终我选择了离开。

回归家乡:从互联网到外企的转变

凭借自己在内容安全领域,特别是内容安全政策方面的经验,我加入了一家知名的游戏公司。然而这段经历并没有持续太久。因为家庭原因,我回到了家乡南京工作。作为一个二线城市,南京的互联网机会相对有限,这也是我最终将目标转向外企的原因。

选择外企还有另一个原因。虽然很多人都觉得以我的个性和做事风格非常适合在体制内工作,但我自己还是比较喜欢相对自由自在的生活方式,也比较反感那些繁文缛节的官僚化作风。相比之下,外企似乎是一个不错的折中选择。

我最终进入了一家外企的数字化中心,以PM加PMO的身份开始工作。这个机会主要源于我之前在大厂的PMO经验——算是以类似的工作背景,换了一个完全不同的行业和部门。

文科生在 IT 世界的挑战

进入这个数字化中心后,我很快意识到自己面临着巨大的挑战。这里几乎所有人都是理工科背景,而我是文科生;很多人都有着丰富的开发经验,而我是个技术小白。这种背景差异带来的不仅是专业上的隔阂,还有沟通方式、思维模式上的差异。

更让我想到,但是没有做好准备的是,外企的PMO和互联网公司的PMO是完全不同的概念。在外企里,PMO主要负责各种流程事务、文档撰写、工具制作等标准化工作。而在互联网公司,PMO的角色更多取决于你和老板的关系,很多时候你像一个项目经理,负责整个项目的推进,需要处理复杂的人际关系,在没有明确流程的情况下把项目推进下去。这是完全不同的工作体验。

当公司期望我向Product Owner方向发展时,新的挑战又来了。作为一个产品负责人,特别是当这个产品并非出自你的创意,你对它也没有特别的兴趣时,要为它制定发展路线图、进行营销推广,真的很难产生内在驱动力。

当然,意愿是一方面,能力又是另一方面。我也逐渐意识到,即使未来我想做独立开发,做自己喜欢的产品,战略规划和营销推广的能力也是必须要锻炼的。这些能力也是我在接下来的日子里需要着重提升的。

新的方向:网络安全治理

基于种种考虑,特别是发现老板对我的期望与我的兴趣存在偏差后,我决定向另一个方向发展——成为网络安全治理。

这个选择可以说是我再次汲取了第一份工作中的元素——”安全”和”规则”。虽然内容安全和网络安全是不同的领域,但两者还是有很多共通之处。在这个新岗位上,我能够相对回到自己的舒适区。

但很快我就发现,在一个技术驱动的网络安全部门做政策工作,如果没有技术背景,很容易被认为是在做”花架子”。要想在这个领域获得认可和发展,至少需要了解技术,这样才能在制定政策时更加务实,也更容易获得技术同事的尊重。

这也成为了我当前的另一个重点发展方向——通过考取 CISSP 之类的专业认证来系统学习网络安全知识,让自己能够更好地融入这个技术主导的行业。

如何在”格格不入”的环境中生存

在外企数字化部门工作,作为一个文科背景、非技术出身的人,我不可避免地会感到某种程度的格格不入。由于之前在海外生活和在一线城市工作的经历,我的兴趣爱好、处事方式都与大部分同事存在差异。这种情况下,如何融入就成了一个重要课题。

首先,最重要的是心态调整。我渐渐明白,并不需要强行融入所有人的圈子。保持自己的特色,同时尊重他人的不同,这本身就是一种成熟。

此外,我开始主动寻找那些与自己有相似背景的同事。虽然人数不多,但总能找到一些有海外经历或互联网公司背景的人。与他们的交流让我感到不那么孤单,也能形成自己的小圈子。

最后,与其努力融入别人的圈子,不如以自己的兴趣爱好为中心创建新的 community。比如我喜欢打网球,就组建了一个网球俱乐部。作为发起人,我可以按照自己舒适的 规范来组织活动——不需要频繁聚餐,不需要在群里发红包,只是单纯地因为共同的运动爱好聚在一起。

写在最后:关于转型的一些思考

回顾这些年的职业历程,每一次转型都不是突然的决定,而是基于当时的处境和长远考虑做出的选择。从内容安全到项目管理,从互联网到游戏公司,再到外企,最后聚焦于网络安全——看似跳跃的轨迹背后,其实有着内在的逻辑。

每一段经历都像是拼图的一片,看似零散,但最终会组成一幅完整的图画。我从第一份工作中获得的”安全”和”规则”的基因,在兜兜转转后又回到了我的职业主线上。而中间积累的项目管理经验、跨部门协调能力、在不同企业文化中的适应能力,都成为了我独特的竞争优势。

以前的一个老板写过的关于职业生涯发展的一篇文章现在看来还是常看常新,比这篇要好很多,也有好多干货,值得记录一下

职场新手出村之路-上

职场新手出村之路-下

未来的路还很长,我会继续在网络安全领域深耕,同时保持开放的心态,迎接新的可能。毕竟,正是这些看似”跨界”的经历,造就了今天独特的我。

Context 的重要性;小红书+淘宝

终于听完重轻和孟岩的播客,他们推荐的里克鲁宾的书很有意思,准备抽空看看。他们主要讲的是创作过程,强调创作要源于个人真情实感,源于自己想表达的东西。

当然他们可能更着重创作系统内容,不愿追逐时事。而我这种俗人,大概每天确实被各种信息轰炸。自然,我的博客也会有很多相关内容。其实,我以前常会尴尬,或不愿在公众面前谈论对时事的看法。但他们的对谈也启发了我。许多想法应当被表达出来,日后回看,会发现自己当时要么是幼稚,要么是因为时局不同、信息不同、情绪不同,而产生了不同的判断逻辑。以后可能会随感评论生活或社会事件。

Context 的重要性

听重轻和孟岩的播客时,听到一段很有感触的对话。他们从祛魅聊起,引申开去。现在许多人沟通时,倾向于过度简化。听到“无非”、“不过就”这类词时,往往不代表说话人想用简化语言来概括,提炼精髓,而更多是接收者不愿费力研究或了解背景,因而过度简化。这也解释了为何日常生活中安利是件很难的事。感受作品的最佳途径永远是感受,而非分析。因为分析时,你会丧失对整体美感的体会。就像把事物掰开揉碎,你只能得到碎渣;而感受到的更多是情景、是 context,这是分析和阅读理解所无法体会的。你只能体会它为何牛逼,却不能体会它为何美。

这让我想起之前和 Jotmo 开发者聊天时,谈到 context的 重要性。记录时,context 非常重要。比如,回顾收藏的帖子,判断是上班摸鱼、通勤途中,还是专心阅读时收藏的,再结合笔记,能触发不同思路。这不仅关乎当时的思绪情感,也会让潜意识回忆起相似场景下的其他记录。同样,只有结合当时context,才能反映当时最真实的感受。

小红书和淘宝打通

小红书与淘宝打通,允许用户从图文直接跳转淘宝,堪称一招妙手。小红书商业化此前进展缓慢,主要是因为难吸引商家专门经营其平台内容,商家也无从得知“种草”效果。而一旦能跳转淘宝,转化效果即可量化,平台吸引力便会大增。此举有可能会限制小红书自身电商业务,但着眼平台整体发展,实为做大了蛋糕:先贯通“宣传-种草-购买”的流程,待用户习惯养成后,再图自身电商发展,可能比从零开始效果会更好。

社区调性

然而也应看到,内容或社区平台商业化提速后,可能严重冲击社区特有的氛围。当下的小红书即是典型例证:平台问题已相当严重,营销号大量涌入,令大家能看到的真实生活分享日益减少。

同时内容创作者为提高带货效果,内容可能趋于同质。当然,小红书社区尚属多元,其长尾内容有助于覆盖更细分的用户群体,但小红书的社区运营团队也需善加引导和管理。

消费习惯

至于先让用户养成消费习惯,再借此促进小红书自身商业化的想法,其实存在变数。用户养成的习惯,究竟是在小红书看中商品后跳转淘宝购买,还是在小红书内部完成了从“种草”到“决策”的整个过程?若是前者,小红书日后推广自有电商时,如何克服用户路径依赖、将他们拉回平台,将是一大难题。

不过,抖音此前的转型路径可资借鉴,毕竟其平台转型颇为成功。抖音早先也曾与淘宝等平台合作,虽经阵痛,但其电商能力随后迅速提升。

对 B 站也是种参考?

B站某种程度上或可借鉴这种做法法。可惜考虑到社区调性,B站要打通购买流程难度较大。其内容少有“种草”性质,多为硬广,与小红书不同。不过这也算一种开源节流之法。

B站商业化向来步履维艰。无论是贴片广告受限,还是特有的社区氛围,都使其商业潜力难以充分发掘。与平台合作直接导流算是一条思路,但对B站长远发展而言,恐怕只是权宜之计,难治根本。当然,对B站这样体量的公司,此法或许就已足够了。

Links + Notes

边听明日方舟歌单边摸鱼;AI 对人和社会互动的影响

终于从团建的忙碌中解脱,能静心做些喜欢的事了。之前提到要将 Voicenotes 整合进博客工作流,实践后体验确实不错。特别是发现 Voicenotes 能与 Readwise 互通,其价值又上了一个台阶。目前来看,Voicenotes 除了偶尔理解有偏差,整体表现相当不错。

这周另一有趣尝试是接触了 Vibe Coding。说来也巧,正好赶上 Lenny’s Newsletter 的福利活动,订阅即可获得 Cursor、Replit 等主流 Vibe Coding 工具一年使用权。 作为编程新手,我借此机会实际体验了 Cursor。目前只用它写了个简单脚本,确实感到很便捷。不过用它开发完整应用程序还是有些犹豫。可能需要先打好编程基础,才能更好利用 Cursor。

我之前也订阅了 Genspark 这类 agent 工具。对编程新手来说,简单试用后,感觉 agent 工具可能更友好。不过现阶段还是先专注学习和实践,等积累更多经验后再总结体会,说不定那时才会发现 agent 的局限。

此外,最近一直在调整工作流,发现必须调整当前的输入方式。现在每想记个笔记,都得粘贴到好几个地方(如新枝、Tana、Dinox、Voicenotes、Heptabase),因为可能在多处汇总或搜索。这种状态不可持续,甚至不如当初统一在 Drafts 输入,再一键分发,现在先做了几个 Drafts action,后面看如何整合。

此外,这两天也在试用 Calflow。之前一直想要找一些时间管理的工具,但是像 3×3 之类的工具也一直不大好上手,而且颜值也不怎么样。这两天在小红书上从一个 notion 博主那里顺藤摸瓜,找到了 Calflow 这个软件,感觉挺有前景,考虑用一段时间试试。


音乐在工作和学习中的不同

前两天工作时,照常打开网易云,播放明日方舟歌单,不知不觉就过了近两小时。一边工作一边多次被感动。Rap 有 Yanking 和桥夹克里夫的 boss 曲(mai 竟然是作曲+编曲!),《总辖之愿》太好听了(才知道最后四个关卡名连起来是“恩怨纠葛,散于星辰之间;留下之人,推开未来之门”)。

听着听着,想起一个有趣的问题:发现听音乐工作,效率会极大提升。哪怕中间会因音乐的旋律、情感、歌词而下意识看评论或停下工作专心听歌,但整体工作效率反而提升了,很顺畅地就进入了心流状态。

而这和我平时认真学习时的感觉正好相反。认真学习时听音乐,有时反而让我分心,无法集中注意力。于是我问了问 Gemini Pro 2.5,想看看这个问题是否有较科学的解释,结果挺有意思。

AI 表示,工作场景下,音乐之所以有助益,是因为工作本身重复性高,不需太多密集思考,大多是自动化操作,占用认知资源少。这样一来,注意力尚有余裕,音乐反而能屏蔽环境干扰,让我们更容易把注意力保持在工作上。同时,由于多数工作任务我们已熟练,不需深度分析,内在认知负荷较低;音乐带来的积极情绪,反而能促进认知资源的有效利用。

学习则不同,它本质上需要高度集中注意力。音乐会分散注意力,争夺认知资源,带来较高的认知负荷。

近期对 AI 对人和社会影响的摘抄和思考

近期阅读中,有不少关于 AI 对人和社会影响的摘抄与思考,这里分享些简单感想,若有时间再详细展开。

AI 会提高还是降低人的思维能力?

最近在即刻上看到,有人认为 AI 对人类思维方式构成一大威胁。它会给人一种思考幻觉。AI 出现前,普通人与各领域精英的最大差异,在于能否结构化地思考和输出。而目前的 AI,尤其是最新的,结构化能力较强。它们会拆解问题、任务并逐步完成,展示结构化过程,让用户误以为自己也能结构化思考。

这对经验或知识不足的人来说,其实比较危险,因为它取代了他们锻炼结构化思维的过程。他们在学习和提升中会失去一些附带收益,这些收益有时是纯知识,有时是锻炼出的思考能力。从某种意义上讲,这会让人的成长缺乏所谓的 context,而 context 在完成工作和个人学习成长中都非常重要。因为你有时假装获得了能力,但 AI 并不知道你实际经历过什么。同时,这种 context 也是我们未来应对不同事物时的潜在经验与知识,这些无法通过 AI 获得。

这让我想起 Neo 在其 newsletter 中介绍的一篇文章。该文根据微软和卡内基梅隆大学的调查,分析了 AI 工具如何从不同维度重塑人类工作方式。在 AI 时代,人虽将部分功能让渡给 AI,但人的作用反而更核心,集中于验证信息、整合输出、监督任务。人的工作变得‘高抽象’和‘高风险’,需要更强的判断力,并承担更多决策风险。

AI 真的带来了平权吗?

讨论新技术影响时,会发现 AI 与科幻小说、游戏中描绘的某些技术(常导致赛博朋克世界)既相似又不同。在那些世界观里,新技术常由政府秘密研发,某些人率先秘密使用,从而获得对普通人的巨大优势。而 AI 的情况是,AI 平权是 AI 时代的默认特征,还是只是历史发展过程中的一个短暂“黄金时期”?当前 AI 发展初期,是自下而上发展,所有人平等使用同等智能的 AI。但当 AI 发展到一定程度,若普通人可用的 AI 能力触及企业成本上限,且富人能用金钱购买到显著更优的 AI 时,社会阶层问题恐将重现。

AI 时代,语音的影响被忽视了

另一项观察是,我发现许多 AI 开始强调语音交互。这种交互一方面极大地方便了用户操控电脑、手机及 AI,另一方面,它会重塑每个人的工作习惯,乃至人际交互模式与社交关系。

例如,以往在工作空间,每个人的工作都相当私密。而一旦工作转为通过语音沟通,人与人的工作空间就必然交织。这种交织目前看来无所谓好坏,但必然影响人在工作中如何把握与他人的距离。也许将来大家会更注重隐私,甚至可能反而更少关注隐私。这些都值得继续研究。

AI时代,我们还需要个人知识管理吗?

最近看到了一篇文章 人工智能与没有斑点的长颈鹿,作者提到,人工智能的训练原理导致,所有答案都趋向主流,继而抹杀各种非主流的观点与个性。

而在日常生活中,随着 Deepseek 的迅猛发展和广泛应用,长辈们开始将其视为AI的代名词,并逐渐将这些工具融入日常生活中。

对于那些此前较少接触人工智能技术的人群而言,他们自然倾向于直接向AI提出各种问题,更令人担忧的是,他们往往将AI的回答视为绝对真理。这一现象令我想起之前关于知识管理的讨论,有观点认为AI代表了知识管理的终极形态,即个人知识收集是没必要的,因为AI可以提供答案。

遇到问题问AI就行了?

虽然我坚信应该将AI有效整合进我们的知识框架中,每个人都应培养使用这些工具的能力——但这种整合应该是对个人知识管理和独立思考的补充,而非替代。

“遇到问题为何不直接询问AI?”我们越来越常听到这一表述,而这一普遍看法存在显著的逻辑缺陷。

许多问题并不存在单一、确定的答案,然而AI系统通常提供看似权威的响应。这并非表示AI始终产生相同的答案,而是当前大型语言模型的架构——主要基于主流材料训练——自然会生成反映主流观点的输出。因此,非主流观点在AI回答中因训练数据中的权重较低而被削弱。

文明的真正丰富性往往体现在这些非主流的、长尾的内容领域。当我们集体放弃独立思考,忽视多样化的视角、观点和事实诠释时,文明发展和个人成长都将受到深远影响。

知识获取路径的转变

另一个引人深思的视角认为,AI对新生代最具革命性的影响在于从根本上改变了知识获取方式。历史上,人们主动搜寻知识——回溯更远,互联网前的世代甚至在开始搜索前就需要投入专门的学习过程。今天的技术演进已逐步简化了信息获取流程,实现了直接检索答案而完全绕过搜索阶段。

这一转变本身好坏并无定论,但出于每个人锻炼思维的角度来看我们必须主动收获、处理并内化知识,探索多元视角,最终形成自己的观点。

在我个人的知识管理实践中,我优先将那些能激发思考的内容归档至知识仓库。AI主要作为组织和搜索助手,而非权威答案来源——这一关键区分保留了我对我的知识筛选的自主性,并能充分利用AI的优势,来增加效率。

让时间解决问题

人与人之间,悲欢各异,需求亦不同,即便在同一家庭中关系极为亲密之人亦是如此。这是因为各自所处之位置不同,所面对的人群不同,自身经历有别,世界观存在差异,当下需求也不尽相同,所处时间阶段更是各有不同。如此一来,当面对同一事件时,人们看待它的视角、做出的选择,以及即将面临的后果,乃至自己对其投注的情感与承受的压力,自然都会有所不同。

在不少小说里,我们常能看到描绘此类场景的情节。此时,作者往往会借主角之口道出:“问心无愧即可。”然而,“问心无愧”,说起来轻松,真正践行却谈何容易。毕竟每个人都置身于社会之中,当你觉得对自己无愧时,对于身边某些人而言,却极有可能是有所亏欠的。最终,不过是在其中进行权衡罢了。

很多时候,一件事在当下似乎能找到解决思路,却又难以即刻解决。在这种情况下,将其置于时间的长河之中,等待时间给出答案,不失为一种良策。不必非要在当时当下就对某件事给出最终定论。选择或假定最终要达成的效果及实现路径时,更为关键的是要明确自己想要实现的目标,并以此为基础,在每一个关键时间节点,依据不同情况做出最契合最终目标的选择。

Shortform

点赞是数字时代的握手。是说”我看到了” “我懂你””我支持” “继续加油”。它像一个会心的微笑,一个默契的眼神,一个轻轻的点头。

评论是对话的渴望。当一个人决定写下评论,而不是简单地点个赞,这意味着内容触动了他内心某个角落,激起了涟漪,这涟漪强烈到必须用语言表达出来。

——李继刚


deepseek 仿佛成为了一种需求。但是,deepseek 是需求吗?——Lightory

Deepseek 是一种需求吗?对大部分需要追上热点,避免掉队的公司来说,确实是种短期需求

Deepseek 是每个人都需要的需求吗?不是,大部分人都是出于FOMO,以及来源于对AI的不了解

Deepseek 不是唯一的方向,算法时代,马太效应大大增强,也增加了所有人的焦虑。当前所有人,所有人一窝蜂地接入deepseek,反而有可能抑制了其他类似的产品的发展


Links