语音转文字正在改变我们的生活——兼简要横评市面上的语音转文字笔记软件

自从 Whisper 模型出现以来,语音转文字就成了我的写作流程中非常重要的一环,之前也写过一些文章分享了 AI 语音转文字的一些用法。而随着越来越多人开始使用语音转文字、越来越多相关的软件出现,这一「便捷」的输入方式也为越来越多人所熟知。在以前文章中也提到过,人工智能可能对人类社会生活方式造成许多改变,包括日常创作、人际交往乃至工作方式都迎来了诸多变化。最近我发现,这些变化已切实地体现在我身上。

近期写作上的一些变化

以前写文章的时候,我通常是有想法就直接用手机打开 Flomo 记录灵感,有空时在就随便找个咖啡店、或者在高铁、飞机上用iPad上打字成文。但最近在记录灵感时,我越来越多地通过语音来记录了,而使用语音时,出于「语音尴尬症」等原因,下意识地会避免利用一些在公共场合的零散时间进行片段的输入。更多是希望能找到一个相对空闲的时间、相对独立的地点,用语音来完成整体草稿的撰写。

这其实和我一开始想的「语音有利于片段化的输入」这一想法出现了很大的区别,也引发了进一步的思索——语音输入和键盘输入的区别到底有哪些,而语音输入对我们又会产生什么样的影响。

语音输入 vs. 键盘输入

思维模式

如果用一个简单的比喻来描述什么是键盘输入和语音输入,以及他们之间的区别,文字输入其实有点像我们是在一块砖一块砖地来「建一座房子」。在这个过程中,我们可以随时停下来审核结构,发现不满意的地方就拿掉,然后重新垒上,同时,我们可以交替着在多个地方开始垒墙。这个整个过程是异步、非线性的过程。在这个过程中,我们会经常需要做修改、拼接等等。经常写作的人也会有这种感受,我们会对每一个句子、每一个段落、每一个词进行琢磨,当我们写完一句话时会回头看看,删掉几个字,或立刻做出修改。

相比之下,语音输入更像一条「河流」。思想如水流,说出的话直接奔涌向前。我们无法让河流暂停,回到上游修改水流,只能保持它从头到尾流动。这过程同步且线性,需要不受打扰的环境。

为何会有这种差异?一个原因是认知摩擦力不同。打字时,我们经历思考、选词造句、寻找按键、拼写,然后看到文字出现,整体是一条很长的链条。语音输入则更容易进入心流状态,因此我们希望有个不受打扰的环境,一旦进入状态就不停下。写作时注重的会是思维的连贯表达,而非单个词语的完美与否。

同时,打字和语音输入调用的思维模式也不同。书面写作偏向逻辑结构和分析,讲述则偏向故事思维。讲故事追求连贯完整,写作的逻辑思维则完全不同。

我们并非说河流模式一定比建筑模式好,或更代表时代发展方向。相反,这是每个创作者面临的取舍。

效率

语音转文字技术对写作最直观、最可量化的影响,毫无疑问在于对效率的颠覆性提升。人类说话的速度远超打字,那自然,只要有足够的内容储蓄,能够维持输出强度,那么自然在相同的时间下,就能够输出更多的文字。不过需要注意的一点是,语音转文字也导致了编辑负担的转移。在起草阶段所节省的时间,一定程度上被转移到了编辑阶段。

正如上文所说,口述生成的初稿往往是未经加工的「原材料」,需要大量重写和结构调整才能成为合格的书面语。因此,语音转文字带来的生产力提升,其实并非简单地缩短了总时间,更多是重构了时间分配。

对于那些在编辑上比较苦手的人来说,实际上可能并不能减少他们总的输入时间。而真正的效率提升,属于那些能够成功适应新的两阶段工作流程,并掌握相应编辑技能的写作者。

对文字本身的影响

语音转文字技术对写作带来的转变远不止于效率,它也在潜移默化地改变文字本身的特质。

既然文字来源于口语,那写作出来的文本也自然会更加倾向于对话式的风格。这种风格在某些博客、介绍性文章中自有其优势,能营造出一种亲切、自然的氛围,但若讲述者本身不擅长讲故事,则有可能会囿于流水账的困境。

这也就引出了语音转文字所带来的潜在问题,即会导致行文冗长、结构松散。在我的语音转文字写作中就经常出现这个问题, 由于思考和写作是同时进行的,而人在思考的时候会不自觉地重复自己的观点,以保证逻辑的连贯性。当这种思维落在纸面上,就很容易会出现大段的重复。

影响不止于写作?

语音转文字所带来的影响不只局限于写作,它对于我们人与人之间的沟通,乃至于人与生活之间的互动都会带来很大的改变。

人和人之间的沟通模式

举个例子,语音转文字对工作中人与人之间沟通就会有很大的影响。以前当我们开会时,除非额外注明有人来专门做会议纪要,不然很多时候会议的内容是无法追踪的,人们相对而言就可以更加畅所欲言一些。而随着语音转文字技术的运用,所有的会议都可以留痕,这也就导致人们在线会议时会更加谨慎,更加注重自己的措辞,对于自己所抒发的内容会有更多审慎的考虑,会避免随意输出可能对自己或他人不利的内容。

这一方面使得同事与同事或者说不同部门之间的沟通变得愈发困难,但在某种程度上也增加了线下人与人之间沟通的重要性。在工作中,人们可能更加会倾向于线下的会议,或者说在茶水间等非正式场合的碰面。所以说,语音转文字技术在工作中可能会导致地理位置相近的人之间的关系变得更加紧密,而对于位置相对较远的人而言,反而会加深他们之间的隔阂。

人和社会之间的交互

语音输入正在重塑人们执行日常任务的方式,培养了新的行为习惯和用户期望,例如,人们期待技术能够提供即时、准确和个性化的响应 。然而,这种行为转变也面临障碍,包括用户对设备全部功能认知不足,以及在公共场合使用语音命令的社交尴尬感 。

而对于人与社会,以及人与社会中的一些事物的交互而言,也带来了很多的改变。语音转文字的效率大大优于传统的写作,人们在工作中也会更加依赖语音转文字,这就导致了人们工作范式的一定改变。很明显,在那些所有人坐在一个场合进行工作的场景下,语音转文字可能并不适用。人们会避免自己的隐私被探听,同时也担心会影响到别人。因此,在工作场所里,人们可能会需要更多个人的空间,或者更多可以短暂使用的个人空间,如电话间等。而这也同时进一步导致了人们工作节奏的加快。由于信息产生和处理速度的提升,人们的工作压力也会进一步增加,并且也会要求人们掌握更多的语音输入技巧。由于语音天生是流逝的,它也会要求人们学会怎样说出结构化的内容,这对人们的思维模式的要求其实更高了。

对社会的深层影响

而对社会交互的深层影响而言,优点自然在于,它在功能上进一步增加了信息的民主化程度。由于不善于打字的人也因此能够更加轻松地创作内容,在一定程度上降低了内容创作的门槛,同时也为那些文盲、不擅长书写打字,或者有手部残疾的人提供了一个相对公平的表达渠道。

而对于文化而言,语音转文字带来的可能更多是一些负面影响。相对而言,社会公平虽然在一定程度上缩小了阶级之间的不公平,但是对于不同语言、不同族群人之间的公平程度反而有可能是一种放大。那些使用少数语种或者有特殊口音的人会因此丧失快速输出的机会,和主流人群之间的差距会进一步扩大。而且语音转文字在主流语言上的优势也会随着语料增加而进一步增加,一些地方语言很有可能会加速消亡。当然,这里面也有一些反例,人工智能也可以用来保护或识别一些比较古老的语言,这取决于人们如何使用人工智能技术。

第三个变化更多在于认知模式上,人们通过语音随时记录想法,这改变了大脑处理信息的方式,就像我们之前所说的「建筑」和「流水」之间的区别。这长期对于人们的思维方式也会有负面影响,一旦人们习惯于随时随地记录自己的语音,自然的记忆能力反而可能会被削弱。

简要横评常见的语音转文字软件

下文会对我使用过的一些语音转文字软件进行一些简单的评述。特此声明,我仅评测我付费使用过的产品,且不打总分,因为不同维度对不同人来说有着完全不同的权重。篇幅所限,每个软件仅作简单评述,如有需要详细介绍,可以在评论区留言,后期有时间了可能会写更详细的文章。

语音+笔记

TL;DR

AudiopenVoicenotes闪念贝壳FlomoDinox
价格早鸟⭐⭐⭐⭐⭐订阅⭐买断⭐⭐⭐⭐订阅⭐⭐⭐⭐⭐买断⭐⭐⭐订阅⭐⭐
UI/设计⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
输入便捷度⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
AI 能力⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
上传录音⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
集成能力⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
附加功能⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
开发者能力⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
未来预期⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐

Audiopen

在所有语音转文字笔记软件中,Audiopen 应该是最早出圈的一个产品。早在2023年它就诞生了,作者从来没有编程经验,通过 vibe coding 创造了这款产品。

由于它当时昂贵的定价,也激起过一些讨论。Audiopen的 UI 以及语音转文字的准确度在所有产品中都是最佳的。去年,它也开发出了 app 端,在易用程度上也很优秀。它的后端集成做得也挺好,可以自动把转录及AI修改好的内容发送到 Notion,或通过 webhook 发动到其他自己想要管理的软件之中。综合来看,作为这个行业里的先驱,除了价格较贵之外,没有什么值得吐槽的问题。

Voicenotes

如果你错过了 Voicenotes 早期的 50 美元早鸟价买断的话,那这可能是语音转文字笔记软件用户最大的遗憾之一。

Voicenotes 在所有笔记软件中可以说是综合了价格、 UI、设计逻辑、后期的集成等最好的一个产品。Voicenotes 的设计非常克制且优雅,无论是极简的设计还是对于 AI 改写的克制,在使用便捷度上是首屈一指的。

它既支持在 App 中进行转录,也支持上传语音文件进行转录。除此之外,Voicenotes 还支持通过一个叫 Pages 的功能来把自己的语音转文字发布出去,形成自己一个非常微型的博客。我也把它作为我个人博客的一个补充,记录一些我个人的日常闪念。同时,它也支持 AI 问答等功能。

值得一提的是,Voicenotes 的作者是 Buy me a coffee 的作者,因此信誉度相对可靠,暂时不用担心跑路。

综合下来,Voicenotes 是我在所有笔记软件中使用语音转文字的频率最高的。而且它同时支持网页端、手机端以及苹果手表端的输入,这让它的使用场景得到了大大的拓展。近期,它也更增加了在桌面端的快捷输入,并且更加扩展了它自己的使用场景。

闪念贝壳

闪念贝壳其实是先在海外做起来之后才拓展到国内的,在外区它的名字叫 Ideashell。作者不愧是设计出身,它的外观设计非常优美,UI也很简洁美观,对颜值党来说用着非常舒服。

而另外一个特色则是它与其他各种软件的集成。打开软件(或通过小组件/action button),录入一段语音,生成的内容,可以被非常便捷地立刻发送到包括从微信、提醒事项到 Notion、Obsidian、熊掌记、Craft、滴答清单、Day One等一系列笔记软件中去,在操作的便捷度上毫无疑问是在所有软件中最佳的。

此外,闪念贝壳支持上传录音文件进行转录,并且支持区分不同发言人,这个功能常被我用于临时会议记录。

Dinox

如果说闪念贝壳是典型的设计师作品,那么 Dinox 则是典型的工程师作品。

如果要论各种与 AI 相结合的功能最齐全、设置最复杂的产品,Dinox 非他莫属。它支持从语音转文字到后续的结构化处理、相关笔记、AI 聊天等一系列功能,甚至还支持手机端检测存储,并且包括 S3 等不同的对向存储。

可以说,所有你能设想的与笔记相关的功能在 Dinox 都有。但自然,缺点也是存在的:它的操作设置过于复杂,入门相对较为困难,且当前阶段 bug 较多;在美观上与其他几款产品相比略有缺失。同时,由于作者想法很多,整体作品割裂感比较强,并没有一个明确的产品特质。

但是,作者的更新频率以及响应速度非常之快,几乎每隔几天就有一个新版本,可以说是未来可期的一个选择。

Flomo

其实早在 AudioPen 流行之后,我就和少楠提过在笔记软件中加入语音转文字的想法。但当时他们觉得需要先研究语音转文字是不是一个笔记软件的刚需,以及如果真的加入了,如何进行最符合他们产品逻辑的设计,谁料这一研究就是两年。

对于他们这个解释,一开始我和其他挺多人一样,觉得他们只是出于成本考虑而拒绝做出一些新的尝试。也因此,我尝试了其他挺多速记软件。

几个月前,Flomo 终于加入了语音转文字。并且我也很欣慰地看到他们确实在里面融入了自己的想法。相比于那些着重于语音输入后,对笔记进行很多基于不同prompt调整的软件而言,Flomo 不支持自定义prompt(对不少人来说这是个缺点),非常注重写作者原来的结构,仅去除了一些常见的口辟等。

这其实也和我对于笔记的看法不谋而合。之前我也尝试过通过很多预先设置好的 prompt 来对自己的语音输入进行大幅度修改,但最后却发现这些修改过的笔记虽然看起来更加精致,但很多情况下并不能反映我自己的原意。亦或者,当我事后回顾的时候,总感觉这些笔记有些陌生。正如少楠和Lightory 想传递的笔记理念,只有那些在我们用自己的理解记下来的内容,才是我们当下最真挚的表达。我们自己通过思考来进行的重新编辑,也能让我们对自己的笔记有更深刻的印象。

此外,这半年支持的 AI 搜索和最近引入的 AI 洞察也很有想法,能帮助用户发现笔记和笔记之间的关联——虽然 Voicenotes和Dinox也支持类似的功能,但从易用程度以及完成度上来看,后两者只能称得上有这个功能,远远不算好用。

说了这么多,Flomo 当然也有一些问题,比如说他的语音笔记最长只能支持五分钟,对生成的内容会进行自动审核,替换掉一些不当语句,并且不支持同步到其他软件等。但从使用的易用性上,以及语音转文字这一功能本身的实现的完成度上,Flomo 还是做得很好的。

其他:Get笔记、即我笔记、Reflect、Tana、Workflowy等

这里提到的这些笔记软件并不代表市面上所有支持AI语音转文字的软件,还有几款可以简单提一下。

如果把市面上的语音转文字软件分成两类,一类可以算是所谓的「AI 原生」笔记软件,另一类则是「AI+」笔记软件

其中,Get笔记和即我笔记,以及这两年在即刻、小红书上各种独立开发者各种宣传的层出不穷的新软件大都是在AI语音转文字出现之后而诞生的。他们在从初始阶段就兼顾到了语音转文字的开发,但因为我使用的不多,也建议大家去找其他的评测。

而后面提到的这几款Reflect、Tana、Workflow则是基于已有的笔记软件的基础上,把语音转文字融入他们的工作流。其中,Tana毫无疑问是其中做得最好的一款。AI 已经成为其完整工作流中的一环。它既支持会议的转录,也支持日常的手机端以及电脑端的语音输入。此外,Tana还能在输入之后用AI对语音转文字的内容进行进一步修改,自定义化非常强。

但由于这几款都需要比较昂贵的订阅费,在性价比上,如果只是把它作为语音转文字软件而言,相对会比较低。不过,如果能把它们与自己的工作流结合起来,或者作为自己的知识库所在,那是可以考虑的选择。

语音转录输入法

桌面端的语音转文字输入法也有不少选择,最主流的包括 Superwhisper、Wispr Flow等,甚至 Voicenotes 近期也推出了 Mac 端的输入法软件,只需按住快捷键,就能直接把语音转文字输入到当前的文本框内。

由于我日常输入不依赖于 Mac,对这方面没有很深的研究,可以参考Edison的这篇文章来了解更多的细节 https://linux.do/t/topic/833194。

语音输入是 AI 时代的唯一正解吗?

语音转文字软件确实加快了我单一文稿撰写的速度,例如这篇文章有 50% 的部分是通过语音输入完成的初稿。但回头看来,寻找具有仪式感的环境进行语音输入这一行为反而对我创作构成了新束缚。

以前我能在等地铁、午休时花几分钟,用手机或iPad快速写出文章一部分。然而习惯于用语音写初稿之后,我的零散输入时间反而变少了。

未来创作中我可能需要区分不同类型文字,采取不同写作方式。对偏向故事型、记录型的内容,使用语音可能更方便;对偏向书面信息的写作,找个安静地方写可能更好。更或者,在大部分情况下,我都会更加倾向于用打字的方式来进行写作。因为无论是在摘录闪念,亦或是在长篇梳理自己想法的时候,这种字斟句酌的输入方式都更有利于我理清自己的思路。并且,它能更加有一种创作的真实感以及仪式感。毕竟,有时候仪式感本身也是创造力的来源之一。

而对于每个创作者以及记录者而言,根据自己所处环境、惯用设备而选择最适合自己的创作方式,是每个创作者都需要面临的课题

为什么塔勒布的“最不宽容者获胜”在AI时代不管用了?

2018年,欧盟 GDPR 的实施掀起了全球数据保护的新浪潮。这部被称为”史上最严格数据隐私法”的法规不仅改变了欧盟境内的数据处理规则,更通过”布鲁塞尔效应”,将其影响力扩展到全球范围。然而,当欧盟试图将这种监管模式复制到人工智能领域时,情况似乎有了微妙的变化。

2023年12月,欧盟就 EU AI Act 达成初步政治协议,标志着全球首个综合性AI监管框架的诞生。这一时刻让人不禁想起2015年12月GDPR文本达成一致的场景。然而,与GDPR相比,AI法案面临的挑战似乎更为复杂,科技巨头的反应也更加激烈。

什么是“最不宽容者获胜”?

最简单的例子,为什么前些年,我们发现,越来越多的产品、越来越多的饭店开始贴着清真认证标签?答案在于一个简单的不对称性:穆斯林消费者只能吃清真食品,而非穆斯林消费者可以吃清真食品。

当穆斯林人口达到一定比例,或者占有一定舆论声量的时候,食品生产商面临一个选择:要么生产两条产品线,要么统一采用清真标准。由于清真认证的额外成本相对较低,而维护两条生产线的成本较高,理性的选择是统一采用清真标准。

这就是”最不宽容者获胜”的精髓:当转换成本较低时,整个系统会向最严格的标准倾斜。

放在现实生活中,则体现为当一个坚定不妥协的少数群体与一个较为灵活的多数群体相遇时,整个系统往往会向少数群体的偏好倾斜。

GDPR:理论的初步验证

GDPR的实施过程似乎验证了塔勒布的理论。作为”不宽容的少数群体”,欧盟通过GDPR设定了严格的数据保护标准。尽管科技巨头最初表示担忧,认为需要大规模调整政策和程序,但最终还是选择了合规。

这种合规不仅仅是因为高额罚款的威胁(最高可达全球年营业额的4%),更重要的是,维护多套数据处理系统的成本远高于统一采用GDPR标准。结果是,许多公司不仅在欧盟市场采用GDPR标准,更将其推广到全球业务中。这就是所谓的”布鲁塞尔效应”——欧盟的监管标准成为了事实上的全球标准。

AI法案:理论的滑铁卢?

然而,当欧盟推出AI法案时,科技巨头的反应却截然不同。与GDPR时期相比,它们对AI法案表现出更为强烈和一致的反对态度。这种差异化的反应背后究竟隐藏着怎样的逻辑?

GDPR主要被视为一项数据治理和隐私合规的挑战。它规范了数据处理方式,但并未从根本上改变科技公司的商业模式。相比之下,AI法案被认为直接触及了AI技术的核心——它不仅规范了数据如何使用,更涉及可以用数据构建什么,以及谁对其效果负责。

对于GDPR,大型科技公司虽然面临高昂的合规成本,但也从中获得了意外的战略利益。GDPR的复杂性为小型竞争对手设置了准入门槛,从而巩固了大型企业的市场地位。这种”二阶效应”影响了它们的决策逻辑。

而AI法案则不同。科技巨头认为,这项法案可能会从根本上威胁其在AI领域的领导地位和未来增长潜力。它们担心严格的监管会削弱欧洲AI模型的竞争力,甚至可能将市场份额让给其他地区的竞争对手。

相似表象下的本质差异

要理解这个谜题,我们需要深入到细节中。GDPR和EU AI Act看似相似,实则有着根本性的差异。

首先是合规的确定性问题。GDPR的要求相对明确:获取用户同意、提供数据删除选项、确保数据安全等。虽然实施起来繁琐,但至少企业知道该做什么。相比之下,EU AI Act充满了模糊地带。什么算”高风险AI应用”?如何证明一个深度学习模型是”可解释的”?当技术本身还在快速演进时,如何制定固定的合规标准?

更关键的是对核心业务的影响程度。GDPR主要改变的是数据处理流程——你仍然可以做社交网络,仍然可以投放广告,只是需要先获得用户同意。它就像是给汽车加装安全带,麻烦但不影响汽车的本质功能。而EU AI Act直接触及产品的核心。它可能要求你的AI模型必须是可解释的,但对于依赖深度神经网络的现代AI来说,完全的可解释性在技术上可能根本无法实现。这就像要求汽车必须能够飞行——不是改进,而是改变本质。

谁是”最不宽容者”?

在GDPR的案例中,欧盟作为”不宽容的少数群体”,成功地将其数据保护标准推广到全球。然而,在AI法案的博弈中,局面变得更加复杂。

一方面,欧盟仍然试图扮演”不宽容者”的角色,坚持其对AI的伦理和安全标准。另一方面,科技巨头在捍卫其核心利益和创新自由时,也表现出了极高的”不宽容”程度。它们通过密集的游说活动、公开表态,甚至威胁撤出欧洲市场来表达立场。

这场博弈的结果可能不会是一方的完全胜利,而是一个反映多方相对力量的复杂妥协。塔勒布的理论在这里提供了理解影响力动态的视角,但现实世界的结果往往更加微妙。

时间窗口的不同

2018年和2024年的科技产业格局已经大不相同。当GDPR推出时,数据确实重要,但还不是生死攸关的问题。失去一些数据收集能力令人痛苦,但不会让Facebook或Google失去竞争优势。那时的数字经济已经相对成熟,需要的是规范而非突破。

但2024年的AI竞赛完全是另一回事。我们正处于AI革命的早期阶段,每个月都有突破性进展。在这个时刻被监管束缚手脚,可能意味着永久性地落后。更重要的是,中美AI竞争的大背景让一切变得更加复杂。当你的中国竞争对手可以不受限制地开发AI,而你却要满足各种”可解释性”要求时,这种劣势可能是致命的。

成本结构的差异也值得深思。GDPR的合规成本虽然高昂——大公司可能需要花费数百万欧元进行技术改造和法律咨询——但这是一次性投入加上可预测的维护成本。企业可以制定预算,分配资源,然后继续前进。

EU AI Act的成本却充满不确定性。不仅是金钱成本,更是机会成本。当你为了满足”可解释性”要求而不得不使用较简单的模型时,你失去的创新机会如何量化?当你的竞争对手推出了更强大的AI助手而你还在等待合规审查时,市场份额的流失如何计算?这种不确定性让企业难以做出理性的成本收益分析。

道德制高点

还有一个常被忽视的因素:公众认知。GDPR打着保护隐私的旗号,容易获得道德制高点。即使是最激进的科技公司也很难公开反对保护用户隐私。但AI监管不同。限制AI发展很容易被框定为”阻碍进步”、”扼杀创新”。在一个将技术进步视为信仰的时代,这种叙事对监管者不利。

谁掌握了权力?

更深层的变化在于权力结构的演变。在清真食品的案例中,个体消费者没有议价能力。但在AI时代,科技巨头掌握着一张王牌:退出威胁。当苹果说”我们不在欧盟发布AI功能”时,受损的不仅是苹果,还有数百万期待新功能的欧洲iPhone用户。当足够多的科技公司做出同样选择时,压力开始转向监管者。

这种动态在GDPR时代并不明显,因为没有公司真的敢完全退出欧盟市场。但在AI时代,”功能性退出”成为可能——你仍然在欧盟销售产品,只是不提供最先进的AI功能。这种策略既避免了完全退出的极端后果,又对监管者施加了压力。

如果我们用博弈论的语言来描述,GDPR时代的博弈相对简单:遵守规则失去一些数据优势但保住市场,不遵守则失去整个欧盟市场。选择显而易见。

但AI Act创造了一个更复杂的博弈。遵守可能意味着在全球AI竞赛中永久落后,不遵守只是暂时失去部分欧盟市场功能。当长期的技术领先地位和短期的市场准入发生冲突时,越来越多的公司选择了前者。

未来呢?

有趣的是,这个故事还远未结束。GDPR刚推出时也曾遭遇强烈反对,但最终大多数公司还是选择了合规。EU AI Act是否会重演这个剧本?

可能的情景包括:监管者和企业最终达成某种妥协,出现”欧盟特别版”的AI产品;或者欧盟坚持立场,导致欧洲在AI时代进一步边缘化;又或者,其他地区跟进欧盟的监管思路,最终形成全球统一标准。

没有放之四海而皆准的社会理论。塔勒布的”最不宽容者获胜”在特定条件下确实成立——当转换成本较低、参与者权力不对称有利于”不宽容者”、没有可行的退出选项时。

但当这些条件改变时,当”宽容者”变成了拥有议价能力的科技巨头,当转换成本高到令人却步,当退出成为可信威胁时,理论的预测就需要修正。

更重要的是,时机至关重要。GDPR来得正是时候——数据经济已经成熟,需要的是规范。而AI Act可能来得太早——当技术仍在快速演进时,过早的规范可能扼杀创新。这就像在莱特兄弟刚发明飞机时就制定详细的航空安全法规,结果可能是飞机永远无法起飞。

从更宏大的视角来说,当我们谈论清真食品时,我们在讨论消费选择。当我们谈论GDPR时,我们在讨论隐私权利。但当我们谈论AI监管时,我们在讨论人类的未来,即,谁将主导下一次技术革命,以及这场革命将如何展开。

一个文科生的职业生涯转型之路

为什么要写这篇回顾

其实很早以前就想对自己的职业生涯以及其中的各种转型做一个深度回顾。最近正好听到以前的好朋友兼同事 tiantian 的播客,她现在成为了小宇宙上的一位主播,在一档节目里正好聊到了30岁的职业转型这个话题。这让我觉得,是时候梳理一下自己这些年的职业历程了。

历程

迷茫的起点:从联合国实习到互联网公司

回想职业生涯的最初期,刚毕业的我其实相当迷茫,不知道自己以后能够干什么。在这种状态下,我申请了联合国开发计划署在土耳其的一个实习项目。现在回头看,这其实是在拖延自己做职业选择的时间,同时参与的各种各样的面试——从顶级咨询公司到大型外企的管培生项目,也可以算是当时迷茫的一个佐证。有些面试有了不错的进展,但更多的则是杳无音信。

最终,我进入了一家头部互联网公司的国际化产品部门,负责内容安全政策工作。能够获得这个机会,很大程度上要归功于之前在联合国的经历。这份工作可以说是我之后各种职业转型的起点和基石。回过头来看,我后续的各种工作其实都汲取了这份初始工作中的某些元素。

第一次转型:从政策专员到项目管理

在内容安全岗位工作一段时间后,由于一些原因,包括与直属领导在理念上的分歧,以及对方认为我的能力与其期望存在差距,我开始寻求转变。恰好在此之前,我参与过一些大型项目的管理工作,表现还不错,于是顺理成章地转型成为了部门的PMO,负责推进各类项目。

这段时期其实大部分时候都挺有成就感的。我的PMO工作做得相当不错,逐渐成为了部门里的”救火队员“。每当遇到各种棘手的问题或者难以推进的项目,大家第一个想到的就是找我来处理。长期在同一家互联网公司工作的经历,让我积累了大量的”组织知识”(Institutional Knowledge)——知道遇到非标准化的情况应该找谁,应该怎么做,以及在一家流程还不够完善的互联网企业里,如何解决各种复杂问题。

然而好景不长。随着部门架构的调整,加上公司战略的变化,大量招聘开始偏向外企和咨询公司背景的人才。整个工作环境开始变得复杂起来,原本简单直接的协作方式被各种繁复的流程所取代。我手上的工作也越来越繁杂难以处理,最终我选择了离开。

回归家乡:从互联网到外企的转变

凭借自己在内容安全领域,特别是内容安全政策方面的经验,我加入了一家知名的游戏公司。然而这段经历并没有持续太久。因为家庭原因,我回到了家乡南京工作。作为一个二线城市,南京的互联网机会相对有限,这也是我最终将目标转向外企的原因。

选择外企还有另一个原因。虽然很多人都觉得以我的个性和做事风格非常适合在体制内工作,但我自己还是比较喜欢相对自由自在的生活方式,也比较反感那些繁文缛节的官僚化作风。相比之下,外企似乎是一个不错的折中选择。

我最终进入了一家外企的数字化中心,以PM加PMO的身份开始工作。这个机会主要源于我之前在大厂的PMO经验——算是以类似的工作背景,换了一个完全不同的行业和部门。

文科生在 IT 世界的挑战

进入这个数字化中心后,我很快意识到自己面临着巨大的挑战。这里几乎所有人都是理工科背景,而我是文科生;很多人都有着丰富的开发经验,而我是个技术小白。这种背景差异带来的不仅是专业上的隔阂,还有沟通方式、思维模式上的差异。

更让我想到,但是没有做好准备的是,外企的PMO和互联网公司的PMO是完全不同的概念。在外企里,PMO主要负责各种流程事务、文档撰写、工具制作等标准化工作。而在互联网公司,PMO的角色更多取决于你和老板的关系,很多时候你像一个项目经理,负责整个项目的推进,需要处理复杂的人际关系,在没有明确流程的情况下把项目推进下去。这是完全不同的工作体验。

当公司期望我向Product Owner方向发展时,新的挑战又来了。作为一个产品负责人,特别是当这个产品并非出自你的创意,你对它也没有特别的兴趣时,要为它制定发展路线图、进行营销推广,真的很难产生内在驱动力。

当然,意愿是一方面,能力又是另一方面。我也逐渐意识到,即使未来我想做独立开发,做自己喜欢的产品,战略规划和营销推广的能力也是必须要锻炼的。这些能力也是我在接下来的日子里需要着重提升的。

新的方向:网络安全治理

基于种种考虑,特别是发现老板对我的期望与我的兴趣存在偏差后,我决定向另一个方向发展——成为网络安全治理。

这个选择可以说是我再次汲取了第一份工作中的元素——”安全”和”规则”。虽然内容安全和网络安全是不同的领域,但两者还是有很多共通之处。在这个新岗位上,我能够相对回到自己的舒适区。

但很快我就发现,在一个技术驱动的网络安全部门做政策工作,如果没有技术背景,很容易被认为是在做”花架子”。要想在这个领域获得认可和发展,至少需要了解技术,这样才能在制定政策时更加务实,也更容易获得技术同事的尊重。

这也成为了我当前的另一个重点发展方向——通过考取 CISSP 之类的专业认证来系统学习网络安全知识,让自己能够更好地融入这个技术主导的行业。

如何在”格格不入”的环境中生存

在外企数字化部门工作,作为一个文科背景、非技术出身的人,我不可避免地会感到某种程度的格格不入。由于之前在海外生活和在一线城市工作的经历,我的兴趣爱好、处事方式都与大部分同事存在差异。这种情况下,如何融入就成了一个重要课题。

首先,最重要的是心态调整。我渐渐明白,并不需要强行融入所有人的圈子。保持自己的特色,同时尊重他人的不同,这本身就是一种成熟。

此外,我开始主动寻找那些与自己有相似背景的同事。虽然人数不多,但总能找到一些有海外经历或互联网公司背景的人。与他们的交流让我感到不那么孤单,也能形成自己的小圈子。

最后,与其努力融入别人的圈子,不如以自己的兴趣爱好为中心创建新的 community。比如我喜欢打网球,就组建了一个网球俱乐部。作为发起人,我可以按照自己舒适的 规范来组织活动——不需要频繁聚餐,不需要在群里发红包,只是单纯地因为共同的运动爱好聚在一起。

写在最后:关于转型的一些思考

回顾这些年的职业历程,每一次转型都不是突然的决定,而是基于当时的处境和长远考虑做出的选择。从内容安全到项目管理,从互联网到游戏公司,再到外企,最后聚焦于网络安全——看似跳跃的轨迹背后,其实有着内在的逻辑。

每一段经历都像是拼图的一片,看似零散,但最终会组成一幅完整的图画。我从第一份工作中获得的”安全”和”规则”的基因,在兜兜转转后又回到了我的职业主线上。而中间积累的项目管理经验、跨部门协调能力、在不同企业文化中的适应能力,都成为了我独特的竞争优势。

以前的一个老板写过的关于职业生涯发展的一篇文章现在看来还是常看常新,比这篇要好很多,也有好多干货,值得记录一下

职场新手出村之路-上

职场新手出村之路-下

未来的路还很长,我会继续在网络安全领域深耕,同时保持开放的心态,迎接新的可能。毕竟,正是这些看似”跨界”的经历,造就了今天独特的我。

Context 的重要性;小红书+淘宝

终于听完重轻和孟岩的播客,他们推荐的里克鲁宾的书很有意思,准备抽空看看。他们主要讲的是创作过程,强调创作要源于个人真情实感,源于自己想表达的东西。

当然他们可能更着重创作系统内容,不愿追逐时事。而我这种俗人,大概每天确实被各种信息轰炸。自然,我的博客也会有很多相关内容。其实,我以前常会尴尬,或不愿在公众面前谈论对时事的看法。但他们的对谈也启发了我。许多想法应当被表达出来,日后回看,会发现自己当时要么是幼稚,要么是因为时局不同、信息不同、情绪不同,而产生了不同的判断逻辑。以后可能会随感评论生活或社会事件。

Context 的重要性

听重轻和孟岩的播客时,听到一段很有感触的对话。他们从祛魅聊起,引申开去。现在许多人沟通时,倾向于过度简化。听到“无非”、“不过就”这类词时,往往不代表说话人想用简化语言来概括,提炼精髓,而更多是接收者不愿费力研究或了解背景,因而过度简化。这也解释了为何日常生活中安利是件很难的事。感受作品的最佳途径永远是感受,而非分析。因为分析时,你会丧失对整体美感的体会。就像把事物掰开揉碎,你只能得到碎渣;而感受到的更多是情景、是 context,这是分析和阅读理解所无法体会的。你只能体会它为何牛逼,却不能体会它为何美。

这让我想起之前和 Jotmo 开发者聊天时,谈到 context的 重要性。记录时,context 非常重要。比如,回顾收藏的帖子,判断是上班摸鱼、通勤途中,还是专心阅读时收藏的,再结合笔记,能触发不同思路。这不仅关乎当时的思绪情感,也会让潜意识回忆起相似场景下的其他记录。同样,只有结合当时context,才能反映当时最真实的感受。

小红书和淘宝打通

小红书与淘宝打通,允许用户从图文直接跳转淘宝,堪称一招妙手。小红书商业化此前进展缓慢,主要是因为难吸引商家专门经营其平台内容,商家也无从得知“种草”效果。而一旦能跳转淘宝,转化效果即可量化,平台吸引力便会大增。此举有可能会限制小红书自身电商业务,但着眼平台整体发展,实为做大了蛋糕:先贯通“宣传-种草-购买”的流程,待用户习惯养成后,再图自身电商发展,可能比从零开始效果会更好。

社区调性

然而也应看到,内容或社区平台商业化提速后,可能严重冲击社区特有的氛围。当下的小红书即是典型例证:平台问题已相当严重,营销号大量涌入,令大家能看到的真实生活分享日益减少。

同时内容创作者为提高带货效果,内容可能趋于同质。当然,小红书社区尚属多元,其长尾内容有助于覆盖更细分的用户群体,但小红书的社区运营团队也需善加引导和管理。

消费习惯

至于先让用户养成消费习惯,再借此促进小红书自身商业化的想法,其实存在变数。用户养成的习惯,究竟是在小红书看中商品后跳转淘宝购买,还是在小红书内部完成了从“种草”到“决策”的整个过程?若是前者,小红书日后推广自有电商时,如何克服用户路径依赖、将他们拉回平台,将是一大难题。

不过,抖音此前的转型路径可资借鉴,毕竟其平台转型颇为成功。抖音早先也曾与淘宝等平台合作,虽经阵痛,但其电商能力随后迅速提升。

对 B 站也是种参考?

B站某种程度上或可借鉴这种做法法。可惜考虑到社区调性,B站要打通购买流程难度较大。其内容少有“种草”性质,多为硬广,与小红书不同。不过这也算一种开源节流之法。

B站商业化向来步履维艰。无论是贴片广告受限,还是特有的社区氛围,都使其商业潜力难以充分发掘。与平台合作直接导流算是一条思路,但对B站长远发展而言,恐怕只是权宜之计,难治根本。当然,对B站这样体量的公司,此法或许就已足够了。

Links + Notes

边听明日方舟歌单边摸鱼;AI 对人和社会互动的影响

终于从团建的忙碌中解脱,能静心做些喜欢的事了。之前提到要将 Voicenotes 整合进博客工作流,实践后体验确实不错。特别是发现 Voicenotes 能与 Readwise 互通,其价值又上了一个台阶。目前来看,Voicenotes 除了偶尔理解有偏差,整体表现相当不错。

这周另一有趣尝试是接触了 Vibe Coding。说来也巧,正好赶上 Lenny’s Newsletter 的福利活动,订阅即可获得 Cursor、Replit 等主流 Vibe Coding 工具一年使用权。 作为编程新手,我借此机会实际体验了 Cursor。目前只用它写了个简单脚本,确实感到很便捷。不过用它开发完整应用程序还是有些犹豫。可能需要先打好编程基础,才能更好利用 Cursor。

我之前也订阅了 Genspark 这类 agent 工具。对编程新手来说,简单试用后,感觉 agent 工具可能更友好。不过现阶段还是先专注学习和实践,等积累更多经验后再总结体会,说不定那时才会发现 agent 的局限。

此外,最近一直在调整工作流,发现必须调整当前的输入方式。现在每想记个笔记,都得粘贴到好几个地方(如新枝、Tana、Dinox、Voicenotes、Heptabase),因为可能在多处汇总或搜索。这种状态不可持续,甚至不如当初统一在 Drafts 输入,再一键分发,现在先做了几个 Drafts action,后面看如何整合。

此外,这两天也在试用 Calflow。之前一直想要找一些时间管理的工具,但是像 3×3 之类的工具也一直不大好上手,而且颜值也不怎么样。这两天在小红书上从一个 notion 博主那里顺藤摸瓜,找到了 Calflow 这个软件,感觉挺有前景,考虑用一段时间试试。


音乐在工作和学习中的不同

前两天工作时,照常打开网易云,播放明日方舟歌单,不知不觉就过了近两小时。一边工作一边多次被感动。Rap 有 Yanking 和桥夹克里夫的 boss 曲(mai 竟然是作曲+编曲!),《总辖之愿》太好听了(才知道最后四个关卡名连起来是“恩怨纠葛,散于星辰之间;留下之人,推开未来之门”)。

听着听着,想起一个有趣的问题:发现听音乐工作,效率会极大提升。哪怕中间会因音乐的旋律、情感、歌词而下意识看评论或停下工作专心听歌,但整体工作效率反而提升了,很顺畅地就进入了心流状态。

而这和我平时认真学习时的感觉正好相反。认真学习时听音乐,有时反而让我分心,无法集中注意力。于是我问了问 Gemini Pro 2.5,想看看这个问题是否有较科学的解释,结果挺有意思。

AI 表示,工作场景下,音乐之所以有助益,是因为工作本身重复性高,不需太多密集思考,大多是自动化操作,占用认知资源少。这样一来,注意力尚有余裕,音乐反而能屏蔽环境干扰,让我们更容易把注意力保持在工作上。同时,由于多数工作任务我们已熟练,不需深度分析,内在认知负荷较低;音乐带来的积极情绪,反而能促进认知资源的有效利用。

学习则不同,它本质上需要高度集中注意力。音乐会分散注意力,争夺认知资源,带来较高的认知负荷。

近期对 AI 对人和社会影响的摘抄和思考

近期阅读中,有不少关于 AI 对人和社会影响的摘抄与思考,这里分享些简单感想,若有时间再详细展开。

AI 会提高还是降低人的思维能力?

最近在即刻上看到,有人认为 AI 对人类思维方式构成一大威胁。它会给人一种思考幻觉。AI 出现前,普通人与各领域精英的最大差异,在于能否结构化地思考和输出。而目前的 AI,尤其是最新的,结构化能力较强。它们会拆解问题、任务并逐步完成,展示结构化过程,让用户误以为自己也能结构化思考。

这对经验或知识不足的人来说,其实比较危险,因为它取代了他们锻炼结构化思维的过程。他们在学习和提升中会失去一些附带收益,这些收益有时是纯知识,有时是锻炼出的思考能力。从某种意义上讲,这会让人的成长缺乏所谓的 context,而 context 在完成工作和个人学习成长中都非常重要。因为你有时假装获得了能力,但 AI 并不知道你实际经历过什么。同时,这种 context 也是我们未来应对不同事物时的潜在经验与知识,这些无法通过 AI 获得。

这让我想起 Neo 在其 newsletter 中介绍的一篇文章。该文根据微软和卡内基梅隆大学的调查,分析了 AI 工具如何从不同维度重塑人类工作方式。在 AI 时代,人虽将部分功能让渡给 AI,但人的作用反而更核心,集中于验证信息、整合输出、监督任务。人的工作变得‘高抽象’和‘高风险’,需要更强的判断力,并承担更多决策风险。

AI 真的带来了平权吗?

讨论新技术影响时,会发现 AI 与科幻小说、游戏中描绘的某些技术(常导致赛博朋克世界)既相似又不同。在那些世界观里,新技术常由政府秘密研发,某些人率先秘密使用,从而获得对普通人的巨大优势。而 AI 的情况是,AI 平权是 AI 时代的默认特征,还是只是历史发展过程中的一个短暂“黄金时期”?当前 AI 发展初期,是自下而上发展,所有人平等使用同等智能的 AI。但当 AI 发展到一定程度,若普通人可用的 AI 能力触及企业成本上限,且富人能用金钱购买到显著更优的 AI 时,社会阶层问题恐将重现。

AI 时代,语音的影响被忽视了

另一项观察是,我发现许多 AI 开始强调语音交互。这种交互一方面极大地方便了用户操控电脑、手机及 AI,另一方面,它会重塑每个人的工作习惯,乃至人际交互模式与社交关系。

例如,以往在工作空间,每个人的工作都相当私密。而一旦工作转为通过语音沟通,人与人的工作空间就必然交织。这种交织目前看来无所谓好坏,但必然影响人在工作中如何把握与他人的距离。也许将来大家会更注重隐私,甚至可能反而更少关注隐私。这些都值得继续研究。

AI时代,我们还需要个人知识管理吗?

最近看到了一篇文章 人工智能与没有斑点的长颈鹿,作者提到,人工智能的训练原理导致,所有答案都趋向主流,继而抹杀各种非主流的观点与个性。

而在日常生活中,随着 Deepseek 的迅猛发展和广泛应用,长辈们开始将其视为AI的代名词,并逐渐将这些工具融入日常生活中。

对于那些此前较少接触人工智能技术的人群而言,他们自然倾向于直接向AI提出各种问题,更令人担忧的是,他们往往将AI的回答视为绝对真理。这一现象令我想起之前关于知识管理的讨论,有观点认为AI代表了知识管理的终极形态,即个人知识收集是没必要的,因为AI可以提供答案。

遇到问题问AI就行了?

虽然我坚信应该将AI有效整合进我们的知识框架中,每个人都应培养使用这些工具的能力——但这种整合应该是对个人知识管理和独立思考的补充,而非替代。

“遇到问题为何不直接询问AI?”我们越来越常听到这一表述,而这一普遍看法存在显著的逻辑缺陷。

许多问题并不存在单一、确定的答案,然而AI系统通常提供看似权威的响应。这并非表示AI始终产生相同的答案,而是当前大型语言模型的架构——主要基于主流材料训练——自然会生成反映主流观点的输出。因此,非主流观点在AI回答中因训练数据中的权重较低而被削弱。

文明的真正丰富性往往体现在这些非主流的、长尾的内容领域。当我们集体放弃独立思考,忽视多样化的视角、观点和事实诠释时,文明发展和个人成长都将受到深远影响。

知识获取路径的转变

另一个引人深思的视角认为,AI对新生代最具革命性的影响在于从根本上改变了知识获取方式。历史上,人们主动搜寻知识——回溯更远,互联网前的世代甚至在开始搜索前就需要投入专门的学习过程。今天的技术演进已逐步简化了信息获取流程,实现了直接检索答案而完全绕过搜索阶段。

这一转变本身好坏并无定论,但出于每个人锻炼思维的角度来看我们必须主动收获、处理并内化知识,探索多元视角,最终形成自己的观点。

在我个人的知识管理实践中,我优先将那些能激发思考的内容归档至知识仓库。AI主要作为组织和搜索助手,而非权威答案来源——这一关键区分保留了我对我的知识筛选的自主性,并能充分利用AI的优势,来增加效率。

让时间解决问题

人与人之间,悲欢各异,需求亦不同,即便在同一家庭中关系极为亲密之人亦是如此。这是因为各自所处之位置不同,所面对的人群不同,自身经历有别,世界观存在差异,当下需求也不尽相同,所处时间阶段更是各有不同。如此一来,当面对同一事件时,人们看待它的视角、做出的选择,以及即将面临的后果,乃至自己对其投注的情感与承受的压力,自然都会有所不同。

在不少小说里,我们常能看到描绘此类场景的情节。此时,作者往往会借主角之口道出:“问心无愧即可。”然而,“问心无愧”,说起来轻松,真正践行却谈何容易。毕竟每个人都置身于社会之中,当你觉得对自己无愧时,对于身边某些人而言,却极有可能是有所亏欠的。最终,不过是在其中进行权衡罢了。

很多时候,一件事在当下似乎能找到解决思路,却又难以即刻解决。在这种情况下,将其置于时间的长河之中,等待时间给出答案,不失为一种良策。不必非要在当时当下就对某件事给出最终定论。选择或假定最终要达成的效果及实现路径时,更为关键的是要明确自己想要实现的目标,并以此为基础,在每一个关键时间节点,依据不同情况做出最契合最终目标的选择。

Shortform

点赞是数字时代的握手。是说”我看到了” “我懂你””我支持” “继续加油”。它像一个会心的微笑,一个默契的眼神,一个轻轻的点头。

评论是对话的渴望。当一个人决定写下评论,而不是简单地点个赞,这意味着内容触动了他内心某个角落,激起了涟漪,这涟漪强烈到必须用语言表达出来。

——李继刚


deepseek 仿佛成为了一种需求。但是,deepseek 是需求吗?——Lightory

Deepseek 是一种需求吗?对大部分需要追上热点,避免掉队的公司来说,确实是种短期需求

Deepseek 是每个人都需要的需求吗?不是,大部分人都是出于FOMO,以及来源于对AI的不了解

Deepseek 不是唯一的方向,算法时代,马太效应大大增强,也增加了所有人的焦虑。当前所有人,所有人一窝蜂地接入deepseek,反而有可能抑制了其他类似的产品的发展


Links

是阿Q精神吗?黑神话:悟空没拿TGA年度游戏也许是个好事

我并不是游戏从业者,或者说仅在游戏行业工作过很短的时间。但我接触各种游戏,是件很小就开始的事情。记得在很小的时候,甚至在小学之前,就玩上了小霸王上,甚至可以闭着眼玩超级玛利奥的第一关。到中学,每晚偷偷打开爸妈的笔记本电脑,偷玩实况八,仙剑四,成为我繁忙学习中的一大乐趣。

上大学后,广袤的游戏世界在我面前展开,我越来越多地了解和补课了之前错过的不同类型的游戏,也见证了中国游戏行业曾经的辉煌和之后的衰落。从《仙剑1》到《仙剑4》,从轩辕剑最经典的那几作上也看到了从剧情到音乐到画面的进步,再看到它一步步与世界主流脱轨,好游戏的创意或IP慢慢失去吸引力,不得不感慨万千。关于我的游戏生涯,我也有一篇鸽了很久的文章,后面争取尽快攒出来。

不可否认,《黑神话:悟空》确实满足了我对中式游戏的许多幻想。虽然它有很多缺点,比如场景设计过于追求美感而忽略了一些基础操作的便捷性,对手残玩家不太友好,但它对中式美感的传达,让我回到了当年玩《轩辕剑》和《仙剑》的感觉,并在此之上更进了好几步。

其实今天黑神话悟空没有拿到 TGA 年度游戏还是有些遗憾的。张佳玮在他文章里写的那句话,虽然听起来有点阿Q精神,但也挺有道理。

只是每个从小到大打游戏被说三道四过的玩家,会感叹可惜:

终究还是没披上袈裟,给不了解游戏的世人看。

当然换个角度:

也没戴上金箍。

中国游戏其实挺需要黑神话能够披上TGA这件袈裟,来告知世人,尤其是那些不大玩游戏的人,中国人是可以做出世界上最好的游戏的。但是他最终还是没能披上这层袈裟。

但袈裟这个意象本身就很有意思。对于黑神话这款游戏而言,或者说从西游记的内核而言,袈裟更像是一种精神上的束缚。虽然没有披上袈裟确实有点遗憾,但也意味着你可能没有戴上那个金箍,你能更加自由地发展。

人们常说艺术作品,无论是游戏、电影还是电视剧,需要传达一些核心精神或进行文化传播。也确实能看到许多优秀制作者在作品中表达自己的政治想法,这无可厚非。这更像是把自己认为好的、对的东西推荐给别人看的一种行为,但传递自己的观点并不代表只有一种美感是对的或者只能传递一种主流的价值观。

黑神话是一个好游戏,但没有拿到年度游戏某种意义上避免了它被视为唯一成功方式或标准。如果真的拿了这个年度游戏,那么有可能反而就会成为一个标杆,在当前已经被捧得很高的地位之上,进一步地被官媒渲染并视为文化输出的主流标准,反而禁锢了其他的游戏人,或者黑神话他们公司自己的创作灵感,甚至于对独立开发者或一些剑走偏锋的创作者,如最近爆火的《昭和美国物语》的创作者而言,反而压缩了他们的生存空间。

碎碎念了这么多,也许根源还是来自于自己喜欢的游戏没能获奖的不甘吧。

在软件早期,交互和可拓展性哪个更重要?

这几天没忍住,还是把闪念贝壳的终身会员给买了。

虽然它的语音转文字质量确实跟 AudioPen 和 Dinox 都有差距,毕竟它们俩用的是Whisper,而闪念贝壳国内版用的应该不是。但是从设计逻辑、美观程度和交互应用性上,感觉它还是挺有优势的。

由此我想到之前一直在考虑的一个问题:在软件的初期阶段,是更应该注重交互UI的美观程度,还是应该在保证基础的交互功能的前提下,往极高的可扩展性方向发展。

以闪念贝壳和Dinox为例,前者无疑在交互UI的设计上达到了顶尖水平,甚至优于许多苹果原生应用。而 Dinox 则更像是一个未经修饰的毛坯房,虽然其背后的构思和未来的产品愿景宏大,且不乏独到的创意,但在UI设计和交互上却有明显不足。

这就引出了一个问题:我们是否应该期待这种交互上的不足在未来得到改善?毕竟,长期而言,交互和UI设计对用户体验有着深远的影响。使用软件时的感受和心情,往往决定了我们使用它的意愿。

闪念贝壳专注于语音转文字这一场景,并在此基础上深入挖掘,这是它的核心价值所在。而对于这个问题,并没有一个定论,更多的是取决于用户对于交互和UI设计的容忍度和重视程度。对于一些更为“极客”的用户来说,只要功能足够强大,其他的不足也就不那么重要了。

目前现在就属于几种不同的软件混用的一个状态吧。

仔细想来,我发现自己在软件选择上,总是倾向于那些自定义选项较少,但外观设计却颇高的产品。初接触一个新产品时,我往往会偏爱那些具有丰富自定义功能的产品,因为在学习过程中,我能够感受到一种获得感。这种获得感,在某种程度上,正是促使我投入更多时间研究产品的动力。

这或许也是某些产品增加用户粘性的一种策略。然而,随着使用时间的增长,我逐渐意识到,产品本身的实用设计才是关键。就像苹果一样,虽然Windows或Android系统提供了更多的自定义选项,如果你愿意折腾,也能打造出功能强大且外观美观的系统。

但如果我们只是为了满足最基本的需求,那么产品经理引导我们使用软件的方式,可能才是最符合我们基础需求的。简洁的设计,往往能更好地服务于实际需求。

Captures

AI 的分类模式

The 3 AI Use Cases, Gods, Interns, and Cogs:

  • :超智能人工实体,自主执行任务;主要是以炒作和焦虑的方式影响我们;
  • 实习生:受到监督的副驾驶,与专家合作,对错误容忍度高,专注于定义明确的基础工作(如整理文档、填充细节、提供参考等)。是目前交付最多价值的人工智能类型,能让小团队交付远超以往。
  • 齿轮:极好地执行单一任务,通常作为管道和接口的一部分。对错误容忍度低,所以多半是微调或者小模型,所以成本低。比如云平台、审核平台等; ——The 3 AI Use Cases, Gods, Interns, and Cogs——少楠 产品沉思录

稀缺循环

丰饶时代造成我们注意力短缺的原因:

  • 机会:即可能性,确保自己不错过「有价值的东西」,但在丰饶时代会导致过度囤积;
  • 不可预测奖励:为了无法预测的奖励不断重复,如刷视频,得到点赞等;
  • 快速重复:容易做到的行为,带来即时满足,而导致忽略长期有价值的活动; ——少楠 产品沉思录

别让代理指标异化了思维

运用接近真实世界的代理指标能让一些模糊的感受变得可以衡量,比如亚马逊用退货率来量化用户体验。 但代理的问题是,过度量化可能会与实际脱节,让人忘了设置这种代理的目的,为了优化数字而优化。 这也是为什么做一些战略项目的时候,需要行研和用研、定量和定性相结合,通过人和人的交流来避免过度依赖代理 ——少楠 产品沉思录

As news becomes entertainment, markets become the news

Robinhood 创始人 Vlad Tenev 很有意思的发言。之前我对于博彩行业的人士基本只局限于体育行业,通过赔率来关注转会市场或者一些重要比赛的预测,这基于一种认识,即博彩公司往往能在这些领域掌握一些普通人不了解的消息。

博彩网站他们的这种基于市场的行为,有时候并不只是因为他们有更多的信息来源,很多时候更来源于一种去中心化的市场交易,当去中心化的信息能得到快速汇总的时候,进而能更准确地体现事情的真相。

尤其是在美国大选这种场景之下,来源于各个不同地区的投票所产生的去中心化的行为,对于市场的预期也会产生非常直接的影响。 甚至于长久以来博彩网站所能影响的面,或者说它能反映的领域也会越来越多。

相比于越来越娱乐化的各种新闻媒体,他们愈发需要通过故事才能吸引人们来进行阅读,而在这种短平快的移动互联网的大背景下,往往反映速度最快的市场更能体现人们对于“纯粹”的新闻的追求。

申根签证办理攻略(上海领区)—— 以西班牙签证为例

去年年中的时候申请了一波挪威的签证,当时因为好久没申请申根签了,前前后后,尤其是递签当天上楼下楼折腾了快两个小时,好不容易才搞定。时隔一年,又去申请了西班牙的签证,这回相比一年前顺利了不少,但也出现了一些把自己蠢哭的操作,在这里正好梳理一下,给后人引以为鉴 😂。

前置说明:本攻略仅限于上海领区,且于南京签证中心递签,其他领区和签证中心在材料和流程上可能都有些微不同,可以以本文作为参考,小红书上查询其他人攻略做补充。

I 流程

预约

国内的西班牙签证都是在 BLS 官网 上进行预约的。可以在官网上选择不同的签证类型查看需要的材料(不同的领区需要的材料不同)

注册账号之后需要在系统里填写个人信息,建议先过一遍所有需要填的内容,然后一次性写完,不然网页暂停使用几分钟后就会会自动退出登录,之前填写的东西全部作废。系统语言最好选英文,中文的话有些字段会比较迷惑。

之后就到了最坑的预约环节。西班牙签证的号非常少,而且放号时间不确定(一般一两周放一次),所以有空的话可以中午和下午到网上没事刷几次(进官网,选择 Book Appointment),手机和电脑都行。我当时刷了两周多才刷到,并且两三个小时后就没号了。

需要注意的是,除非是直系亲属(非夫妻),不然两个人需要分开预约,因为直系亲属的证明方法是同姓。。。总之西班牙签证这个系统槽点满满,能约上还挺不容易的。

递签

按照预约时间去 BLS 南京中心就行(在苏宁慧谷 E08-02-1019 十楼),顺利的话速度很快,如果缺文件或者文件有问题需要重新打印,在 BLS 打印很贵,但是去打印店打印的话需要注意时间,因为西班牙签证中心的系统和挪威的不大一样,必须在预约的那半个小时里办理完成,不然就会需要重新预约。

现场签证服务费 770,需要手机银行转账,记得备注姓名。

隐藏流程:借出护照

此流程一般只有在两种情况下才会触发,第一种是时间卡的特别死,按照15个工作日预估的下一段出国行程,但是担心不能按时出签;第二种则是我这种蠢哭的情况,递签之后才想起来几天之后就要出国,于是不得不想办法借出护照。

在今年上半年还是可以直接联系使领馆借出的,但是下半年开始就只能通过签证中心来提交申请了。具体可以电话咨询签证中心,然后带着当时递签的reference number,到签证中心拿一张纸手写借出申请,在申请里要写借出的原因、个人信息(方便使馆找到护照)、保证用完立刻归还。

签证中心会把手写的借出申请通过快递寄给使领馆,使领馆收到之后一般会尽快处理,快递发回给签证中心,签证中心收到后会电话通知领取。使用完成后送回签证中心寄回即可。

取签证

官方说寄到领馆之后,需要 15 个工作日处理,但是实际可能超出 15 个工作日才能处理完成。像是我这次,叠加了国庆节以及借出护照的 8 天之后,足足花了快一个半月才取到护照。

签证中心开放时间早上 8 点 – 下午 3 点,中午不休息,收到签证中心的电话之后,只要在开放时间之内随时都能取。需带本人身份证,如需代取,则需要携带关系证明文件(比如结婚证)

II 需要的材料

申请表

9 月西班牙领馆更新了申请表,和之前的不一样,要再 BLS 官网上下载最新版的申请表,手写和打印都行。

3545 白底彩照1

建议在签证中心拍,以南京为例,30块一个人。之前办挪威签证的时候自己拍的带过去,但是被说不合格,被迫现场重拍。所以这回选择直接在西班牙签证中心拍了。

护照

  • 首页(个人信息页)*3
  • 所有页复印件*1(包括空白页)
  • 旧护照复印件*1(不需要空白页,如果不放心可以也复印)

医疗保险30000欧

可以直接选 BLS 网站上的保险,当然自己买也是可以的

机票预订单

官网说没出签不要付款,但是我们几次申请签证都是打的付款后的预订单,所以实测没问题

住宿证明

携程、booking 之类预定的英文预订单直接打出来就行

Itinery

用英文写 itinery, 包含交通、住宿、行程即可。因为我的是实际行程,所以比较真实。网上看到有人编的行程被拒签的例子,所以这块自己斟酌即可。

最近六个月流水

在银行 App 里直接打。虽然官方对余额没有要求,但最好还是在里面放几万。

户口本原件+复印件

需要复印户口本户主页和自己的那页(不放心的话全复印也行)

公司营业执照复印件(加盖公章)

公章是必须的,但没有明说加盖什么部门的公章,网上有说没盖公章,写了说明信陈述理由,最后签证也成功下来的案例,可以参考,但是不保真。

在职证明

需使用公司正式的信头纸并加盖公章,签字,并明确日期及以下信息 :

  • 任职公司的地址、电话及传真号码
  • 任职公司签字人的姓名和职务(部门负责人、HR都可)
  • 申请人姓名、职务、收入及工作年限

III Tips

查看申请状态

据说有六七种申请状态,但实测更新不大及时,仅供参考

Acceda done,Ready for Outscan签证中心收齐材料

Outscan to Hub 签证中心送材料,在途

Outscanned to Mission签证材料送到了使馆

Inscan at Mission使馆在审核

Outscan to Spoke 审核完返还护照中

Passport delivered at Counter护照已送到签证中心

但实测只更新了两种状态,Outscanned to Mission 维持了大半个月,之后变成了 Outscan to Spoke,之后又过了快一周,签证中心才打电话通知去取。

使领馆相关

和不少外企一样,西班牙领馆在中国法定节假日会放假,但是不调休(正常过周末),因此计算工作日的时候