是阿Q精神吗?黑神话:悟空没拿TGA年度游戏也许是个好事

我并不是游戏从业者,或者说仅在游戏行业工作过很短的时间。但我接触各种游戏,是件很小就开始的事情。记得在很小的时候,甚至在小学之前,就玩上了小霸王上,甚至可以闭着眼玩超级玛利奥的第一关。到中学,每晚偷偷打开爸妈的笔记本电脑,偷玩实况八,仙剑四,成为我繁忙学习中的一大乐趣。

上大学后,广袤的游戏世界在我面前展开,我越来越多地了解和补课了之前错过的不同类型的游戏,也见证了中国游戏行业曾经的辉煌和之后的衰落。从《仙剑1》到《仙剑4》,从轩辕剑最经典的那几作上也看到了从剧情到音乐到画面的进步,再看到它一步步与世界主流脱轨,好游戏的创意或IP慢慢失去吸引力,不得不感慨万千。关于我的游戏生涯,我也有一篇鸽了很久的文章,后面争取尽快攒出来。

不可否认,《黑神话:悟空》确实满足了我对中式游戏的许多幻想。虽然它有很多缺点,比如场景设计过于追求美感而忽略了一些基础操作的便捷性,对手残玩家不太友好,但它对中式美感的传达,让我回到了当年玩《轩辕剑》和《仙剑》的感觉,并在此之上更进了好几步。

其实今天黑神话悟空没有拿到 TGA 年度游戏还是有些遗憾的。张佳玮在他文章里写的那句话,虽然听起来有点阿Q精神,但也挺有道理。

只是每个从小到大打游戏被说三道四过的玩家,会感叹可惜:

终究还是没披上袈裟,给不了解游戏的世人看。

当然换个角度:

也没戴上金箍。

中国游戏其实挺需要黑神话能够披上TGA这件袈裟,来告知世人,尤其是那些不大玩游戏的人,中国人是可以做出世界上最好的游戏的。但是他最终还是没能披上这层袈裟。

但袈裟这个意象本身就很有意思。对于黑神话这款游戏而言,或者说从西游记的内核而言,袈裟更像是一种精神上的束缚。虽然没有披上袈裟确实有点遗憾,但也意味着你可能没有戴上那个金箍,你能更加自由地发展。

人们常说艺术作品,无论是游戏、电影还是电视剧,需要传达一些核心精神或进行文化传播。也确实能看到许多优秀制作者在作品中表达自己的政治想法,这无可厚非。这更像是把自己认为好的、对的东西推荐给别人看的一种行为,但传递自己的观点并不代表只有一种美感是对的或者只能传递一种主流的价值观。

黑神话是一个好游戏,但没有拿到年度游戏某种意义上避免了它被视为唯一成功方式或标准。如果真的拿了这个年度游戏,那么有可能反而就会成为一个标杆,在当前已经被捧得很高的地位之上,进一步地被官媒渲染并视为文化输出的主流标准,反而禁锢了其他的游戏人,或者黑神话他们公司自己的创作灵感,甚至于对独立开发者或一些剑走偏锋的创作者,如最近爆火的《昭和美国物语》的创作者而言,反而压缩了他们的生存空间。

碎碎念了这么多,也许根源还是来自于自己喜欢的游戏没能获奖的不甘吧。

在软件早期,交互和可拓展性哪个更重要?

这几天没忍住,还是把闪念贝壳的终身会员给买了。

虽然它的语音转文字质量确实跟 AudioPen 和 Dinox 都有差距,毕竟它们俩用的是Whisper,而闪念贝壳国内版用的应该不是。但是从设计逻辑、美观程度和交互应用性上,感觉它还是挺有优势的。

由此我想到之前一直在考虑的一个问题:在软件的初期阶段,是更应该注重交互UI的美观程度,还是应该在保证基础的交互功能的前提下,往极高的可扩展性方向发展。

以闪念贝壳和Dinox为例,前者无疑在交互UI的设计上达到了顶尖水平,甚至优于许多苹果原生应用。而 Dinox 则更像是一个未经修饰的毛坯房,虽然其背后的构思和未来的产品愿景宏大,且不乏独到的创意,但在UI设计和交互上却有明显不足。

这就引出了一个问题:我们是否应该期待这种交互上的不足在未来得到改善?毕竟,长期而言,交互和UI设计对用户体验有着深远的影响。使用软件时的感受和心情,往往决定了我们使用它的意愿。

闪念贝壳专注于语音转文字这一场景,并在此基础上深入挖掘,这是它的核心价值所在。而对于这个问题,并没有一个定论,更多的是取决于用户对于交互和UI设计的容忍度和重视程度。对于一些更为“极客”的用户来说,只要功能足够强大,其他的不足也就不那么重要了。

目前现在就属于几种不同的软件混用的一个状态吧。

仔细想来,我发现自己在软件选择上,总是倾向于那些自定义选项较少,但外观设计却颇高的产品。初接触一个新产品时,我往往会偏爱那些具有丰富自定义功能的产品,因为在学习过程中,我能够感受到一种获得感。这种获得感,在某种程度上,正是促使我投入更多时间研究产品的动力。

这或许也是某些产品增加用户粘性的一种策略。然而,随着使用时间的增长,我逐渐意识到,产品本身的实用设计才是关键。就像苹果一样,虽然Windows或Android系统提供了更多的自定义选项,如果你愿意折腾,也能打造出功能强大且外观美观的系统。

但如果我们只是为了满足最基本的需求,那么产品经理引导我们使用软件的方式,可能才是最符合我们基础需求的。简洁的设计,往往能更好地服务于实际需求。

Captures

AI 的分类模式

The 3 AI Use Cases, Gods, Interns, and Cogs:

  • :超智能人工实体,自主执行任务;主要是以炒作和焦虑的方式影响我们;
  • 实习生:受到监督的副驾驶,与专家合作,对错误容忍度高,专注于定义明确的基础工作(如整理文档、填充细节、提供参考等)。是目前交付最多价值的人工智能类型,能让小团队交付远超以往。
  • 齿轮:极好地执行单一任务,通常作为管道和接口的一部分。对错误容忍度低,所以多半是微调或者小模型,所以成本低。比如云平台、审核平台等; ——The 3 AI Use Cases, Gods, Interns, and Cogs——少楠 产品沉思录

稀缺循环

丰饶时代造成我们注意力短缺的原因:

  • 机会:即可能性,确保自己不错过「有价值的东西」,但在丰饶时代会导致过度囤积;
  • 不可预测奖励:为了无法预测的奖励不断重复,如刷视频,得到点赞等;
  • 快速重复:容易做到的行为,带来即时满足,而导致忽略长期有价值的活动; ——少楠 产品沉思录

别让代理指标异化了思维

运用接近真实世界的代理指标能让一些模糊的感受变得可以衡量,比如亚马逊用退货率来量化用户体验。 但代理的问题是,过度量化可能会与实际脱节,让人忘了设置这种代理的目的,为了优化数字而优化。 这也是为什么做一些战略项目的时候,需要行研和用研、定量和定性相结合,通过人和人的交流来避免过度依赖代理 ——少楠 产品沉思录

As news becomes entertainment, markets become the news

Robinhood 创始人 Vlad Tenev 很有意思的发言。之前我对于博彩行业的人士基本只局限于体育行业,通过赔率来关注转会市场或者一些重要比赛的预测,这基于一种认识,即博彩公司往往能在这些领域掌握一些普通人不了解的消息。

博彩网站他们的这种基于市场的行为,有时候并不只是因为他们有更多的信息来源,很多时候更来源于一种去中心化的市场交易,当去中心化的信息能得到快速汇总的时候,进而能更准确地体现事情的真相。

尤其是在美国大选这种场景之下,来源于各个不同地区的投票所产生的去中心化的行为,对于市场的预期也会产生非常直接的影响。 甚至于长久以来博彩网站所能影响的面,或者说它能反映的领域也会越来越多。

相比于越来越娱乐化的各种新闻媒体,他们愈发需要通过故事才能吸引人们来进行阅读,而在这种短平快的移动互联网的大背景下,往往反映速度最快的市场更能体现人们对于“纯粹”的新闻的追求。

申根签证办理攻略(上海领区)—— 以西班牙签证为例

去年年中的时候申请了一波挪威的签证,当时因为好久没申请申根签了,前前后后,尤其是递签当天上楼下楼折腾了快两个小时,好不容易才搞定。时隔一年,又去申请了西班牙的签证,这回相比一年前顺利了不少,但也出现了一些把自己蠢哭的操作,在这里正好梳理一下,给后人引以为鉴 😂。

前置说明:本攻略仅限于上海领区,且于南京签证中心递签,其他领区和签证中心在材料和流程上可能都有些微不同,可以以本文作为参考,小红书上查询其他人攻略做补充。

I 流程

预约

国内的西班牙签证都是在 BLS 官网 上进行预约的。可以在官网上选择不同的签证类型查看需要的材料(不同的领区需要的材料不同)

注册账号之后需要在系统里填写个人信息,建议先过一遍所有需要填的内容,然后一次性写完,不然网页暂停使用几分钟后就会会自动退出登录,之前填写的东西全部作废。系统语言最好选英文,中文的话有些字段会比较迷惑。

之后就到了最坑的预约环节。西班牙签证的号非常少,而且放号时间不确定(一般一两周放一次),所以有空的话可以中午和下午到网上没事刷几次(进官网,选择 Book Appointment),手机和电脑都行。我当时刷了两周多才刷到,并且两三个小时后就没号了。

需要注意的是,除非是直系亲属(非夫妻),不然两个人需要分开预约,因为直系亲属的证明方法是同姓。。。总之西班牙签证这个系统槽点满满,能约上还挺不容易的。

递签

按照预约时间去 BLS 南京中心就行(在苏宁慧谷 E08-02-1019 十楼),顺利的话速度很快,如果缺文件或者文件有问题需要重新打印,在 BLS 打印很贵,但是去打印店打印的话需要注意时间,因为西班牙签证中心的系统和挪威的不大一样,必须在预约的那半个小时里办理完成,不然就会需要重新预约。

现场签证服务费 770,需要手机银行转账,记得备注姓名。

隐藏流程:借出护照

此流程一般只有在两种情况下才会触发,第一种是时间卡的特别死,按照15个工作日预估的下一段出国行程,但是担心不能按时出签;第二种则是我这种蠢哭的情况,递签之后才想起来几天之后就要出国,于是不得不想办法借出护照。

在今年上半年还是可以直接联系使领馆借出的,但是下半年开始就只能通过签证中心来提交申请了。具体可以电话咨询签证中心,然后带着当时递签的reference number,到签证中心拿一张纸手写借出申请,在申请里要写借出的原因、个人信息(方便使馆找到护照)、保证用完立刻归还。

签证中心会把手写的借出申请通过快递寄给使领馆,使领馆收到之后一般会尽快处理,快递发回给签证中心,签证中心收到后会电话通知领取。使用完成后送回签证中心寄回即可。

取签证

官方说寄到领馆之后,需要 15 个工作日处理,但是实际可能超出 15 个工作日才能处理完成。像是我这次,叠加了国庆节以及借出护照的 8 天之后,足足花了快一个半月才取到护照。

签证中心开放时间早上 8 点 – 下午 3 点,中午不休息,收到签证中心的电话之后,只要在开放时间之内随时都能取。需带本人身份证,如需代取,则需要携带关系证明文件(比如结婚证)

II 需要的材料

申请表

9 月西班牙领馆更新了申请表,和之前的不一样,要再 BLS 官网上下载最新版的申请表,手写和打印都行。

3545 白底彩照1

建议在签证中心拍,以南京为例,30块一个人。之前办挪威签证的时候自己拍的带过去,但是被说不合格,被迫现场重拍。所以这回选择直接在西班牙签证中心拍了。

护照

  • 首页(个人信息页)*3
  • 所有页复印件*1(包括空白页)
  • 旧护照复印件*1(不需要空白页,如果不放心可以也复印)

医疗保险30000欧

可以直接选 BLS 网站上的保险,当然自己买也是可以的

机票预订单

官网说没出签不要付款,但是我们几次申请签证都是打的付款后的预订单,所以实测没问题

住宿证明

携程、booking 之类预定的英文预订单直接打出来就行

Itinery

用英文写 itinery, 包含交通、住宿、行程即可。因为我的是实际行程,所以比较真实。网上看到有人编的行程被拒签的例子,所以这块自己斟酌即可。

最近六个月流水

在银行 App 里直接打。虽然官方对余额没有要求,但最好还是在里面放几万。

户口本原件+复印件

需要复印户口本户主页和自己的那页(不放心的话全复印也行)

公司营业执照复印件(加盖公章)

公章是必须的,但没有明说加盖什么部门的公章,网上有说没盖公章,写了说明信陈述理由,最后签证也成功下来的案例,可以参考,但是不保真。

在职证明

需使用公司正式的信头纸并加盖公章,签字,并明确日期及以下信息 :

  • 任职公司的地址、电话及传真号码
  • 任职公司签字人的姓名和职务(部门负责人、HR都可)
  • 申请人姓名、职务、收入及工作年限

III Tips

查看申请状态

据说有六七种申请状态,但实测更新不大及时,仅供参考

Acceda done,Ready for Outscan签证中心收齐材料

Outscan to Hub 签证中心送材料,在途

Outscanned to Mission签证材料送到了使馆

Inscan at Mission使馆在审核

Outscan to Spoke 审核完返还护照中

Passport delivered at Counter护照已送到签证中心

但实测只更新了两种状态,Outscanned to Mission 维持了大半个月,之后变成了 Outscan to Spoke,之后又过了快一周,签证中心才打电话通知去取。

使领馆相关

和不少外企一样,西班牙领馆在中国法定节假日会放假,但是不调休(正常过周末),因此计算工作日的时候

博客从 NotionNext迁移到 Thorn

在上一篇博客个人博客问卷里我也提到过,虽然我的博客搭建在 notion 上,但是我也一直考虑搬迁的问题。之前主要考虑的是通过 cursor 辅助来编写一个静态博客。然而,最近也看到了有博客里写到了他的个人博客遭到了攻击,花了很大力气才恢复了博客的正常运转。加上确实没那么多时间来折腾自己写代码+部署,就一直没开始静态博客的尝试。

先聊一下我对 NotionNext 不满意的地方吧。首先就是界面有点廉价感。一般来说要么就是极简风也挺好看的,但是 NotionNext 的大部分主题在白底上总是会有一些奇怪的动效,看起来不是很高级简约。而且,自从 4.0 的某一次更新之后,自定义字体就突然失效了,对于我这个颜值控来说,能够自定义字体还是挺重要的。

还有个问题就是 RSS 的支持。静态网页每次更新文章都要重新部署一下才能更新 RSS,这点我是很能理解的。但是 RSS 的时间信息和格式的解析问题还是挺多的,并且挺要命。无论是具体的格式解析,还是博客名解析都有问题。

这么多问题累积下来之后,其实我一直有想换一个博客部署方式的想法(其实之前也想过,详情可见 博客和笔记软件一样,就是个不停折腾的过程。但确实一直没有找到特别合适的替代品。正好上周在少数派里随意闲逛时,我看到了一篇文章,讲的是 Thorn 在经历了三年后终于要正式发布了,顿时眼前一亮。毕竟我上一次使用它已经接近一年前了。当时感觉这个软件还有很多bug,文章的编辑体验也不是很好,而且站点管理显得比较繁复。

【送码】三年之期,Thorn 正式版现已推出。 – 少数派

这次重新使用了一下,发现它真的进步了很多。无论是经过重新设计的博客站点,还是后台的编辑系统,都比之前有了长足的改进。而且它的站点托管方式也非常友好。在简单尝试了几天之后,我立刻决定,这就是我一直想要的博客拓展托管平台。于是我马上购买了一个月的试用,现在基本上确定后面要继续使用它了。可能不久后就会再买一个一年的套餐,看看它是否可以支持长期使用。

重新启用思源笔记

就像我之前说过的,博客和笔记软件对我来说都像是玩具。它们不仅能帮我记录想法,更能带来乐趣,就像游戏、音乐等娱乐活动一样。

这两天我重新开始使用思源。之前因为同步不稳定,我差点放弃了它。但上周末上课时,我重新发现了思源的优势——特别是它的悬浮窗口和虚拟引用功能,这些都是 Heptabase 和 Tana 目前所不具备的。

今天我原本只是想打开 Obsidian 来存储博客文章。但用过之后,还是觉得它的界面不够美观,而且同步功能(尤其是移动端)很不方便。当我重新尝试思源后,立即被它的功能吸引住了。

最终,我把所有博客文章都导入了思源。不仅如此,我还用思源的数据库功能复制了一份 Notion 里的数据库结构。这样一来,我的写作流程就更清晰了:先在 Ulysses 完成草稿,然后在 Notion 和思源各存一份,最后发布到博客网站上。

个人博客问卷

博客攒的选题越多,就越是容易想要开新坑。这不,最近看到了一个关于个人博客的问卷,于是决定先把这个容易的题目写掉。

1. 简单介绍下自己或者你的博客?

我的博客名叫“Miobowl 的书房”。这个名字源于我从小的梦想。其实我对自己的生活质量要求不高(除了吃之外),唯独的就是对拥有一个属于自己的书房,一套自己的桌搭有着深深的执念。我希望它既温馨又高科技,有着足够的可定制性。

我的博客主要关注生产力,尤其是知识管理工具相关的软件,同时也分享游记、音乐剧和电影等日常生活内容。可以说,这个博客内容相当杂,什么都会讨论。

2. 什么契机让你开始写博客?

最初写博客是因为在少数派上发过一篇文章,但由于少数派的审稿流程繁琐,加上编辑工具不太好用,就决定弄一个个人博客来存放自己输出的内容。后来,我作为Notion用户,发现了Notionnext这个产品。从那以后,大部分内容都直接更新在自己的博客上,很少发布在少数派。

3. 你是如何完成创作的?

一般我是读了一些内容之后,会通过 AudioPen 或者 Dinox 之类的语音转文字软件进行记录,之后转移到 Ulysses 里进行编辑,编辑完成后导出到 Notion,用 Notion AI 辅助进行最后的格式编辑

4. 运营博客的过程中是否有失去过动力?如果有,是为什么恢复的?如果没有,请问您又是如何保持创作的激情?

写博客过程中,有时确实会遇到难以为继的情况,特别是工作忙碌的时候。我发现写博客的频率与工作忙碌程度成反比。有时为了逃避工作,我反而会花一些摸鱼时间在更新博客上。

除了工作忙的时候之外,有一段时间积累了很多想写的话题,但一直没时间完成,就这么看着选题清单变得越来越长,逐渐感到焦虑,这种状态持续了一两个月。最后还是决定继续写下去,毕竟一个良好的习惯还是很值得维持的。

5. 如何搭建博客,以及运营博客每年需要投入的资金?

我的博客通过Notionnext 服务搭建,域名是在NameSilo 上买的(也是唯一的付费点,每年10刀左右),挂在Cloudflare上,总体上比较傻瓜自动化。

其实我一直想尝试静态博客,但由于技术能力有限,加上维护静态博客需要时间,所以暂时没有往这个方向努力。如果以后有时间,也许可以在Cursor之类软件的帮助下尝试一下。

6. 推荐 1 篇你博客中的文章,并推荐一个你喜欢读的博客,聊聊原因。

我比较满意的一篇文章是关于AI在笔记中应用的思考,归纳了AI笔记应覆盖的几个方面,在之后的博文中也多次引用了这篇文章。

我最喜欢的一个博客是“椒盐豆豉”,她的内容非常生活化,讲述日常生活、购买物品、观看剧集,有时也会针对大议题进行专题研究。这个博客整体语言风格轻松自然,是我模仿的对象之一。另一个比较专业的是Newsletter“Platform Thinking”,他对商业有很多见解,文字流畅性很高,也是我学习的对象。

7. 推荐 1 个近期喜欢的事物?

最近用得较多的软件是DinoxX,一个语音转文字笔记软件,非常完备,但 UI/UX 比较拉跨且bug较多,这是我最不满意的一点。不过,它在语音转文字准确度和功能复杂度上表现出色,比如支持语音转待办和格式化归档之类的功能,而且开发速度快。希望之后在颜值和交互上能有所改进。

8. 想做还没有做的事,或想尝试还没有尝试的主题?

目前攒了很多文章要写,其中最重要的是完成最近期的几篇游记。此外,还有一篇24年初或23年底就想写的游戏生涯回顾,一直只有框架,希望今年能完结。最近续费了Ulysses软件,打算借此机会多输出些内容。

Follow & Arc

Follow 是 RSS 的复兴还是自嗨?

最近各种群里都在密集地分享着 Follow 的邀请码。恍惚间似乎回到了一年多前 Arc 刚开始流行时候的场景。但随之而来的问题就是,Follow 最终会发展到什么样的地步?

且不说后文会提到的 Arc 虽然在数码圈非常流行,但距离真正的”破圈”还是有一定的距离。相比之下,Follow 作为一个更加小众的产品品类,具体有多大的发展空间?是否他只是填补人们臆想的一种信息摄入场景?

张一鸣在 10 年前 Google Reader 关闭前曾经对 RSS 形式的软件表达了不看好。他的观点无疑是符合他的产品观的。他所中意的产品一直是为了满足最多人的需求,因此必然需要降低人们的使用门槛,实现傻瓜式的交互。而这种产品观和 RSS 软件这种,需要用户主观上对内容进行挑选的模式有着截然不同的产品走向。

听了一期关于 RSS 的播客讨论,我之前一直以为 RSS 是很多作者喜欢的方式。因为理论上,一旦作者被算法的大流淹没,不仅丧失了创作方向的自主权,还需要迎合越来越多人的喜好。

然而,听这些创作者的想法后,我发现 RSS 可能并不是一个理想的方式。对作者来说,RSS 并不能带来激励。他们只能看到今天又多了一个通过 RSS 订阅的人,却无法知道这些订阅者的身份,无法进行深入分析。而激励始终是一个问题。

现在,Follow 通过发币的形式进行尝试,可以看看是否能让 RSS 走出这个困境。

Arc 停止运营,意料之中?

这两天在很多群里看到了关于 Arc 要逐步停止维护升级,团队要把重心移到一款新的、以 AI 为主导的横向标签排布浏览器软件上去。这算是一个意外却又在意料之中的消息吧。

其实从 Arc 这个产品推出之初,就可以看出 The Browser Company 是一家非常注重营销的公司。这暗示着它的经营成本一定相当高:一方面它有不少员工,另一方面在营销上投入了大量成本。然而,在获得一定融资后,Arc 浏览器并没能找到一个合适的盈利方式。

正如他们在文章或采访中所说,Arc 浏览器的受众其实比较窄,并没能如他们所期待的那样成为市面上的主流浏览器。它虽然在某些圈子里小有名气,但主要还是在生产力爱好者或注重美观的早期用户中传播较多。更多人觉得它还是有些小众,因此用户规模相对有限。

Arc 的盈利困境也值得深入探讨。传统浏览器的盈利模式主要依赖于搜索引擎默认设置带来的收入。然而,这种模式需要庞大的用户基础作为支撑。对于用户规模有限的 Arc 来说,这条路径显然不太现实。另一方面,提供高级功能的增值服务模式在浏览器领域也面临挑战,因为大多数用户对基本浏览功能的需求已经得到满足。这种困境促使 The Browser Company 重新思考其产品定位和商业模式。

这有点像他们最初将软件移植到手机端时的情况。起初,他们只是简单地将浏览器伴侣搬到了手机上,但很快发现这种做法并没有凸显出自己产品的特色。所以他们后来重新开发了 Arc Search 这个软件。到目前为止,Arc Search 仍是我非常喜欢的一款软件。它在使用便捷性上,各方面都强于现在的默认浏览器。我甚至把它放在了手机屏幕底部的四个快捷栏里。

不管怎么说,对于 Arc 可能会逐渐停止更新维护,我还是感到有些惋惜。毕竟它在使用逻辑和美观上确实比之前的 Edge 等浏览器有很大提升。而且纵向标签的排布也很符合我的操作习惯。

现在只能期待他们团队后续推出的 AI 相关软件的使用效果如何了。不过可以预见的是,既然他们之前没有找到合适的盈利方式,那么之后的 AI 浏览器软件很可能会采取收费模式。在这种情况下,是否有必要使用它就成了另一个需要考虑的问题了。具体情况还是要等新产品发布后再做观察。

再谈语音转文字软件的发展方向

对于 AI 来说,语音交互是一个不可或缺的核心功能。

这几天在群里看到很多人分享他们使用语音与AI交互的场景。例如,在带孩子的时候,可以直接抬起手腕对着手表说话,或者随便在手机上点一下。这种情况下的交互非常自然,不会干扰其他行为。

还有一种场景是骑车通勤时,在等红灯的时候,随手抬起手腕与AI互动,这是一种输入阻力很小且非常自然的行为。如果此时需要在手机上通过键盘输入,阻力就会很大,也不符合自然需求。

语音转文字软件进一步的发展方向是以语音作为核心,在此基础上实现更多地互动,以达成个人 Agent地效果。当年 Siri 想走的就是这条路线,但可惜Siri的智能化程度太低,语音转文字的效率也一般。

Dinox

最近发现了一个新的语音转文字的软件 Dinox,而且初步使用下来,它在多种程度上都可以说是目前为止语音转文字和笔记功能结合得最好的。它在保证了一定的语音转文字识别准确度的基础上,在后续的功能开发的多样性上是目前其他软件所无法比拟的。

某种意义上可以说它是一个功能加强版的 Flomo。得到的 Get 笔记走的也是这条路线,但是对 AI 的使用更为克制,只用在内容输入和搜索方面,而 Dinox 则聚焦于后续的处理

首先,在界面方面,Dinox 的界面和 Flomo 比较类似,都是由卡片加标签组成。但是,它的输入方式除了手动输入之外,最显著的就是通过语音转文字输入。而且在输入之后,会有 AI 进行简单的整理。如果还有需要的话,还可以自己手动选择一些更详细的 prompt 进行整理。

在后续的处理上,可以说集合了很多软件的优点,也有自己独特的 killing feature。它可以通过语音搜索或者进行聊天,同时,还可以通过一些定制化的 prompt,将自己的文字转换为待办,或转化为表格形式,并且能够手动设定表头。此外,还有不同的卡片盒,可以说在卡片笔记的方面,无论是前期的录入还是后期的整理,都有非常好的设计。而且对后期的搜索与关联也做得非常完善。像前文提到的语音搜索,以及它自己还提供了相关卡片功能,可以说是在这个领域里目前为止做得最完备的之一。

当然,它现在上线一个多月,还有不少的 bug,但感觉未来还是可期。还忘了说一点,它还支持导出到 Notion 和 Obsidian,感觉可以持续使用一阵子。

Me.Bot

前几天和MeBot的产品经理聊了聊,探讨了一下对于今后这类产品发展的展望。其实,这也是我第一次比较深入地思考与接触类似于AI Companion,或者说更多类似于这种Agent 的类型的AI产品。

在常见的语音转文字功能之外,它还加入了很多输入和输出方面的功能。输入可能既包括语音转文字、录音,对链接的爬取、对图片的识别等等;输出方面也支持生成待办事项等功能。总体而言,它希望能够成为用户的统一输入输出中心,作为用户的辅助而存在。可以说,这是一个更加完备、UI也更好看的Dot。但未来这个产品的发展前景到底如何,仍然很难说。

在不远的将来,更多的公司会试图在手机端结合这类各种功能,而不需要以软件的形式存在。当然,也很难说这些手机端的模型能做到什么样的水平,有有种可能软件的调教才是最好的选择。

当我们讨论速记产品时,到底什么是速记?

平时我们讨论笔记软件的应用性时,常常关注它是否打开速度快,能否便捷地与其他软件同步等功能。或者,我们可能会研究一个软件是否有助于思考。今天我想讨论一种特殊种类的笔记软件,即记录型笔记软件。

本文部分灵感来源于瑾呈 goidea 的一篇文章,他的系统性笔记流程与我相似。他将笔记分为两类:信息采集,以及专题思考。前者他使用Tana,后者使用Heptabase。大多数人日常使用笔记软件时,主要涉及三个个场景:输入,整理和输出。

今天我们聚焦于输入环节,探讨当我们谈论速记时到底在谈论什么。

速记包含了什么

通常我们要求速记能够精准快速地记录当时的所思所想,方便日后整理。但速记本身不仅仅是文字和图片。在我看来,数据本身的文字和图片只是一个表象。只有将这些记录与当时的情境结合,才是完整的记录。

记录必然有一定的场景或情形激发需求。可能是一段音乐,一个播客,一篇文章,甚至是跑步时脑海中闪过的念头。当你回顾这些记录时,将文字和图片与这些因素结合,才能重现当时的场景。这种回顾能帮助你更好地回忆思维过程,同时有助于信息解锁和关联。

用一个形象的比喻,当我们进行记录时,只记录了冰山浮在水面上的部分,而更多的信息潜藏在水面之下。

近期关注的软件 – Jotmo

在速记领域,最近比较关注的有两个软件,一个是语音输入的Dinox,一个是Jotmo。今天先讲一讲 Jotmo。

尽管在当前阶段,它相较于其他软件,尤其是Flomo,只是改变了输入方式,从传统的文档、卡片式记录变成对话框式输入,但从长远来看,它的愿景还是很有体系的。

Jotmo 希望成为一个能快速全面记录你当下所思所想和 context 的软件。很多时候,我们记录的文字和图片并不能完整反映当时的 context。举个例子,当我们想找以前拍的一张照片时,通常需要借助拍摄地址,通过地图寻找。这些记录场景,包括地址、心情等因素,和记录的文字一起,共同构成了我们的记录内容。

从长远规划来看,Jotmo 希望尽可能多地记录发生场景。在他们的roadmap上,短期内会增加语音转文字作为补充输入方式;长期则考虑接入播客、心率等健康数据,以及目前已支持的时间、地址、设备等多种因素,并尽量自动化采集。这在我看来非常有前景,不仅限于现在表现出的类似flomo 的前端。

如果它能长期发展良好,我看好它能成为快速记录场景下的新兴的有前途的产品。目前,它和新枝一样,都处于养成系状态。心知更多是剪藏摘抄类产品,而Jotmo 则可能成为替代flomo 的记录自己想法的新选择。

Short Form

“麦克纳马拉谬误”,即我们尝试去量化我们认为重要的事物,但最终却只关注了可以被量化的事物,从而偏离了真正的目标。

媒体内容的数字存档工作框架(密苏里大学):

  • Availability(可获得性),也即内容有没有被保存下来;
  • Identity(标识性),也即保存下来的内容是否有独一无二的标识;
  • Persistence(持久性),也即存储系统是否可靠;
  • Renderability(呈现性),也即能不能呈现出内容在媒体上最初发表时的样子;
  • Understandability(可理解性),也即受众能不能按照原意来理解存档下来的内容;
  • Authenticity(真切性),也即信息是否真实未经篡改。

AI 让折腾笔记软件走到了尽头吗?

距离上一次更新已经过了一个多月了。最近忙于工作中的一个项目,基本没有空摸鱼了(笑)。这回趁旅行途中正好有空,梳理一下过去这半年多来对笔记的思考的变化。

对 All-in-one 的祛魅

上个月在即刻上,有人提到今年似乎不再追求笔记工具的 all-in-one 和本地优先等功能,甚至双向链接也用得越来越少了,使用笔记的时候,更加关注内容而不是功能。细细想来,我自己也有类似的体会,近半年来,除了用 Heptabase 系统地读书听课,大部分时候使用笔记的场景都是简单的摘抄总结,不会主动地去在不同笔记间建立链接。

过去这些年,我一直在换笔记工具,从十年前的 Evernote 到Bear、Craft,再到21年的Obsidian、Logseq、Siyuan、Heptabase、Tana和Notion。之前影响我切换的原因主要是功能问题,比如支不支持双链、块级双链、大纲还是文档式,还有在线还是离线等等。每当发现某个软件有某些新功能,总是会下意识地迁移一遍数据,试图能用它来all-in-one地作为我唯一的笔记工具。诚然,某些功能确实是刚需,尤其是支持同步到不同电脑以及手机和iPad的支持,但是大部分功能其实更多的只是锦上添花罢了。

当然,颜值和UI也是很重要的因素。我开始用Bear就是因为觉得它长得好看,平时没事干就喜欢换主题,似乎每换一次主题就能让心情变得更好一些。后来放弃Craft的原因之一也是它能自己调节的余地很小。包括我之前也用了一段时间的Logseq和Siyuan。Logseq的电脑端可以调得很好看,手机端却不支持主题和插件,这让我有点纠结。又比如最近发现了几个好看的Obsidian主题,我就立马回到Obsidian的怀抱去用了一段时间。

但是总体而言,遵循着重器轻用的原则,现在我基本固定下来了使用笔记的几个模块。即语音输入(AudioPen),灵感/摘抄(Flomo),剪藏/阅读(新枝/Readwise),深入学习思考(Heptabase),工作(Tana),数据后台(Notion)。后文中我也会详细讲讲AI在这些模块中又发挥了什么样的作用。

AI 对我的笔记流程产生的改变

AI 的出现,让笔记的管理愈发分化成了信息管理和知识管理两部分。AI 大大简化了信息的获取、分类、总结、搜索。

语音输入

AI对笔记流程最显著的影响莫过于在信息获取环节增加了语音输入这一渠道。在过去,由于语音识别的不准确,语音输入其实是一个成本非常高的动作,我们需要逐字对识别的错误做修改,删改语气词与重复增加标点符号,分段等等。而随着Whisper之类模型的涌现,以及一些支持通过AI对语音笔记进行初步修改的产品的出现,使得语音输入成为了一个重要的输入来源。

我在的一些群里最近也集中讨论了语音笔记价值的问题(起源于许多语音笔记软件如AudioPen、VoiceNotes和SlaxNote纷纷出现)。一些人认为语音笔记的价值不大,因为某些内容如果没有用文字记录下来,就说明这些内容对你并没有特别大的价值。你把它说出来并存储起来,只是类似于“稍后读”,最终可能再也不会读。也有的人认为,当你决定进行语音输入时,其实已经在心中进行了一次筛选。用语言表达出来的过程,实际上也是一次思考和提炼。因此,这些内容依然是有价值的。(以上这段就来自于语音输入后AI改写,AI味还是稍有些浓,以后会继续试试修改一下prompt。目前感觉自带promote效果最好的还是AudioPen)

而对于语音输入亟需提升的地方,因为人们并不是每时每刻都能在家里有一个安静的地方进行语音输入,或者说有的人很多时候是带着 AirPods,这时候他的麦克风效果其实是很差的。因此,语音输入最重要的功能,其实是它在嘈杂环境下的识别能力。

总结与分类

我曾经发表过一个暴论,认为AI的总结是个伪命题。

一般认为,AI 总结有以下几个应用场景:消费内容之前的“预览”,消费中的提炼,以及消费以后的总结记录

这三者看起来是一个东西,但是其实不是。

目前最常见的产品,及用AI速读公众号文章可能是个伪命题。这个需求是被创造的,认为通过把文章转发给一个AI助手,能够让我们快速识别一篇文章是否值得读。 然而,对于大部分人而言,可能其实并没有这个需求。只看标题及文章开头两段,大部分情况下就能知道这篇文章到底是不是需要精读。需要精读的文章自然会存到”稍后读”助手之类的地方,然后仔细精读。 而对于那些看标题来说可能并不值得读的文章,还不如直接跳过,因为它可能本身里面也很少有干货,并不需要通过AI助手来总结里面相关的内容。 所以,这个需求更多的是一个被创造出来的需求,使用的时候也并没有什么比较大的意义。 另外一个思路是,能凭借标题和前两段内容分辨出一篇文章是否值得读的人,本身不是这类服务的受众。更进一步,“大部分人能凭借标题和前两段内容分辨出一篇文章是否值得读”本身是个伪命题

在使用了一段时间类似的产品之后,现在看来,这种说法有些片面。在某种程度上,AI的总结在事前分类方面起到了重要作用,让人能区分哪些内容值得阅读,哪些可以略过。这一点我依然认同。

举个具体的例子,

我可以算是一个播客爱好者了,在小宇宙上关注了几十个播客。然而每天听播客的时间总是有限的。就和稍后读软件里的文章数量一样, 我的小宇宙播放列表里的播客也越攒越多,最近突破了 200 大关。可想而知,每天不到一小时的通勤时间肯定没法听完这么多的播客。

去年黑五趁着打折,薅了两年的 Podwise 会员,但是过去几个月用的次数比较少。最近痛下决心准备好好清理一下播放列表。

Podwise 的 standard 会员等级每个月可以转录并总结 20 次播客,并且可以无限量地阅读其他用户已经转录完的播客。实际用下来,除了过于古早的播客(早于 2023 年上半年),或者过于小众,大部分的播客都已经被其他用户转录过了。我清理到2023年10月,大概 100 多个播客,才用完了一个月的 20 条的份额。

这类总结最主要的功能还是对长篇内容提取大纲,以辅助筛选。尽管文字、视频、音频的信息密度个油不同,但是面对一些长篇的内容时,还是会力有不逮,总结出来的内容非常空洞,甚至连辅助筛选的作用有时候都起不到。

检索

此外,AI在信息检索上也非常有用。最近,我发现Notion AI的Q&A功能大大改变了我的笔记流程。它让我可以将所有笔记,无论是摘抄、剪藏还是自己的蓝图,都导入Notion AI进行统一检索。这样,我可以更放心地使用最优秀的软件,而不必担心数据分散在各处的问题,后端处理完全交给Notion。

以上只是我这半年对笔记的一些思考与记录,有些杂乱,纯粹当做记录下来,以后有空再整合成文章吧

Short Form

玉伯对笔记的思考

前几天听玉伯的播客,提到了他和飞书的一位员工的聊天,内容颇有意思。他认为文档软件和笔记软件是完全不同的品类。笔记是为个人服务的,而文档则是为多人协作而设计。因此,文档软件更类似于即时通讯软件,甚至可以说文档是结构化的消息,而消息是碎片化的文档。

文档软件与笔记软件有很大区别。文档软件的发展前景在于融合更多协作🥱内容。例如,Notion近期收购了Cron这样一个日历软件,就是向协作方向迈出的一步。未来,它可能会推出更多即时通讯类产品,当前没推出可能与国外Notion和Slack、Discord等IM软件的良好融合有关。但最终,协作类软件必然会成为一个独特的品类。

社会地位的来源;重返未来 1999

社会地位的来源

声望地位是“公众对你所拥有的资产的了解,如果你愿意,这些资产可以让你帮助他人”。换句话说,声望反映了你作为队友的价值,无论是实际价值还是潜在价值。

最近读到了一篇 Kevin Smiler 的文章,从独特的角度探讨了社会地位的来源。文章讨论的两种社会地位的来源——支配和声望,实际上涵盖了个体在社会中获得认可和地位的主要途径。支配源于个体或集体的强迫性力量和控制,而声望则基于个体的贡献、能力或其他值得尊敬的特质,这种尊敬往往是自愿的。

这让我想起了多年前学习政治学原理时对权威的定义。从权威的角度来看,强制性权威、魅力性权威和基于制度的权威,实际上前两者也正类似于支配和声望的镜像。强制性权威与支配紧密相连,基于个体或集体对他人的控制和强制能力;魅力性权威则更接近于声望,它依赖于个体的个人魅力和吸引力。而现实中的权威往往可能来源于这两者的结合。

文章比较有意思的一点是,它是从从另一个角度分析社会地位,即从社会地位中“下位者”的角度出发,探讨为什么人们会接受这种社会结构,主动认同或尊重那些拥有较高社会地位的人。这其实有点像是从经济学或博弈论的角度的分析,认为这种认同可能是一种战略性的选择,人们通过认同高地位的个体来获得某种利益或避免损失,这种利益可能是物质的,也可能是社会性的,比如获得保护、资源或社会认同,从而通过这种结构性的社会地位差别,来为个人获取更多的利益。

当然,这种分析方法可能难以完全解释所有社会地位相关的现象,比如偶像和粉丝之间的关系。偶像和粉丝之间的关系往往包含了情感、认同和一些更多理想化的元素,这些可能超出了简单的直接的利益分析。但不管怎样,这篇文章还是提供了一个有趣的视角,当我们在一个概念的主体上产生困惑时,不妨从客体中找找答案。

Reference:

Social Status: Down the Rabbit Hole

(来源于 参考答案 Answers 的 newsletter 以及日推文章,宝藏群组)

重返未来 1999

这两天看了一个关于《重返未来1999》这个游戏的解析视频。我曾在游戏开服时体验过 1999,然而因为第一个活动——雷米特杯 的人物塑造和剧情着实不佳,就弃坑了。后来两次重返游戏,却分别遇到乌鲁鲁运动会和春节曲娘活动,恰好错过了这款游戏中口碑最佳的几个活动。现在看来或许我与这款游戏真的缘分不够吧。

在之前的体验中,我明显感受到它在剧情塑造和时代风貌描绘方面有失水准,因而对那些被吹上天的活动剧情也不是很好进行想象。

这段视频为为何 1999 的不同活动之间落差大提供了相对客观的解析思路:作为一款时代剧或者说时间穿梭背景的游戏,抓住时代特色和脉搏至关重要。然而,在评价较差的活动中,人物和时代背景都被过度标签化,剧情遵循刻板逻辑,缺乏完整故事链条和人物成长。

相反,那些被誉为神作的活动,则成功地将时代特色融入剧情,展示了社会思潮的变化,并在部分思潮变迁中体现出一种现代感的新意。虽然我可能不会再回坑了,但还是希望它能在未来的剧情中越做越好吧。

Short form

大模型的对话每次都是独特的, 并不像互联网时代那样, 一个用户的搜索结果,可以在其它用户身上复用。那是不是意味着, 大模型的商业模式, 缺少了互联网产品的边际成本递减效应? —— 李继刚

用图片来辅助文字,而不是用文字来说明图片

格雷伯对中产(middle class)的定义是我目前为止认为最精确的:如果你觉得暴力机构是保护你的,那你就是中产。换句话说,你看见街上穿制服的,你会有安全感,那你就是中产。这其实和财富不完全相关,和秩序认同感关联更紧密。