Bom dia meus amigos,

Saudações de Lisboa!

您正在阅读的《壹苇可航》电子报 2025 年第 43 期

2025 年 11 月 18 日,Cloudflare 因配置更新出错,宕机约 3 小时,完全恢复则更是耗费了近 6 小时。影响了全球范围内超过 750 万家网站和众多主流服务平台,包括 𝕏、ChatGPT、Claude、Spotify、麦当劳官网、金融服务等。

三天后,我的主力笔记工具 Tana 也经历了一次「微型崩溃」,home node 在 backend 被误删,整个 workspace 无法访问。

两次事件,一个在宏观的全球互联网基础设施层面,一个在微观的个人数字工具层面,但它们都暴露了现代数字基础设施的共同本质:一座建在沙子上的宫殿。

An image to describe post

这一周里,网上流传着这张极具讽刺意味的图片。那么本期就从这张图片出发,谈谈现代数字文明的核心特征:Vulnerability(脆弱性)。

以下是本期正文。


🔍 Insights

10 月,我的博客因 BearBlog 的自定义域名服务器故障无法访问。我当时用 Cloudflare Workers 实现了自动切换,问题迎刃而解。那一刻我甚至有些沾沾自喜地发了推文,以为构建了某种韧性。

直到 11 月 18 日 Cloudflare 宕机,我才猛然发现这种韧性的虚假:我的域名托管、DNS 解析、CDN 全都在 Cloudflare。当这个单一节点失效时,我连切换到 Secondary DNS 的入口都被切断了。不是没有备选方案,而是我根本失去了执行备选方案的「支点」。

这揭示了单点故障的本质:不是服务暂停,而是选择权归零。

如果我们将视角拉高,会发现这并非 Cloudflare 的单方过错,而是现代数字基础设施的结构性特征。为了效率,我们选择集中化;为了便利,我们选择标准化;为了降低成本,我们选择依赖少数关键节点。吊诡的是,每个微观选择都是理性的,但所有这些理性叠加在一起,却制造了一个宏观上的极度脆弱系统。

这种脆弱性通常是隐形的。平时系统运转良好,我们就像在畅通无阻的高速公路上飞驰,只有当前方堵塞、又发现没有出口时,才意识到自己困在单行道上。

Tana 的崩溃让我体验了这种脆弱性的个人版本。当 Home node 被后端误删,我的整个工作区瞬间无法访问。数据的物理实体还在,备份也在,但我无法读取。这不是数据丢失的问题,而是访问权限被系统架构剥夺的问题。这记重锤让我清醒地意识到:我一直以为自己在「使用」工具,实际上是在「依赖」系统。而依赖的代价,往往只有在失去时才会显现。

Cloudflare 常被网友戏称为「赛博菩萨」,对个人用户和初创公司极其友好。这次宕机影响了全球约 20% 的网站,包括 𝕏、ChatGPT、Claude、McDonald's 等巨头。这个数字本身就是一种警示:一家公司的失效就能让全球五分之一的互联网瘫痪。

为什么它能获得如此大的市场份额?因为好用、免费、对小用户友善。这种友善触发了正反馈循环:用户越多 → 边际成本越低 → 免费服务越好 → 更多用户涌入。最终,替代方案因缺乏竞争力而消失,单点故障成为系统的必然属性。

这是善意铺就的陷阱。

这里存在着一种极不公平的「风险不对称」。Cloudflare 的商业模式依赖规模效应,它集中了收益;而当宕机发生时,虽然 Cloudflare 会面临公关危机,但真正承担不可挽回损失(交易中断、信誉受损)的,是那 750 万个依赖它的网站。提供基础设施的一方集中了权力,使用基础设施的一方却分散了全部的生存风险。

那么,为什么我们会对此趋之若鹜?

剥开技术便利的外衣,我看到的是人类对确定性的深层渴望。我把所有服务放在 Cloudflare,不是因为我不懂分散风险,而是因为集中管理带来的「可控感」。一个控制面板,所有配置清晰明确,这符合大脑对秩序的偏好。选择 Tana 亦是如此,我们迷恋那种「所有笔记、完美连接」的幻觉,以为这样就能控制知识、规划思考。

这种对确定性的执着,让我陷入了「银弹思维」:相信存在一种完美的工具或架构可以解决所有问题。这种信念导致我过度优化运行效率,却忽视了系统的适应能力;我花费大量时间打磨工具的锋利度,却忽略了系统的韧性。

Cloudflare 的宕机和 Tana 的崩溃是两记警钟,它们告诉我:我追求的不是真正的稳定,而是「对稳定的感觉」。我要的不是系统永不失效,而是平时看起来一切都在控制之中。但控制,本质上就是一种幻觉。

从斯多葛哲学的角度看,我需要重新划定控制的边界。我无法控制 Cloudflare 是否宕机,无法控制 Tana 是否出 Bug,但我可以控制自己如何看待失效,以及如何为失效做准备。这不是要建立某种完美的备份系统(那又是另一种对确定性的妄念),而是要从根本上接受「失效是常态」。

从佛教的视角看,这是对无常的直接体证。系统会崩溃,工具会消失,服务会终止。这不是异常,而是缘起性空的本质。我们对永恒稳定性的期待,本身就是痛苦的来源。

而从批判理论的角度,我需要时刻警惕技术承诺的乌托邦。当一个工具声称能提供完美的一站式解决方案时,我必须追问:谁在从这种集中化中获益?由于便利,我要让渡多少自主权?

这些反思并非为了让我因噎废食,放弃使用 Cloudflare 或 Tana。它们依然是强大的工具。关键的转变在于态度:从追求绝对控制,转向培养适应能力。

不是建立「永不失效」的系统,而是建立「快速恢复」的心智。不是消除所有依赖,而是清醒地看见依赖。

现在,Cloudflare 已经恢复,Tana 已经修复,沙漏又开始流动。但下一次堵塞一定会来。那时,决定我如何应对的,不是我建立了多么完美的系统,而是我是否准备好与脆弱性共存。

📰 Curations

From decentralized utopia to internet oligopoly

https://xpert.digital/en/von-der-dezentralen-utopie-zum-internet-oligopol/

这篇文章的标题本身就是一句极佳的判词。作者犀利地指出,Cloudflare 的宕机并非单纯的技术故障,而是互联网架构「再封建化」的症状。互联网最初的设计愿景是去中心化的(为了在核打击下幸存),但资本的效率逻辑将其重塑为了高度中心化的寡头垄断。

我们常说「不要把鸡蛋放在同一个篮子里」,但现实是,所有的篮子制造商都把生产线外包给了同一家工厂。这篇文章的盲点在于,它虽然批判了寡头,却未触及更深层的悖论:用户并非不知道中心化的风险,而是除了「便利的暴政」,我们似乎已别无选择。

The Illusion of Control: How Knowledge and Expertise Misclassify Uncertainty as Risk

https://www.mdpi.com/2227-9091/13/10/188

这篇论文提供了一个极佳的认知科学视角。它论证了「专业知识」和「复杂的工具」反而会加强一种认知偏差:控制幻觉(Illusion of Control)。我们倾向于认为,只要拥有了足够的数据和足够复杂的仪表盘,就能将不可预测的「不确定性(Uncertainty)」转化为可计算的「风险(Risk)」。

Five basic principles of digital resilience

https://english.ncsc.nl/publications/publications/2025/06/26/five-basic-principles-of-digital-resilience

大多数安全建议都试图教你如何建造一座攻不破的堡垒,而这份指南教你如何在其必然被攻破时幸存。特别是「原则 5:为事故做准备」,强调了备份测试的重要性。这与斯多葛学派的「预演不幸(Premeditatio Malorum)」不谋而合。通过预演最坏的情况,我们不仅获得了技术上的恢复能力,更获得了心理上的免疫力。

Designing digital resilience in the agentic AI era

https://www.technologyreview.com/2025/11/20/1127941/designing-digital-resilience-in-the-agentic-ai-era/

这篇文章完美展示了「技术解决主义(Technological Solutionism)」的陷阱。为了解决 AI 代理带来的不确定性,方案竟然是引入一个更复杂、更中心化的数据架构。这就像是为了防止巴别塔倒塌,而试图在塔外再包一层更重的脚手架。这种对「统一架构」的迷恋,恰恰是制造单点故障(Single Point of Failure)的思维源头。

Digital Resilience: A Conceptual Framework for Information Systems Research

https://aisel.aisnet.org/jais/vol24/iss5/11/

这篇发表在 JAIS 上的论文试图为「数字韧性」建立一个严谨的概念框架。作者将其定义为组织从 “exogenous shocks” 中恢复的能力。区别于传统的抵抗变化的能力(稳健性),「韧性」强调的是在冲击后恢复、适应并演化的动态能力。