如何确保我们的数字遗产不会消失在未来

38次阅读

共计 3828 个字符,预计需要花费 10 分钟才能阅读完成。


Forbidding Blocks. Concept: Mike Brill; Drawing: SafdarAbidi; Image courtesy of BOSTI.


怎样才可以记录或写下那些可以被 10000 年后的人们阅读和解释的指令呢?

1992 年,一个多学科研究小组坐下来回答了这个问题,他们努力创造出经得起时间考验的针对放射性污染的警告标志。这项研究凸显了我们在长期信息检索中都面临的一个十分基础的挑战——互联网架构师 Vint Cerf 将这种现象称为“比特腐烂”(bit rot)。

1979 年,美国国会授权在新墨西哥州卡尔斯巴德镇外几英里处建造废物隔离试验工厂(WIPP)。WIPP 旨在将防御相关的放射性废物储存在该地区的地质稳定盐矿床中。但在该项目面临的众多挑战中,如何将埋藏废物的危险传达给后代是最为棘手的。

由于所处理材料的放射性,该团队的任务是创建警告“标记”,这些标记不仅要经受住 1 万年时间的考验,而且从现在开始产生它们的 1 万年后,当语言甚至是人类交流的手段可能是难以想象的不同时,还要保证人类能明白它所要传达的信息。

设计这些标记是 WIPP 研究团队面临的一个至关重要且艰难的任务。首先,标记需要耐用。按照团队的说法,他们需要承受“人类破坏建筑物的倾向。”他们需要向未来传递当下的,可能不会在未来出现的设计语言,亦或者向表现出截然不同的文化规范和期望的社会传递内容。他们需要传达有关埋藏材料危险性的高度复杂的信息。

Landscape of Thorns. Concept: Mike Brill; Drawing: Safdar Abidi; Image courtesy of BOSTI.


换句话说,一个简单的“危险:请勿入内”的标志根本不足以来传达该项目涉及的危险信号。加之,根本就没办法用打印文档、数字文件或“Googleable”来让未来的人类了解更多信息。

因此,包括概念艺术家迈克·布里尔在内的团队开发了一系列优雅的标记概念,旨在可以超越时间、语言和文化,并在千百年后仍旧能发出一个明确无误的信息:这是一个危险的地方,一个要避免投入使用的地方。他们总结说,石头、地球和艺术比我们目前所依赖的短暂的信息存储媒介更耐用 – 考古学家和历史学家都非常清楚这一点。


Spike Field. Concept: Mike Brill; Drawing: Safdar Abidi; Image Courtesy of BOSTI.


在 21 世纪,WIPP 标记似乎离我们的生活很遥远,但它清醒地提醒我们,在当今数据爆炸的世界里,我们生活在“信息长寿”和“可恢复”的幻觉之下。凭借我们以指数级加速生成和存储数据的能力,很容易认为互联网上的内容就是保留在网上的。然而,无论情况是否如此——我个人认为,事实并非如此——真正重要的是我们阅读和利用这些信息的能力。

这就好像互联网上存在的信息将永远存在变成了一种集体无意识。

这就是 Vint Cerf 所说的“比特腐烂”。在 2008 年对 Esquire 的采访中,他声称,“在一百或一千年的时间里,保持软件连续性以解释旧东西的可能性是接近于零的。现在你还会找得到 8mm 胶片的投影仪吗?如果新软件无法实现向下兼容,那我们其实就丢失了这部分信息内容了。我称这为比特腐烂(bit rot)。这是一个很严肃的问题。”他在接下来的几年里努力推动这一意识在当今社会中的觉醒,以及“数字牛皮纸”(digital vellum)的概念,这是一种作为确保数字信息可以在数百年后被解释的方法。

可 21 世纪的当下,无论是“数字腐烂”还是“数字牛皮纸”都没有太大的吸引力。就好像我们已经默认互联网上传播的知识将永远存在一样。然而,现在正是因为我们能够如此轻易地找到的想要的信息,所以仿佛从此我们就不会介意未来数百或数千年的问题了。

这对我们日常生产的所有信息在未来的可访问性产生了严重影响。同时它也带来了另一个问题:我们将如何被后代,甚至在我们自己的一生中所看到和理解。当重建某人的生活的唯一方法是通过数字足迹,是在谷歌、微软等科技巨头的规则允许的情况下产生的信息,那是谁在决定我们后代对我们的看法?甚至我们是否真的出现过?在未来深度虚构与虚拟现实越来越普遍的情况下,如果这种现实被“数字腐烂”,我们将如何建立真实现实的基石呢?

最近我收到了一个意外的包裹,它提醒了我,我们的数字足迹的保存在这个世纪是一件多么困难和迫切的事情。这个包裹里有许多几年前与我在同一研究室工作过的同事留下的便条和笔记。同时,它还包括一张旧 CD-ROM。


CD-ROM 与 Paper Archives。图片由 Andrew Maynard 提供。


CD-ROM 是我在办公室清理出的旧档案之一。1999 年 12 月,当我离开英国到美国工作时,我把它烧掉了,它包含了我在 20 世纪 90 年代的研究文件。

作为一名 Mac 用户,我早就不再使用像 CD-ROM 驱动器那样过时的电脑了。但我设法拼凑了一些东西,并发现了一些 20 多年前的职业生涯中的新惊喜。

第一个好消息是我仍然可以访问曾经的一些数据 -CD-ROM 还没有完全地过时。也就是说,我不得不承认,几年前,当我意识到自己拼凑出某种读法的机会几乎为零后,我从 80 年代开始就把我的软盘扔掉了——但如果我在最近的一次文件存储中使用的是光盘,不论是 3.5 英寸的软盘,或是 5.5 英寸的软盘的话,那我的信息早就消失在了数字世界中。

第二个好消息是,我仍然可以在 CD-ROM 上读取文件。我仍然使用像 Microsoft Word 和 Synergy Software 的 Kaleidagraph 这样的应用程序来完成我的工作,而在 20 世纪 90 年代我在之前版本中保存的文件仍然可读。感谢 Microsoft 和 Synergy Software 认真对待向下兼容性的问题!

然而,即便这样,依然有大量文件是不可读的,要么是因为我无法访问正确的软件,它们与当前版本的软件不兼容,或者原始软件包根本不再可用。因此,我的数据文件、数学模型、论文、报告和电子邮件,这些都是“比特腐烂”的受害者。与书面记录不同 – 我仍然拥有 90 年代早期的实验室书籍,任何人都可以阅读 – 这些数字档案甚至不会持续几十年。

当然,我的那些档案里可能有很多垃圾。可以肯定的是,在过去的 20 年里,我没有为这些内容的不易读取而感到任何后悔。然而,如果有人想用这些来重建我的工作,或者用它们来了解我作为一个年轻的研究者的身份,他们会被难住的。

对我来说,这是比特腐烂潜在危险的一部分。我们被如此多的数据所包围,以及如此多的存储和检索方式,很容易忽视无法立刻触手可及的东西。我们认为重要的东西正在消除我们生活中的平凡和细节,或者更确切地说,我们的应用程序提供商决定了什么是重要的。现在这似乎不是什么大问题。但是在 50 到 80 年后,当你的孩子和孙子们试图拼凑你的生活时,在大科技允许留下的信息片段中会出现巨大的漏洞。

在一个世纪或更长的时间里,谁会说任何人都能够阅读到你的电子邮件、社交媒体消息、精心制作的文档或数字日记呢?

当你考虑使用楔形文字、洞穴壁画和其他形式的高度持久的记录媒介时。传记作者和历史学家可以获得大量的书面信息,这些信息有助于将数百年前,甚至数万年前的人们的生活拼凑在一起。

除非我们对科技巨头控制和埋葬我们的数字遗产感到高兴,否则我们需要更仔细地考虑比特腐烂。

具有讽刺意味的是, 相比数字科技,这些最早的信息记录形式与 WIPP 标记有着更多的共通点。上几代人 – 因为他们没有其他选择 – 主要使用耐用的媒介来进行记录,他们不需要运用复杂的、需要经过时间考验的符号来解释记录的内容,这是文化流动所带来的的益处。因此,我们对他们的了解比后代对我们的了解还要多。

幸运的是,潜在的“比特腐烂”问题正在改善。标准化的数字格式(如 PDF 和 JPG)使得长期可访问性变得更加容易,而数字内容的开放标准使得确保文件可读性更加容易于软件开发人员。然而,如果你使用专有格式或平台来处理您的数字信息 – 即使它已经很成熟 – 也有可能会在某一天感受到它的衰败与消逝。也许不是现在或几年后。但我们都清楚,拥有这些专有标准的公司不会永远存在。即使它们存在,它们也会控制用户访问数据的能力。想象一下 Microsoft Office 的未来版本,它不允许你打开旧文件(或者需要访问费用);或者,如果 Adobe 决定免费的 PDF 阅读器不属于他们未来的商业模式;或者 Google 服务最终消失在付费专区后面。

这些情况目前看来发生的可能性并不是很大——至少在可预见的未来是这样。但是,如果我们不想消失在“比特腐烂”的无声无息中,我们需要变得更聪明,我们需要思考我们的数字生活怎样变得“可恢复”。这其实也没有特别艰难,我们只需更深入地了解如何以及在何处保存和存储重要信息。这可能意味着将重新引入经时间验证的技术,如笔和纸张,或者像 WIPP 团队一样,转向有意义的符号寿命的延长。它甚至可以像 hi.co 网站档案馆一样雄心勃勃、充满前瞻性,该档案馆的资料被蚀刻在一系列 2×2 英寸的镍板上,并声称其保质期为 10000 年。

无论我们选择什么样的存储方式,除非我们乐于让科技巨头控制和埋葬我们的数字遗产,否则我们需要更仔细地考虑比特腐烂这一问题,以及如何在我们日益数字化的生活中保留对我们来说重要的东西。否则,我们都将有可能成为数字鬼魂,或者更糟一点:生命中最微小的一点生命的痕迹,被活生生的和抹去,一点点腐烂成一无所有。

 以上信息来源于网络,由“京东云开发者社区”公众号编辑整理,不代表京东云立场。

正文完
 0