论信息的永久保存

科幻小说《三体》当中,近乎于永久保存信息的方式,竟然是原始的「把字刻在石头上」。

这种想象可能有些过于狂野,但是虚拟信息保存的不靠谱性,是一个固然存在的问题。

近期,百度贴吧隐藏了2017年1月1日之前的全部帖子。关于这件事情的动机,路人皆知是为了审查历史内容。2017年是中国互联网绑定手机实名制的元年,抹杀2017年之前的内容即可消除历史上对政府不利的匿名言论。本文主要不讨论政治性的原因,而关注信息的永久保存这一课题。

首先,需要说明一点:「永久」保存是不可能做到的。本文当中的永久保存,指的是长期保存,时限以一个人的有生之年作为界限。

如何才能将信息保存到自己死去之前呢?互联网上的保存方式大多不靠谱,甚至包括区块链在内都不见得会永世长存。试问:50年后,比特币、以太坊和 IPFS,真的100%还会存在吗?这个问题,我想没有人敢给出明确的回答。等而下之,Google、Microsoft、Apple、Faccebook、腾讯、百度、阿里,这些互联网巨头,其可能的寿命,更是无法预测。更何况还有商业利益以及政治因素推波助澜删除内容。

也就是说,只有本地保存的方式能确保长期保存。如果打印出来,以实体的形式保存,固然能忠实还原二维的内容结构,但是人一生当中会经历很多次搬家,那么丢失简直是在所难免的。而实体文件无法关键词检索,因此也非常不合适用于大量信息内容的保存。

任何电子格式,都可能在未来几十年之内被完全淘汰。这甚至包括了常用的 Word、MySQL、HTML。实现一下,未来如果实现了 AR (增强现实),那么虚拟事物的呈现方式,必然不再局限于屏幕时代的二维形态,那么基于二维形态的图文视频等都会成为被历史淘汰的格式。

现有的格式当中,唯有纯文本有机会长存,而且是本地保存的纯文本。 我号召大家能认清现实,重新回到纯文本的怀抱,就如同过去千百年来我们的祖先所做的那样。如无必要,不要在文本当中插入图片,因为图床的平均寿命只有几年;如果非得插入图片,则有必要加入详细的图注,以便即使图片失效,也不影响阅读理解。并且,在纯文本当中,还需要放弃超链接,因为没有任何一个本地或互联网上的超链接地址是永世长存的。除此之外,还需要谨慎使用流行语、黑话和不常用的英文缩写,以免几十年后无法解读。

当然,如果有朝一日 UTF-8 编码失传,那么中文的纯文本内容也全会成为泡影。不过,我‌(盲目地)相信在有生之年,UTF-8 仍然可用。

2019年5月16日

于美国纽约


ip时代的贴吧,是最有意思的时候。我还记得那种感觉:搜索一个词,点进贴吧,意外发现这世界上还有同好。发现少数派,连接世界。那简直是西部时代。那种洋溢在互联网里快活和充满活力的气氛至今都忘不了。不像现在:分割世界,把每个人都困在信息孤岛里。无处不在的管理员,小心翼翼在政治和资本里夹缝生存的网络平台。互联网,的确,正在变得越来越没有意思。然而离开它们,我们又能去哪里说话,找谁说话呢?

作者:leee 链接:https://www.zhihu.com/question/324211119/answer/684753049 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。