译者序

“数据考古学”(data archaeology)是一门新兴的学科,据说是于 20 年前发起,其最初的目的是尝试恢复一些计算机化的气候数据。译者在取得计算机应用技术专业的学位之后的几个月意外发现了一处数据考古学的博士后流动站,并与合作导师立即着手“挖掘”各种未知格式的数据。合作导师对译者说,数据考古学并不等同于大数据时代的“数据挖掘”(data mining),数据考古学的目的在于实现数据的永久保存——是的,计算机化的数据的存储介质,不论是温彻斯特硬盘还是固态存储,其寿命总是有限的。译者当时在想,要想实现数据永久保存,无非是尽可能使用长寿命的存储介质并且定期备份而已。

随后的某一天,合作导师将一个破旧的纸箱推进译者的工作室,让译者试着解密其中的一些光谱图像,并且给了译者一台老旧的便携式计算机,说是可能会用到其中安装的一些专有(proprietary)软件。译者向合作导师询问了该计算机的操作系统登录口令并且承诺不会擅自更改它,然后对所有这些东西进行了除尘,再将它们搬进实验室操作间。

译者尝试打开合作导师的便携式计算机的屏幕,顿时感到一股刺激性的气味。在此译者决定先对该计算机进行必要的清洁,于是合上屏幕翻转机身,只见一些灰白色的细末从键盘的缝隙之间飘落下来。重新打开屏幕卸下键盘,果然不出译者所料,整台便携式计算机内部覆满了烟灰。完成了大部分清洁工作之后,译者注意到该计算机的无线局域网适配器比较特别,只是它的厂商名字的前面一部分已经随着标签的破损而不能识别,厂商名字的后面几个字母的意思似乎是“英雄”(heros)。

重新组装好之后,译者登录了合作导师安装的操作系统,启动界面还是足以让人产生审美疲劳的四色窗格图案。紧接着是长达数分钟的让人抓狂的等待,其间不断弹出各种窗口,诸如“某某开机助手”提示“启动时间过长,急需优化”云云。译者又花费了很长时间将这些窗口一一关闭,然后从箱子里随机拿了一片数据光盘,试着打开其中一个数据文件,却发现该数据文件是用一种不寻常的晦涩的编码方式保存的。

译者作出判断,这些数据是加密的,随后试着运行了合作导师提到的某个专有软件。经过几个小时的 CPU 运算,译者终于能够从输出文件中找到这样一段话(大意):本数字版权管理(DRM)系统受到数字千年版权法案(DMCA)保护,任何恶意攻击行为将会受到美国及国际版权法所允许之最大限度的惩罚云云……

在此,译者发现自己努力的结果是被禁止作出这种努力。但是紧接着,译者想起了自己曾经被反复教育的东西:分享就是盗版,这是对版权持有人的大不敬。而所谓的版权持有人,应该就是那些为人们付出辛勤劳动并且贡献了这些软件的作者。也罢,作为软件的作者,理应由于他们为人们所做的贡献拥有某种权利,如若不然,任何人都可以随意复制软件副本,还有谁愿意继续为软件产业无私奉献呢?

译者从光驱中取出数据盘片,将它扔回纸箱,开始思考如何向合作导师说明这个问题。一遍思考,一遍漫无目的地翻弄纸箱里堆放的各种数据盘片。就在译者翻到箱底的时候,发现了一片不寻常的盘片,上面还贴着一张似乎是由上一届的师兄留下的标签。译者拿起盘片,只见上面印着“通用操作系统”、“20 周年纪念版”这样的短语。这张盘片中会不会暗含着什么玄机呢?

译者小心地取下了盘片上面贴着的标签,幸运的是,并未损坏盘片的记录层。只见标签上写着“此系统不支持英特尔迅驰平台的无线网卡”。似乎这就是译者所在的实验室弃用这种“通用操作系统”的原因之一。译者想起合作导师的这台便携式计算机的无线网卡不是英特尔的,而是一个叫什么“英雄”的牌子,并且这台机器也没有英特尔迅驰平台的标识,只有一个“奔腾 M”处理器的标识。带着这种好奇心,译者将盘片装进光驱,重新打开计算机。让译者眼前一亮的只有这款操作系统的代号:Wheezy。桌面一角的通知区域显示着什么“检测到无线网络连接”,

译者隐约地感到,这不只是一款操作系统。虽然译者和它仅仅是初识,但已经能够隐约感受到蕴含在其中的一种理念,它深藏不露,不为众多普通用户所知,却又有着让人难以抗拒的感召力。译者从应用程序选单中找到了 IceWeasel 这款浏览器并且用它查找了与这款“通用操作系统”相关的官方网站,终于能够勾勒出这种理念的大致轮廓。随着坚持不懈的努力,事情终于开始变得明朗:译者所遇到的并不只是一款普通的“通用操作系统”,而是传说中的“GNU 计划”……

带着一种难以用语言描述的心情,译者开始试着了解 Richard Stallman 创立 GNU 计划以及自由软件基金会的事情。短暂的激动过后,译者渐渐平静下来,开始重新思考关于本文开头提到的“数据考古学”的问题。如果人类的文明遗产是用某种私密的格式保存的,这确实可以用于限制人们在当代对于它们的访问并且确实有利于维护某些出版商的利益。然而,它们终将随着介质的损坏或者出版商的倒闭或者更改存储格式而丢失。再进一步,限制个人对这些文化载体的访问似乎还只是个小问题。当前,无论是图书馆、档案馆、博物馆,在保存和传承文化遗产的时候越来越依赖数字技术,它们需要对各种数据进行解读和复制。而当前流行的数字版权系统仅在出版商仍然活着并且仍在使用相同的系统的时候有效。一旦那种数字版权系统不复存在,基于它的人类文明遗产就将永久地堕入数字黑暗时代。放眼望去,有多少计算资源和公共资金花费在了这些很可能在数年之后完全不可读取的数据上面?到那时候,人们失去的不仅仅是这些资金,更是其价值不可用金钱衡量的文化、历史、教育遗产。也许,几个世纪之后的“数据考古学家”将会无法理解,为何 21 世纪的人类社会将自身的文化遗产锁定在自身之外……难道人类发展数字技术只是为了将自己的文化遗产置于永恒的数字黑暗时代之中,让后人感叹自己的愚蠢和短视吗?以此为代价换取出版商的短期利益,这样的代价是否真的值得付出?

天亮以后,译者向合作导师提交了报告,随后离开了数据考古学实验室。因为,译者正在从事的这门学科竟然是一门本不应该存在的学科。

无论如何,译者感激 Richard Stallman 于 30 年前发起的 GNU 计划及其为自由软件运动作出的不朽贡献。每一位使用自由软件并且从中获益的用户都应当感激他。否则,人类文明的火种将有可能永久地熄灭在无尽的数字黑暗时代之中。而正是由于 Richard Stallman 这样的自由软件运动参与者们的高贵付出,人类文明之火才有可能永世不灭地照亮后代的前行之路。

谨以此文感谢 Richard Stallman 和自由软件基金会以及其他自由软件运动的贡献者,以及为本书部分内容本地化做出无私贡献的哲思社区等志愿者。

Nadebula 作于“天空之城”数据考古学实验室