数码人生 各国的图书馆开始保存网站,但不能面面俱到 Oct 21st 2010 在数码界,出乎意料的事情屡见不鲜。当谷歌忙于将书籍扫描成数字文档时,各国图书馆已经开始保存这个在线巨人漏掉的资料。尽管谷歌这类搜索引擎提供网站的索引服务,但并没有把网站保存起来。很多网站因其所有人缺乏资金或失去兴趣而昙花一现。Adam Farquhar负责大英博物馆的数字项目,他指出在某种程度上全世界对20世纪初期的记录比21世纪初期的记录要好。 在1996年,一个名为Brewster Kahle的计算机科学家和因特网企业家,成立了英特网档案室,这是一个非营利性的组织,致力于网站的保存。他也开始委婉地敦促各国的图书馆关注保存网站的问题。几轮选举中出现很多有意义材料,但从未以书面形式保留下来时,此时,各国图书馆开始关注这一问题。 2003年,11家各国图书馆和因特网档案室启动一个保护数码信息的项目:此类信息没有以数码之外的任何其他形式存在过。这个称为“国际因特网保护联合体”的项目,现有39家大型机构图书馆。但是这一任务几乎无法完成。理由之一是网络上的数据量极其庞大。这些团体已经收集了几拍(petabytes)的数据(一拍大约能装下10万亿篇本文)。 另一个问题是如何确保现在储存数据的格式,在几个世纪之后依然存在。古代的一些书稿人们到今天还能读。但是很多过去的数字媒体,即使勉强能读,也仅限于为数不多的几台老掉牙的机器。国际因特网保护联合体已经单独创立一种格式,让未来的历史学家更有可能找到读取这些数据的机器。但一种解决方案不能抓取所有内容。网站发布工具越来越多地按照数据的复杂程度提供内容丰富的网页。以各类专有格式(如windows media player)储存的音频和视频内容也是个大问题。万一2210年微软破产或无人知晓怎么办? 现在面临的最大问题是钱。大英博物馆估计储存数字文件的花费是储存物理文件的一半。但是数字内容要多很多。美国国会图书馆很幸运,因为国家有具体的保护网站的命令和预算。大英博物馆还在争取这种命令。 因此,各国的图书馆决定共同完成这个任务。它们分别承担其顶级域名内的数字作品(如后缀为“.uk”或“.fr”的网址)。如果某些国家域名庞大,如英国和美国,馆长们不要指望把什么都保存下来。他们需要重点处理关系国计民生的材料,如选举、新闻网站和公民的报章杂志或创意使用网站的方法。 每天,都有无数网站消失,更让人感到时间紧迫——图书馆也不得不根据社会文化需要,灵活处理。过去习惯做法是凡是新文件,一一标注保存。现在则必须牺牲准确性换取规模和速度。标准、目标或预算都没确定,就开始工作了。而标准、任务、预算还可能变更。同很多网站一样,图书馆也将陷入所谓“永久试用”的境地。 |
|小黑屋|手机版|网站地图|关于我们|ECO中文网 ( 京ICP备06039041号 )
GMT+8, 2024-11-25 13:26 , Processed in 0.065479 second(s), 27 queries .
Powered by Discuz! X3.3
© 2001-2017 Comsenz Inc.