互联网档案馆(The Internet Archive),自1996年成立起,定期收录并永久保存全球网站上可以抓取的信息,提供互联网
多媒体资料档案阅览服务的数位图书馆。其宗旨是“普及所有知识”,提供数字资料的永久性免费储存及获取。
简介
由Alexa创始人布鲁斯特·卡利(Brewster Kahle)创办,互联网档案馆是一个提供Wayback Machine服务的公益性质的计划。非正式中文名有“网站时光倒流机器”“互联网档案馆”等。对于不同的网站,其收录的网页数量和收集周期也不相同,一些大型网站可能每天都会被“备份”一次,每次可能收录数十个以上的网页,而一些小型网站可能每年收录几次,每次只有几个网页。对网站不同时期的历史资料进行研究,是互联网档案馆最大的价值所在。用户可以通过Internet Archive的“Take Me Back”对网站的发展与历史资料进行研究。
历史
1996年,卡利(Brewster Kahle)在创立盈利性的Alexa Internet的同时也创立了互联网档案馆;同年10月开始收集存储数据[。而档案馆亦曾于1996年5月10日下午2:42保存了已知最早的页面。 不过,直到2001年开发了“
时光机”前,这些数据都无法访问。1999年末扩展收集范围。
2012年8月,互联网档案馆宣布将在其现存的130万文件的下载选项中加入
BitTorrent。因为透过两个文件
数据中心协调,这成为从该档案馆下载数据的最快方法。
2013年11月6日,档案馆在里奇蒙德区的总部失火,损坏了许多设备和一些附近的公寓,预计损失达到60万美元。 2014年11月,互联网发布测试版,2016年3月,移除旧布局。
2016年11月,卡利宣布互联网档案馆正在建立
加拿大分站,总部将设在加拿大,但具体地点没有公布。 媒体报道中,卡利表示 :11月9日,在美国,我们突然意识到一个承诺进行彻底变革的新政府的出现。这强有力地提醒我们,像我们这样有长期计划的机构,也需要为适应变化而设计。对我们来说,这意味着我们要保持我们的文化材料的安全、隐私和永远可访问。这意味着要为一个可能面临更大限制的网络做准备。这意味着在一个政府监视不会消失的世界里为用户服务;事实上,政府监视看起来还可能会再增加。纵观历史,图书馆一直在与严重的侵犯隐私的行为作斗争——人们仅仅因为他们阅读的内容便遭到逮捕。而互联网档案馆正在努力保护我们的读者在数字世界的隐私。
从2017年开始,
OCLC(OCLC]]和互联网档案馆通过合作,使该档案馆的数字化图书记录可在WorldCat上访问。
2018年以来,互联网档案馆推出
视觉艺术入驻项目,将艺术家与档案馆超过48pb的 数字化材料联系起来。在为期一年的项目中,视觉艺术家创作了大量作品,顶峰时期还举行了展览。其期望是将数字历史与艺术联系起来并为后代创造一些能在线上或线下欣赏的东西。 2019年,互联网档案馆位于
旧金山的总部收到炸弹威胁,迫使该大楼暂时被腾空。
互联网档案馆的大部分材料来自捐赠,例如2017年
波士顿公共图书馆提供的大量78转/分钟的光盘,2018年特伦特大学捐赠的25万本图书, 以及马里格鲁夫学院图书馆在2020年关闭后的全部藏品。其后所有材料经过数字化后进行数字存储,而数字副本返回原始持有者以及在互联网文件进行复制,如果不是公共领域中的内容,可在遵循首次销售原则的受控数字借阅(CDL)理论的前提下,每次借给世界各地的一个顾客。
档案计划
“互联网档案计划”分为六大部分:
一、电子书
这个部分,我以前已经介绍过了,它专门收集公共领域的书籍和文档,任何人都可以免费下载。截至到今天,共有29万多种材料,堪称互联网上最好的公共领域图书搜索引擎。
它主要收集英语书籍,但也包括少部分其他语种的书籍,比如
朱熹的《
论语集注》。
二、网页
这个部分有个专门的名字,叫做”时光倒流机器“(Wayback Machine),它像收集旧报纸那样收集旧网页。举例来说,
雅虎的首页就有5000多份档案,最早的可以回溯到1996年10月17日,最近的则是2007年8月30日。
要将全世界的网页都保存下来,这需要多大的存储容量啊。根据2006年的统计,当时Wayback Machine的存储容量有2000T,然后还在以每月20T的速度增加。
三、视频
这个部分收集视频材料,你在其中可以找到动画片和电影。
四、音频
音频材料主要是有声书籍和音乐。
五、软件
六、教育材料
这部分主要是美国大学课程,有视频和文字材料下载,相当于不去北美就可以上那里的课,比如
麻省理工学院的《微分方程》和Naropa大学的《艾伦·金斯堡的诗歌》。
参考资料
Warning: Invalid argument supplied for foreach() in
/www/wwwroot/newbaike1.com/id.php on line
362