互联网档案馆(英语:Internet Archive)是美国的一个非营利性的、提供互联网多媒体资料档案阅览服务的数字图书馆。互联网档案馆由Alexa创始人布鲁斯特·卡利于1996年创办,总部位于加利福尼亚州旧金山的列治文区,其使命是“普及所有知识”(universal access to all knowledge)[5][6]。该网站提供的数字资料有如网站、网页、图形材料音乐、视频、音频、软件、动态图像和数百万书籍等的永久性免费储存及获取的副本。
迄至2021年2月,该网站存储了7280 亿个网页、3800万本书和文本、1400 万个录音(包括 240,000 场现场音乐会)、700 万个视频(包括 200 万个电视新闻节目)、400 万张图片、790,000 个软件程序。[7]除此之外,互联网档案馆也是网络开放与自由化的倡议者之一。
历史
1996年,卡利(Brewster Kahle)在创立盈利性的Alexa Internet的同时也创立了互联网档案馆;同年10月开始收集存储数据[8][9]。而档案馆亦曾于1996年5月10日下午2:42保存了已知最早的页面。[10][11][12][13]不过,直到2001年开发了“时光机”前,这些数据都无法访问。1999年末扩展收集范围[14]。
2012年8月,互联网档案馆宣布[15]将在其现存的130万文件的下载选项中加入BitTorrent[16][17]。因为透过两个文件数据中心协调,这成为从该档案馆下载数据的最快方法[16][18]。
2013年11月6日,档案馆在里奇蒙德区的总部失火,损坏了许多设备和一些附近的公寓[19][20],预计损失达到60万美元[21]。 2014年11月,互联网发布测试版,2016年3月,移除旧布局。[22][23]
2016年11月,卡利宣布互联网档案馆正在建立加拿大分站,总部将设在加拿大,但具体地点没有公布。[24][25][26] 媒体报道中,卡利表示 :
11月9日,在美国,我们突然意识到一个承诺进行彻底变革的新政府的出现。这强有力地提醒我们,像我们这样有长期计划的机构,也需要为适应变化而设计。对我们来说,这意味着我们要保持我们的文化材料的安全、隐私和永远可访问。这意味着要为一个可能面临更大限制的网络做准备。这意味着在一个政府监视不会消失的世界里为用户服务;事实上,政府监视看起来还可能会再增加。纵观历史,图书馆一直在与严重的侵犯隐私的行为作斗争——人们仅仅因为他们阅读的内容便遭到逮捕。而互联网档案馆正在努力保护我们的读者在数字世界的隐私。[24]
从2017年开始,联机计算机图书馆中心(OCLC)和互联网档案馆通过合作,使该档案馆的数字化图书记录可在WorldCat上访问。[27]
2018年以来,互联网档案馆推出视觉艺术入驻项目,将艺术家与档案馆超过48pb的[28]数字化材料联系起来。在为期一年的项目中,视觉艺术家创作了大量作品,顶峰时期还举行了展览。其期望是将数字历史与艺术联系起来并为后代创造一些能在线上或线下欣赏的东西。[29]
2019年,互联网档案馆位于旧金山的总部收到炸弹威胁,迫使该大楼暂时被腾空。[30]
2024年5月27日开始,互联网档案馆受到分布式拒绝服务攻击,[31]攻击持续三天后仍未停止。[32]
2024年9月中旬,谷歌在搜索结果中加入互联网档案馆的链接。[33]
2024年9月30日,互联网档案馆被盗取约3100万位用户的Email、密码、用户名。[34][35]2024年10月10日,互联网档案馆受到DDoS攻击。攻击者疑似是亲巴勒斯坦黑客。[36]截至10月23日,archive.org、Wayback Machine、Archive-It和开放图书馆服务全部恢复,但登录等部分功能仍然不可用。[37]
运作
互联网档案馆是一家在美国运营的501(c)(3)非营利组织,其年度预算约为1000万美元,来源则是其网页爬虫服务、合作关系、赞助以及卡利-奥斯丁基金会[38]。该档案馆的总部位于加利福尼亚州的旧金山。从1996年到2009年,其总部设在旧金山要塞,那里曾是美国的一个军事基地。自2009年以来,其总部一直设在旧金山芬斯顿大道300号,这里以前是一个基督教科学教堂。公司大部分员工曾一度在其图书扫描中心工作;截至2019年,全球有100家付费运营商进行了扫描。[39]互联网档案馆的大房间收藏了100多个代表互联网档案馆员工的陶瓷人像,其中第100尊是亚伦·斯沃茨的雕像。该系列人像的灵感来自中国秦始皇兵马俑,由布鲁斯特·卡利委托,努拉·克里德雕刻。[40]
互联网档案馆也在加州的三个城市设有资料中心,分别为旧金山、红木城和列治文。为减少数据丢失的风险,该档案馆在包括埃及的新亚历山大图书馆[41][42]和阿姆斯特丹[43]等更遥远的地方储存了一些存档副本。
互联网档案馆的大部分材料来自捐赠,[44]例如2017年波士顿公共图书馆提供的大量78转/分钟的光盘,[45]2018年特伦特大学捐赠的25万本图书,[46]以及马里格鲁夫学院图书馆在2020年关闭后的全部藏品。[47]其后所有材料经过数字化后进行数字存储,而数字副本返回原始持有者以及在互联网档案进行复制,如果不是公共领域中的内容,可在遵循首次销售原则的受控数字借阅(CDL)理论的前提下,每次借给世界各地的一个顾客。[48]
互联网档案馆参与了国际互联网保存联盟[49]并于2007年被加利福尼亚州政府选为官方指定图书馆。[50][51]
互联网档案馆宕机或数据库出错时,可于新亚历山大图书馆镜像网站查询1996至2007年的备份数据[52]。



