Internet Archive 的海量存储浅析
Internet Archive (IA) 这个站点大家应该都不陌生。IA 旨在建立所有互联网站点的"档案库",如果说 Google 是互联网的数据库的话,那么 IA 就是互联网的数据仓库了,定期对每个 Web 页面保存快照,数据量之大可想而知。 先看看 IA 每天需要面对的处理能力: 存储超过 850 亿个 Web 页面; 每天大约 600 万次的下载; Wayback Machine 收到...
时间:12月26日 11:04 标签: Internet Archive 海量存储 网站架构 转贴摘录
分类导航
搜索更多
Google
文章导读
最新评论