Вебархив

Материал из in.wiki
Перейти к навигации Перейти к поиску

Вебархи́в (web.archive.org, Wayback Machine, «машина прошлого») — сайт, хранящий старые копии других сайтов за разные годы. Также известен как Архив Интернета (Internet Archive, archive.org). По факту Internet Archive это название организации и название первичного собственного архива исторически значимых материалов, в том числе мультимедийных, а Wayback Machine — внутренний сервис в рамках этого проекта.

Описательные формулировки из Википедии[править | править код]

автоперевод с https://en.wikipedia.org/wiki/Wayback_Machine

The Wayback Machine - это цифровой архив Всемирной паутины, основанный некоммерческой организацией Internet Archive, базирующейся в Сан-Франциско, штат Калифорния. Созданный в 1996 году и представленный широкой публике в 2001 году, он позволяет пользователю вернуться "назад во времени", чтобы увидеть, как выглядели веб-сайты в прошлом. Ее основатели Брюстер Кале и Брюс Гиллиат разработали Wayback Machine, чтобы обеспечить "универсальный доступ ко всем знаниям" путем сохранения архивных копий несуществующих веб-страниц.

Запущенный 10 мая 1996 года, Wayback Machine к концу 2009 года сохранил более 38,2 миллиарда веб-страниц. По состоянию на 3 января 2024 года Wayback Machine заархивировала более 860 миллиардов веб-страниц и значительно более 99 петабайт данных.

Программное обеспечение Wayback Machine было разработано для "обхода" Интернета и загрузки всей общедоступной информации и файлов данных с веб-страниц, иерархии Gopher, системы досок объявлений Netnews (Usenet) и загружаемого программного обеспечения. Информация, собранная этими "поисковиками", не включает в себя всю информацию, доступную в Интернете, поскольку большая часть данных ограничена издателем или хранится в недоступных базах данных. Чтобы преодолеть несоответствия на частично кэшированных веб-сайтах, Archive-It.org был разработан в 2005 году Интернет-архивом как средство, позволяющее учреждениям и создателям контента добровольно собирать и сохранять коллекции цифрового контента и создавать цифровые архивы.

С годами, по мере развития технологий, емкость хранилища Wayback Machine росла. В 2003 году, после всего лишь двух лет публичного доступа, объем Wayback Machine увеличивался со скоростью 12 терабайт в месяц. Данные хранятся в стоечных системах PetaBox, специально разработанных сотрудниками Internet Archive. Первая стойка емкостью 100 ТБ была полностью введена в эксплуатацию в июне 2004 года, хотя вскоре стало ясно, что им потребуется гораздо больше места для хранения.

С момента своего публичного запуска в 2001 году Wayback Machine изучалась учеными как с точки зрения способов хранения и сбора данных, так и с точки зрения фактических страниц, содержащихся в ее архиве. По состоянию на 2013 год ученые написали около 350 статей о Wayback Machine, в основном из области информационных технологий, библиотечного дела и социальных наук. Исследователи социальных наук использовали Wayback Machine для анализа того, как разработка веб-сайтов с середины 1990-х годов по настоящее время повлияла на рост компании.

автоперевод с https://en.wikipedia.org/wiki/Internet_Archive

Интернет-архив - американская цифровая библиотека, основанная 10 мая 1996 года и возглавляемая защитником свободы информации Брюстером Кале. Она предоставляет бесплатный доступ к коллекциям оцифрованных материалов, включая веб-сайты, программные приложения, музыку, аудиовизуальные и печатные материалы. Архив также выступает за свободный и открытый Интернет. По состоянию на 1 января 2024 года в интернет-архиве Wayback Machine хранится более 41 миллиона печатных материалов, 8,4 миллиона видеороликов, 0,89 миллиона программ, 14,7 миллиона аудиофайлов, 4,4 миллиона изображений, 240 000 концертов и более 735 миллиардов веб-страниц. Его миссия состоит в том, чтобы обеспечить "всеобщий доступ ко всем знаниям".

Сведения[править | править код]

В начале октября 2024 сайт подвергся DDoS-атаке, выведшей сервис из строя. Восстановление и усиление защиты потребовало длительное время. Через несколько дней был открыт доступ к архиву сайтов в режиме чтения, остальные сервисы пока отключены.