Изменения
Перейти к навигации
Перейти к поиску
Строка 11:
Строка 11:
− +
Строка 18:
Строка 18:
− +
Строка 29:
Строка 29:
− +
Строка 43:
Строка 43:
− +
Строка 57:
Строка 57:
− +
Строка 64:
Строка 64:
− +
− +
Строка 83:
Строка 83:
− +
− +
− +
Строка 120:
Строка 120:
− +
− +
Строка 131:
Строка 131:
− +
Строка 141:
Строка 141:
− +
Строка 158:
Строка 158:
+
− +
Строка 166:
Строка 167:
− +
Строка 173:
Строка 174:
− +
− +
Строка 192:
Строка 193:
− +
Строка 289:
Строка 290:
− +
Строка 303:
Строка 304:
− +
− +
Строка 313:
Строка 314:
− +
− +
нет описания правки
}}
}}
'''Wayback Machine''' ({{tr-en|Машина времени}}) — бесплатный онлайн-архив [[Некоммерческая организация|некоммерческой библиотеки]] «[[Архив Интернета]]». С помощью [[Поисковый робот|поисковых роботов]] или ''веб-краулеров'' Wayback Machine архивирует и делает общедоступной бо́льшую часть «открытого» интернета{{sfn|Arora|2015}}. Сервис был запущен в 1996 году, однако стал доступен для общественности только в 2001-м. За первые 20 лет существования Wayback Machine каталогизировал и сохранил коллекцию из более чем 286 млрд веб-страниц. Архивные снимки отображаются в формате [[HTML]], [[JavaScript]] и [[CSS]]{{sfn|Lerner|2017|с=1741—1755}}. Благодаря сохранённым в Wayback Machine документам пользователи могут отслеживать происходящие на сайтах изменения и сравнивать разные версии правок<ref name=Bryant>{{cite web
'''Wayback Machine''' ({{tr-en|Машина времени}}) — бесплатный онлайн-архив [[Некоммерческая организация|некоммерческой библиотеки]] «[[Архив Интернета]]». С помощью [[Поисковый робот|поисковых роботов]] или ''веб-краулеров'' Wayback Machine архивирует и делает общедоступной бо́льшую часть «открытого» интернета{{sfn|Arora|2015}}. Сервис был запущен в 1996 году, однако стал доступен для общественности только в 2001-м. За первые 20 лет существования Wayback Machine каталогизировал и сохранил коллекцию из более чем 286 млрд веб-страниц. Архивные снимки отображаются в формате [[HTML]], [[JavaScript]] и [[CSS]]{{sfn|Lerner|2017|с=1741—1755}}. Благодаря сохранённым в Wayback Machine документам пользователи могут отслеживать происходящие на сайтах изменения и сравнивать разные версии правок<ref name=Bryant>{{cite web
|url=https://www.groovypost.com/explaier/what-is-the-wayback-machine-and-why-is-it-useful/
|url=https://www.groovypost.com/explaier/what-is-the-wayback-machine-and-why-is-it-useful/
|title=What is the Wayback Machine and Why is it Useful?
|title=What is the Wayback Machine and Why is it Useful?
|publisher=Groovy Post
|publisher=Groovy Post
|accessdate=2021-05-29}}
|accessdate=2021-05-29}}
</ref>. На июль 2021 года Wayback Machine предоставлял доступ к более чем 591 млрд сохранённым веб-страницам<ref name=web>{{cite web
</ref>. На июль 2021 года Wayback Machine предоставлял доступ к более чем 591 млрд сохранённым веб-страницам<ref name=web>{{cite web
|url=https://archive.org/web/
|url=https://archive.org/web/
|title=Wayback Machine
|title=Wayback Machine
[[Файл:Brewster Kahle 2009.jpg|thumb|250px|right|[[Кейл, Брюстер|Брюстер Кейл]] в 2009 году]]
[[Файл:Brewster Kahle 2009.jpg|thumb|250px|right|[[Кейл, Брюстер|Брюстер Кейл]] в 2009 году]]
В 1989 году английский учёный [[Бернерс-Ли, Тим|Тим Бернерс-Ли]] создал [[всемирная паутина|всемирную паутину]] — систему, позволяющую передавать данные через подключённые к интернету компьютеры. Однако с распространением всемирной паутины были выявлены две основные проблемы. Первая состояла в нехватке мест для хранения всех данных, из-за чего многие документы и веб-страницы удалялись. Другая проблема заключалась в том, что после редактирования веб-страницы (например, по юридическим причинам), пользователи не могли посмотреть её изначальную версию. Решить эти недостатки стремилась американская цифровая библиотека «[[Архив Интернета]]» — некоммерческая организация, созданная программистами [[Кейл, Брюстер|Брюстером Кейлом]] и {{iw|Галлиат, Брюс|Брюсом Галлиатом|en|Bruce Gilliat}} в 1996 году. При сотрудничестве с [[Alexa Internet]] ([[Дочернее общество|дочерней компанией]] [[Amazon]], занимающейся веб-индексированием) Архив инициировал создание и хранение копий существующих сайтов для развития «универсального доступа к знанию». Организация предоставляла [[открытый доступ|бесплатный публичный доступ]] к оцифрованным материалам, таким как веб-страницы, книги, аудиозаписи, включая живые концерты, видео, изображения и программное обеспечение. На 2021 год штаб-квартира Архива Интернета находится в [[Сан-Франциско]], в здании бывшей христианской церкви, расположенной в районе [[Ричмонд (район Сан-Франциско)|Ричмонд]]. Журналист местной радиостанции {{iw|Kawl|||}} в 2019 году сравнивал офис Архива с римским храмом<ref>{{cite web
В 1989 году английский учёный [[Бернерс-Ли, Тим|Тим Бернерс-Ли]] создал [[всемирная паутина|всемирную паутину]] — систему, позволяющую передавать данные через подключённые к интернету компьютеры. Однако с распространением всемирной паутины были выявлены две основные проблемы. Первая состояла в нехватке мест для хранения всех данных, из-за чего многие документы и веб-страницы удалялись. Другая проблема заключалась в том, что после редактирования веб-страницы (например, по юридическим причинам), пользователи не могли посмотреть её изначальную версию. Решить эти недостатки стремилась американская цифровая библиотека «[[Архив Интернета]]» — некоммерческая организация, созданная программистами [[Кейл, Брюстер|Брюстером Кейлом]] и {{iw|Галлиат, Брюс|Брюсом Галлиатом|en|Bruce Gilliat}} в 1996 году. При сотрудничестве с [[Alexa Internet]] ([[Дочернее общество|дочерней компанией]] [[Amazon]], занимающейся веб-индексированием) Архив инициировал создание и хранение копий существующих сайтов для развития «универсального доступа к знанию». Организация предоставляла [[открытый доступ|бесплатный публичный доступ]] к оцифрованным материалам, таким как веб-страницы, книги, аудиозаписи, включая живые концерты, видео, изображения и программное обеспечение. На 2021 год штаб-квартира Архива Интернета находится в [[Сан-Франциско]], в здании бывшей христианской церкви, расположенной в районе [[Ричмонд (район Сан-Франциско)|Ричмонд]]. Журналист местной радиостанции {{iw|Kawl|||}} в 2019 году сравнивал офис Архива с римским храмом<ref>{{cite web
|url=https://theconversation.com/dominic-cummings-how-the-internet-knows-when-youve-updated-your-blog-139517
|url=https://theconversation.com/dominic-cummings-how-the-internet-knows-when-youve-updated-your-blog-139517
|title=Dominic Cummings: how the internet knows when you’ve updated your blog
|title=Dominic Cummings: how the internet knows when you’ve updated your blog
</ref>. Организация ставит перед собой цель спасти интернет от исчезновения{{sfn|Price|2011}}.
</ref>. Организация ставит перед собой цель спасти интернет от исчезновения{{sfn|Price|2011}}.
Wayback Machine стал самым известным проектом Архива. Онлайн-сервис был назван в честь машины времени из мультсериала 1960-х годов «[[Шоу Рокки и Буллвинкля]]». Он предоставляет доступ к цифровой коллекции из примерно 562 млрд веб-страниц<ref name=Bryant/><ref>{{cite web
Wayback Machine стал самым известным проектом Архива. Онлайн-сервис был назван в честь машины времени из мультсериала 1960-х годов «[[Шоу Рокки и Буллвинкля]]». Он предоставляет доступ к цифровой коллекции из примерно 562 млрд веб-страниц<ref name=Bryant/><ref>{{cite web
|url=https://www.theguardian.com/technology/2007/nov/19/archive.internet
|url=https://www.theguardian.com/technology/2007/nov/19/archive.internet
|title=The Time Machine
|title=The Time Machine
|publisher=WPMudev
|publisher=WPMudev
|accessdate=2021-05-29}}
|accessdate=2021-05-29}}
</ref>. Проект Wayback Machine был задуман как решение проблемы [[Ошибка 404|ошибки 404]], означающей, что сервер не может найти данные по запрошенному адресу. Это связано с так называемым [[вымирание ссылок|вымиранием ссылок]] — нарастающей недоступностью некогда опубликованных данных. Так, в 1997 году средняя продолжительность жизни веб-страницы составляла 44 дня. В 2003 году этот показатель составил 100 дней. Проведённый в 2008 году анализ ссылок на 2700 цифровых ресурсов, большинство из которых не имеет печатных аналогов, показал, что около 8 процентов ссылок переставали работать через год. К 2011 году, по прошествии трёх лет, 30 процентов ссылок в коллекции были неработающими<ref>{{cite web
</ref>. Проект Wayback Machine был задуман как решение проблемы [[Ошибка 404|ошибки 404]], означающей, что сервер не может найти данные по запрошенному адресу. Это связано с так называемым [[вымирание ссылок|вымиранием ссылок]] — нарастающей недоступностью некогда опубликованных данных. Так, в 1997 году средняя продолжительность жизни веб-страницы составляла 44 дня. В 2003 году этот показатель составил 100 дней. Проведённый в 2008 году анализ ссылок на 2700 цифровых ресурсов, большинство из которых не имеет печатных аналогов, показал, что около 8 процентов ссылок переставали работать через год. К 2011 году, по прошествии трёх лет, 30 процентов ссылок в коллекции были неработающими<ref>{{cite web
|url=https://www.theatlantic.com/technology/archive/2015/10/raiders-of-the-lost-web/409210/
|url=https://www.theatlantic.com/technology/archive/2015/10/raiders-of-the-lost-web/409210/
|title=Raiders of the Lost Web
|title=Raiders of the Lost Web
|publisher=The Atlantic
|publisher=The Atlantic
|accessdate=2021-06-07}}
|accessdate=2021-06-07}}
</ref>. Благодаря интеграции с Alexa столкнувшийся с сообщением об ошибке пользователь мог получить доступ к заархивированной версии страницы через внедрённую в браузер панель инструментов. Если копия недоступной страницы присутствовала в базе данных Wayback Machine, то загоралась специальная кнопка. При этом пользователи могли предоставить браузеру разрешение на просмотр и регистрацию активности — в таком случае все посещаемые сайты архивировались на портале{{sfn|Rogers|2017|с=160—172}}.
</ref>. Благодаря интеграции с Alexa столкнувшийся с сообщением об ошибке пользователь мог получить доступ к заархивированной версии страницы через внедрённую в браузер панель инструментов. Если копия недоступной страницы присутствовала в базе данных Wayback Machine, то загоралась специальная кнопка. При этом пользователи могли предоставить браузеру разрешение на просмотр и регистрацию активности — в таком случае все посещаемые сайты архивировались на портале{{sfn|Rogers|2017|с=160—172}}.
Wayback Machine был запущен в мае 1996 года, однако стал доступным для общественности только в 2001-м — до этого вся записанная на цифровых магнитных лентах информация была открыта только для ограниченного числа учёных и исследователей{{sfn|Hartelius|2020|c=378}}. К моменту «открытия» архив содержал более 10 млрд заархивированных страниц<ref name=Bryant/>. К декабрю 2014 года руководство Wayback Machine сообщило, что сохранило 435 млрд веб-страниц по всему миру{{sfn|Arora|2015}}. С технической точки зрения программное обеспечение Wayback Machine не является архивом, а скорее общедоступным интерфейсом к ограниченному подмножеству всех хранилищ{{sfn|Bowyer|2021|с=43—57}}. Так, Wayback Machine нельзя считать поисковой системой коллекции организации, так как она не осуществляет поиск по базе данных другой крупной виртуальной библиотеки — [[Open Library]], позволяющей пользователям бесплатно получать доступ к цифровым копиям книг, которые загружаются и архивируются в рамках проекта<ref name=Vox>{{cite web
Wayback Machine был запущен в мае 1996 года, однако стал доступным для общественности только в 2001-м — до этого вся записанная на цифровых магнитных лентах информация была открыта только для ограниченного числа учёных и исследователей{{sfn|Hartelius|2020|c=378}}. К моменту «открытия» архив содержал более 10 млрд заархивированных страниц<ref name=Bryant/>. К декабрю 2014 года руководство Wayback Machine сообщило, что сохранило 435 млрд веб-страниц по всему миру{{sfn|Arora|2015}}. С технической точки зрения программное обеспечение Wayback Machine не является архивом, а скорее общедоступным интерфейсом к ограниченному подмножеству всех хранилищ{{sfn|Bowyer|2021|с=43—57}}. Так, Wayback Machine нельзя считать поисковой системой коллекции организации, так как она не осуществляет поиск по базе данных другой крупной виртуальной библиотеки — [[Open Library]], позволяющей пользователям бесплатно получать доступ к цифровым копиям книг, которые загружаются и архивируются в рамках проекта<ref name=Vox>{{cite web
|url=https://www.vox.com/2020/6/23/21293875/internet-archive-website-lawsuit-open-library-wayback-machine-controversy-copyright
|url=https://www.vox.com/2020/6/23/21293875/internet-archive-website-lawsuit-open-library-wayback-machine-controversy-copyright
|title=A lawsuit is threatening the Internet Archive — but it’s not as dire as you may have heard
|title=A lawsuit is threatening the Internet Archive — but it’s not as dire as you may have heard
== Характеристика ==
== Характеристика ==
С запуском Wayback Machine «Архив Интернета» стал одним из самых популярных и узнаваемых онлайн-порталов и главным сервисом [[Архивирование веб-сайтов|веб-архивирования]]<ref name=Bryant/>{{sfn|Price|2011}}. В 1999 году Архив начал расширять коллекцию за пределы архивного веб-контента, чтобы обеспечить статус как к оцифрованным, так и изначально цифровым ресурсам, в том числе книгам, аудио, фильмам, изображениям, документам, программному обеспечению и видеоиграм{{sfn|Odgen|2017}}. Некоторые сканирования выполняются поисковыми роботами самого архива, а другие — партнёрскими организациями. Отдельные базы данных могут приобретаться за счёт пожертвований пользователей и целевых приобретений<ref name=Forbes/>. Сами создатели организации сравнивали свою коллекцию с [[Александрийская библиотека|Александрийской библиотекой]]{{sfn|Odgen|2017}}. На 2021 год Wayback Machine содержал более 424 млрд веб-страниц{{sfn|Bowyer|2021|с=43—57}} — больше, чем документов в [[Библиотека Конгресса|Библиотеке Конгресса]]{{sfn|O'Connor|2008|с=64}}{{sfn|Odgen|2017}}<ref name=Forbes />.
С запуском Wayback Machine «Архив Интернета» стал одним из самых популярных и узнаваемых онлайн-порталов и главным сервисом [[Архивирование веб-сайтов|веб-архивирования]]<ref name=Bryant/>{{sfn|Price|2011}}. В 1999 году Архив начал расширять коллекцию за пределы архивного веб-контента, чтобы обеспечить статус как к оцифрованным, так и изначально цифровым ресурсам, в том числе книгам, аудио, фильмам, изображениям, документам, программному обеспечению и видеоиграм{{sfn|Odgen|2017}}. Некоторые сканирования выполняются поисковыми роботами самого архива, а другие — партнёрскими организациями. Отдельные базы данных могут приобретаться за счёт пожертвований пользователей и целевых приобретений<ref name=Forbes/>. Сами создатели организации сравнивали свою коллекцию с [[Александрийская библиотека|Александрийской библиотекой]]{{sfn|Odgen|2017}}. На 2021 год Wayback Machine содержал более 424 млрд веб-страниц{{sfn|Bowyer|2021|с=43—57}} — больше, чем документов в [[Библиотека Конгресса|Библиотеке Конгресса]]{{sfn|O'Connor|2008|с=64}}{{sfn|Odgen|2017}}<ref name=Forbes />.
== Принцип работы ==
== Принцип работы ==
Платформа Wayback Machine функционирует за счёт двух основных элементов — поисковых роботов (или ''веб-краулеров'') и интерфейса. Веб-краулеры занимаются посещением, извлечением, загрузкой и архивацией веб-страниц. В свою очередь, через интерфейс пользователи получают доступ к онлайн-коллекциям{{sfn|Lerner|2017|с=1741—1755}}.
Платформа Wayback Machine функционирует за счёт двух основных элементов — поисковых роботов (или ''веб-краулеров'') и интерфейса. Веб-краулеры занимаются посещением, извлечением, загрузкой и архивацией веб-страниц. В свою очередь, через интерфейс пользователи получают доступ к онлайн-коллекциям{{sfn|Lerner|2017|с=1741—1755}}.
=== Поисковые роботы ===
=== Поисковые роботы ===
{{Bar chart
{{Bar chart
| title = Рост коллекции Wayback Machine<ref>{{cite web
| title = Рост коллекции Wayback Machine<ref>{{cite web
|label8=2021
|label8=2021
|data8=581}}
|data8=581}}
Изначально коллекция архива пополнялась за счёт браузерного [[плагин]]а от Alexa Internet, который автоматически фиксировал и сохранял каждую веб-страницу по мере её посещения, затем передавая всю собранную информацию в «Архив Интернета». Пользователи также могли установить бесплатную панель инструментов, позволявшую проверять статус архивирования выбранного веб-сайта<ref name=Forbes/>.
Изначально коллекция архива пополнялась за счёт браузерного [[плагин]]а от Alexa Internet, который автоматически фиксировал и сохранял каждую веб-страницу по мере её посещения, затем передавая всю собранную информацию в «Архив Интернета». Пользователи также могли установить бесплатную панель инструментов, позволявшую проверять статус архивирования выбранного веб-сайта<ref name=Forbes/>.
В 2002 году Архив запустил собственный [[Поисковой робот|поискового робота]] — {{iw|Heritrix|||}} - с открытым исходным кодом. Коды краулеров записаны с помощью комбинации [[Си (язык программирования)|программных языков Cи]] и [[Perl]]. Помимо этого, «Архив Интернета» также принимает данные сканирования от других доноров{{sfn|Odgen|2017}}. Отсканированные копии веб-сайтов автоматически конвертируются в файлы размером около 100 МБ, которые затем сохраняются на серверах. Общая скорость пополнения архива составляет около 10 [[терабайт]] в месяц<ref name=Kahle>{{cite web
В 2002 году Архив запустил собственный [[Поисковой робот|поискового робота]] — {{iw|Heritrix|||}} — с открытым исходным кодом. Коды краулеров записаны с помощью комбинации [[Си (язык программирования)|программных языков Cи]] и [[Perl]]. Помимо этого, «Архив Интернета» также принимает данные сканирования от других доноров{{sfn|Odgen|2017}}. Отсканированные копии веб-сайтов автоматически конвертируются в файлы размером около 100 МБ, которые затем сохраняются на серверах. Общая скорость пополнения архива составляет около 10 [[терабайт]] в месяц<ref name=Kahle>{{cite web
|url=https://www.xml.com/pub/a/ws/2002/01/18/brewster.html
|url=https://www.xml.com/pub/a/ws/2002/01/18/brewster.html
|title=How the Wayback Machine Works
|title=How the Wayback Machine Works
</ref>.
</ref>.
Веб-краулеры запечатляют версию сайта такой, какой она была сохранена на момент доступа к ней через URL. Роботы регулярно сканируют большое количество веб-страниц, рекурсивно загружая, анализируя и отображая [[HTML]]-, [[JavaScript]]- и [[CSS]]-страницы{{sfn|Lerner|2017|с=1741—1755}}. Механизм работы краулеров похож на работу поисковых систем — роботы самостоятельно ищут порталы для архивирования через систему поиска путей, сканируя страницы и связанные с ними сайты, таким образом формируя сеть порталов. На момент создания Архива всемирная сеть была настолько маленькой, что веб-краулеры могли совершить обход всех сайтов за один сеанс. Однако со временем постоянный рост онлайн-порталов и их изменчивость сделали полный обход всей сети практически невозможным. Таким образом, не все изменения на сайтах зафиксированы в Wayback Machine{{sfn|Price|2011}}. Руководство Архива не уточняет то, как роботы находят и выбирают страницы для сканирования, однако заявляет, что чаще всего краулеры направляются на те сайты, которые имеют перекрёстные ссылки с других порталов и находятся в открытом доступе. Сканер начинает с веб-страницы, а затем следует по каждой гиперссылке на этой веб-странице, чтобы перейти на новые сайты. На каждой из новых веб-страниц поисковый робот повторяет процесс{{sfn|Bowyer|2021|с=43—57}}. Он будет продолжаться до того момента, пока архивация не будет остановлена или не достигнет установленного скриптом лимита<ref>{{cite web
Веб-краулеры запечатляют версию сайта такой, какой она была сохранена на момент доступа к ней через URL. Роботы регулярно сканируют большое количество веб-страниц, рекурсивно загружая, анализируя и отображая [[HTML]]-, [[JavaScript]]- и [[CSS]]-страницы{{sfn|Lerner|2017|с=1741—1755}}. Механизм работы краулеров похож на работу поисковых систем — роботы самостоятельно ищут порталы для архивирования через систему поиска путей, сканируя страницы и связанные с ними сайты, таким образом формируя сеть порталов. На момент создания Архива всемирная сеть была настолько маленькой, что веб-краулеры могли совершить обход всех сайтов за один сеанс. Однако со временем постоянный рост онлайн-порталов и их изменчивость сделали полный обход всей сети практически невозможным. Таким образом, не все изменения на сайтах зафиксированы в Wayback Machine{{sfn|Price|2011}}. Руководство Архива не уточняет то, как роботы находят и выбирают страницы для сканирования, однако заявляет, что чаще всего краулеры направляются на те сайты, которые имеют перекрёстные ссылки с других порталов и находятся в открытом доступе. Сканер начинает с веб-страницы, а затем следует по каждой гиперссылке на этой веб-странице, чтобы перейти на новые сайты. На каждой из новых веб-страниц поисковый робот повторяет процесс{{sfn|Bowyer|2021|с=43—57}}. Он будет продолжаться до того момента, пока архивация не будет остановлена или не достигнет установленного скриптом лимита<ref>{{cite web
|url=https://archive.org/details/widecrawl&tab=about
|url=https://archive.org/details/widecrawl&tab=about
|title=Worldwide Web Crawls
|title=Worldwide Web Crawls
=== Интерфейс ===
=== Интерфейс ===
Интерфейс Wayback Machine позволяет пользователям осуществить два основных действия — получить доступ к истории изменений сайта и просмотреть все сделанные на порталах правки. Также доступна функция сравнения разных версий сайтов{{sfn|Rogers|2017|с=160—172}}<ref>{{cite web
Интерфейс Wayback Machine позволяет пользователям осуществить два основных действия — получить доступ к истории изменений сайта и просмотреть все сделанные на порталах правки. Также доступна функция сравнения разных версий сайтов{{sfn|Rogers|2017|с=160—172}}<ref>{{cite web
|url=https://news.jrn.msu.edu/2017/12/wayback-machine-archives-websites-for-over-20-years/
|url=https://news.jrn.msu.edu/2017/12/wayback-machine-archives-websites-for-over-20-years/
|title=Wayback Machine archives websites for over 20 years
|title=Wayback Machine archives websites for over 20 years
|accessdate=2021-05-29}}
|accessdate=2021-05-29}}
</ref><ref name=Graham/>.
</ref><ref name=Graham/>.
== Хранение ==
== Хранение ==
На 2018 год коллекция Архива Интернета составляла более 40 [[петабайт]] или 40 млн гигабайт данных, Wayback Machine предоставлял доступ к примерно 63 % всех имеющихся материалов<ref>{{cite web
На 2018 год коллекция Архива Интернета составляла более 40 [[петабайт]] или 40 млн гигабайт данных, Wayback Machine предоставлял доступ к примерно 63 % всех имеющихся материалов<ref>{{cite web
|url=https://thehustle.co/inside-wayback-machine-internet-archive
|url=https://thehustle.co/inside-wayback-machine-internet-archive
|title=Inside Wayback Machine, the internet’s time capsule
|title=Inside Wayback Machine, the internet’s time capsule
|publisher=The Hustle
|publisher=The Hustle
|accessdate=2021-05-29}}
|accessdate=2021-05-29}}
</ref>. На февраль 2020 года в архиве Wayback Machine числилось более 900 млрд URL-адресов и более 400 млрд веб-страниц<ref name=VC>{{cite web
</ref>. На февраль 2020 года в архиве Wayback Machine числилось более 900 млрд URL-адресов и более 400 млрд веб-страниц<ref name=VC>{{cite web
|url=https://vc.ru/services/109219-brauzer-brave-ot-soosnovatelya-mozilla-stal-predlagat-kopii-iz-arhiva-interneta-vmesto-udalennyh-veb-stranic?from=yandex&utm_source=yxnews&utm_medium=desktop&utm_referrer=https%3A%2F%2Fyandex.ru%2Fnews%2Fsearch%3Ftext%3D
|url=https://vc.ru/services/109219-brauzer-brave-ot-soosnovatelya-mozilla-stal-predlagat-kopii-iz-arhiva-interneta-vmesto-udalennyh-veb-stranic?from=yandex&utm_source=yxnews&utm_medium=desktop&utm_referrer=https%3A%2F%2Fyandex.ru%2Fnews%2Fsearch%3Ftext%3D
|title=Браузер Brave от сооснователя Mozilla стал предлагать копии из «архива интернета» вместо удалённых веб-страниц
|title=Браузер Brave от сооснователя Mozilla стал предлагать копии из «архива интернета» вместо удалённых веб-страниц
|publisher=VcRu
|publisher=VcRu
|accessdate=2021-06-01}}
|accessdate=2021-06-01}}
</ref>. На июнь 2021 года Wayback Machine предоставлял доступ к более чем 581 млрд сохранённых веб-страниц<ref name=web/>.
</ref>. На июнь 2021 года Wayback Machine предоставлял доступ к более чем 581 млрд сохранённых веб-страниц<ref name=web/>.
== Использование ==
== Использование ==
Портал Wayback Machine зачастую применяют в правовой сфере — юристы используют сервис для поиска информации по гражданским искам, уголовным делам, в административном делопроизводстве и патентных процессах. Полученные через Wayback Machine архивные версии сайтов могут использоваться для решения вопросов о [[Патентное право|патентном праве]] или установлении наказания за публикацию материалов, которые впоследствии были удалены из сети{{sfn|Lerner|2017|с=1741—1755}}{{sfn|Rogers|2017|с=160—172}}. Несмотря на широкое использование коллекции Архива Интернета для предоставления доказательств, некоторые суды США отказывались принимать скриншоты веб-страниц, ссылаясь на юридическую сложность отождествления оригинала документа и его заархивированной версии{{sfn|Eltgroth|2009}}. В 2018 году [[Апелляционный суд США по федеральному округу|апелляционный суд США]] постановил, что скрины с архива веб-страниц Wayback Machine относятся к законным доказательствам, которые могут быть использованы в судебных разбирательствах<ref>{{cite web
Портал Wayback Machine зачастую применяют в правовой сфере — юристы используют сервис для поиска информации по гражданским искам, уголовным делам, в административном делопроизводстве и патентных процессах. Полученные через Wayback Machine архивные версии сайтов могут использоваться для решения вопросов о [[Патентное право|патентном праве]] или установлении наказания за публикацию материалов, которые впоследствии были удалены из сети{{sfn|Lerner|2017|с=1741—1755}}{{sfn|Rogers|2017|с=160—172}}. Несмотря на широкое использование коллекции Архива Интернета для предоставления доказательств, некоторые суды США отказывались принимать скриншоты веб-страниц, ссылаясь на юридическую сложность отождествления оригинала документа и его заархивированной версии{{sfn|Eltgroth|2009}}. В 2018 году [[Апелляционный суд США по федеральному округу|апелляционный суд США]] постановил, что скрины с архива веб-страниц Wayback Machine относятся к законным доказательствам, которые могут быть использованы в судебных разбирательствах<ref>{{cite web
|url=https://www.theregister.com/2018/09/04/wayback_machine_legit/
|url=https://www.theregister.com/2018/09/04/wayback_machine_legit/
|title=Archive.org's Wayback Machine is legit legal evidence, US appeals court judges rule
|title=Archive.org's Wayback Machine is legit legal evidence, US appeals court judges rule
</ref>.
</ref>.
Благодаря архивированным в Wayback Machine статьям авторы могут устанавливать право на открытие или на публикацию{{sfn|Pearce|2009|с=875}}. Для социологов и историков Wayback Machine предлагает ценный крупномасштабный источник данных для анализа поведения компаний, стратегий продаж, социальных практик{{sfn|Arora|2015}}{{sfn|Milligan|2016}}. Также Wayback Machine позволяет получать доступ к журналам [[открытый доступ|открытого доступа]]. Так, с начала 2000-х годов из интернета исчезло 84 журнала ОД по естественным наукам и ещё около 100 — по социальным и гуманитарным<ref>{{cite web
Благодаря архивированным в Wayback Machine статьям авторы могут устанавливать право на открытие или на публикацию{{sfn|Pearce|2009|с=875}}. Для социологов и историков Wayback Machine предлагает ценный крупномасштабный источник данных для анализа поведения компаний, стратегий продаж, социальных практик{{sfn|Arora|2015}}{{sfn|Milligan|2016}}. Также Wayback Machine позволяет получать доступ к журналам [[открытый доступ|открытого доступа]]. Так, с начала 2000-х годов из интернета исчезло 84 журнала ОД по естественным наукам и ещё около 100 — по социальным и гуманитарным<ref>{{cite web
|url=https://www.sciencemag.org/news/2020/09/dozens-scientific-journals-have-vanished-internet-and-no-one-preserved-them
|url=https://www.sciencemag.org/news/2020/09/dozens-scientific-journals-have-vanished-internet-and-no-one-preserved-them
|title=Dozens of scientific journals have vanished from the internet, and no one preserved them
|title=Dozens of scientific journals have vanished from the internet, and no one preserved them
</ref>.
</ref>.
В 2002 году Архив удалил из своей системы ссылки на архивные копии портала Xenu.net, принадлежащего критику церкви Андреасу Хельдал-Лунду. Удаление произошло по требованию юристов [[Церковь Саентологии|Церкви Саентологии]], заявивших, что владеют правом собственности на выдержки из документов Церкви, опубликованные на сайте<ref>{{cite web
В 2002 году Архив удалил из своей системы ссылки на архивные копии портала Xenu.net, принадлежащего критику церкви Андреасу Хельдал-Лунду. Удаление произошло по требованию юристов [[Церковь Саентологии|Церкви Саентологии]], заявивших, что владеют правом собственности на выдержки из документов Церкви, опубликованные на сайте<ref>{{cite web
|url=https://web.archive.org/web/20120515210932/http://news.cnet.com/2100-1023-959236.html
|url=https://web.archive.org/web/20120515210932/http://news.cnet.com/2100-1023-959236.html
|title=Net archive silences Scientology critic
|title=Net archive silences Scientology critic
|publisher=LawMeme
|publisher=LawMeme
|accessdate=2021-06-10}}
|accessdate=2021-06-10}}
</ref>.
</ref>.
== Ограничения ==
== Ограничения ==
Исследователи и активисты критикуют Wayback Machine и деятельность Архива Интернета за попытку сохранить все онлайн-материалы, многие из которых не представляют должной ценности. По мнению отдельных исследователей, это связано с устаревшей политикой Архива Интернета, который был основан в конце 1990-х годов — тогда, на заре создания интернет-архивов, считалось, что данные интернета должны сохраняться в полном объёме. Однако с созданием множества однодневных сайтов многие исследователи и активисты поменяли свое мнение<ref>{{cite web
Исследователи и активисты критикуют Wayback Machine и деятельность Архива Интернета за попытку сохранить все онлайн-материалы, многие из которых не представляют должной ценности. По мнению отдельных исследователей, это связано с устаревшей политикой Архива Интернета, который был основан в конце 1990-х годов — тогда, на заре создания интернет-архивов, считалось, что данные интернета должны сохраняться в полном объёме. Однако с созданием множества однодневных сайтов многие исследователи и активисты поменяли свое мнение<ref>{{cite web
|url=https://harpers.org/archive/2018/12/preservation-acts-archiving-twitter-social-media-movements/
|url=https://harpers.org/archive/2018/12/preservation-acts-archiving-twitter-social-media-movements/
|title=Preservation Acts
|title=Preservation Acts
|publisher=Harper's Magazine
|publisher=Harper's Magazine
|accessdate=2021-06-02}}
|accessdate=2021-06-02}}
</ref>. Другие критические замечания относятся к техническим ограничениям сервиса — Wayback Machine не позволяет сохранять и обрабатывать
</ref>. Другие критические замечания относятся к техническим ограничениям сервиса — Wayback Machine не позволяет сохранять и обрабатывать
определённые элементы JavaScript, а также может создавать заархивированные страницы, содержащие неработающие ссылки, отсутствующую графику или являющиеся неполными по иным причинам{{sfn|Crudo|2014}}. Сканеры захватывают только статистический снимок сайта — функции порталов на основе Java или Flash работать не будут. Это означает, что бо́льшая часть функциональных возможностей исходной веб-страницы теряется{{sfn|Price|2011}}.
определённые элементы JavaScript, а также может создавать заархивированные страницы, содержащие неработающие ссылки, отсутствующую графику или являющиеся неполными по иным причинам{{sfn|Crudo|2014}}. Сканеры захватывают только статистический снимок сайта — функции порталов на основе Java или Flash работать не будут. Это означает, что бо́льшая часть функциональных возможностей исходной веб-страницы теряется{{sfn|Price|2011}}.
== Блокировки ==
== Блокировки ==