Изменения
Перейти к навигации
Перейти к поиску
Строка 13:
Строка 13:
− +
Строка 91:
Строка 91:
− +
− +
Строка 118:
Строка 118:
− +
− +
Строка 171:
Строка 171:
− +
Строка 179:
Строка 179:
− +
− +
Строка 193:
Строка 193:
− +
Строка 225:
Строка 225:
− +
Строка 234:
Строка 234:
− +
Строка 258:
Строка 258:
− +
Строка 309:
Строка 309:
− +
Строка 363:
Строка 363:
− +
Строка 411:
Строка 411:
− +
Строка 476:
Строка 476:
− +
Строка 495:
Строка 495:
− +
Строка 505:
Строка 505:
− +
нет описания правки
}}
}}
'''Wayback Machine''' ({{tr-en|Машина времени}}) — бесплатный онлайн-архив [[Некоммерческая организация|некоммерческой библиотеки]] «[[Архив Интернета]]». С помощью [[Поисковый робот|поисковых роботов]] Wayback Machine архивирует и делает общедоступной бо́льшую часть «открытого» интернета{{sfn|Arora|2015}}. Сервис был запущен в 1996 году, однако стал доступен для общественности только в 2001-м. За первые 20 лет существования Wayback Machine каталогизировал и сохранил коллекцию из более чем 286 млрд веб-страниц. Архивные снимки отображаются в формате [[HTML]], [[JavaScript]] и [[CSS]]{{sfn|Lerner|2017|с=1741—1755}}. Благодаря сохранённым в Wayback Machine документам пользователи могут отслеживать происходящие на сайтах изменения и сравнивать разные версии правок<ref name=Bryant>{{cite web
'''Wayback Machine''' ({{tr-en|Машина времени}}) — бесплатный онлайн-архив [[Некоммерческая организация|некоммерческой библиотеки]] «[[Архив Интернета]]». С помощью [[Поисковый робот|поисковых роботов]] Wayback Machine архивирует и делает общедоступной бо́льшую часть «открытого» интернета{{sfn|Arora|2015}}. Сервис был запущен в 1996 году, однако стал доступен для общественности только в 2001-м. За первые 20 лет существования Wayback Machine каталогизировал и сохранил коллекцию из более чем 286 млрд веб-страниц. Архивные снимки отображаются в формате [[HTML]], [[JavaScript]] и [[CSS]]{{sfn|Lerner|2017|pp=1741—1755}}. Благодаря сохранённым в Wayback Machine документам пользователи могут отслеживать происходящие на сайтах изменения и сравнивать разные версии правок<ref name=Bryant>{{cite web
|url=https://www.groovypost.com/explaier/what-is-the-wayback-machine-and-why-is-it-useful/
|url=https://www.groovypost.com/explaier/what-is-the-wayback-machine-and-why-is-it-useful/
|title=What is the Wayback Machine and Why is it Useful?
|title=What is the Wayback Machine and Why is it Useful?
|archive-url=https://web.archive.org/web/20170507173716/https://www.theatlantic.com/technology/archive/2015/10/raiders-of-the-lost-web/409210/
|archive-url=https://web.archive.org/web/20170507173716/https://www.theatlantic.com/technology/archive/2015/10/raiders-of-the-lost-web/409210/
|deadlink=no
|deadlink=no
}}</ref>. Благодаря интеграции с Alexa столкнувшийся с сообщением об ошибке пользователь мог получить доступ к заархивированной версии страницы через внедрённую в браузер панель инструментов. Если копия недоступной страницы присутствовала в базе данных Wayback Machine, то загоралась специальная кнопка. При этом пользователи могли предоставить браузеру разрешение на просмотр и регистрацию активности — в таком случае все посещаемые сайты архивировались на портале{{sfn|Rogers|2017|с=160—172}}.
}}</ref>. Благодаря интеграции с Alexa столкнувшийся с сообщением об ошибке пользователь мог получить доступ к заархивированной версии страницы через внедрённую в браузер панель инструментов. Если копия недоступной страницы присутствовала в базе данных Wayback Machine, то загоралась специальная кнопка. При этом пользователи могли предоставить браузеру разрешение на просмотр и регистрацию активности — в таком случае все посещаемые сайты архивировались на портале{{sfn|Rogers|2017|pp=160—172}}.
Wayback Machine был запущен в мае 1996 года, однако стал доступным для общественности только в 2001-м — до этого вся записанная на цифровых магнитных лентах информация была открыта только для ограниченного числа учёных и исследователей{{sfn|Hartelius|2020|c=378}}. К моменту «открытия» архив содержал более 10 млрд заархивированных страниц<ref name=Bryant/>. К декабрю 2014 года руководство Wayback Machine сообщило, что сохранило 435 млрд веб-страниц по всему миру{{sfn|Arora|2015}}. С технической точки зрения программное обеспечение Wayback Machine не является архивом, а скорее общедоступным интерфейсом к ограниченному подмножеству всех хранилищ{{sfn|Bowyer|2021|с=43—57}}. Так, Wayback Machine нельзя считать поисковой системой коллекции организации, так как она не осуществляет поиск по базе данных другой крупной виртуальной библиотеки — [[Open Library]], позволяющей пользователям бесплатно получать доступ к цифровым копиям книг, которые загружаются и архивируются в рамках проекта<ref name=Vox>{{cite web
Wayback Machine был запущен в мае 1996 года, однако стал доступным для общественности только в 2001-м — до этого вся записанная на цифровых магнитных лентах информация была открыта только для ограниченного числа учёных и исследователей{{sfn|Hartelius|2020|p=378}}. К моменту «открытия» архив содержал более 10 млрд заархивированных страниц<ref name=Bryant/>. К декабрю 2014 года руководство Wayback Machine сообщило, что сохранило 435 млрд веб-страниц по всему миру{{sfn|Arora|2015}}. С технической точки зрения программное обеспечение Wayback Machine не является архивом, а скорее общедоступным интерфейсом к ограниченному подмножеству всех хранилищ{{sfn|Bowyer|2021|pp=43—57}}. Так, Wayback Machine нельзя считать поисковой системой коллекции организации, так как она не осуществляет поиск по базе данных другой крупной виртуальной библиотеки — [[Open Library]], позволяющей пользователям бесплатно получать доступ к цифровым копиям книг, которые загружаются и архивируются в рамках проекта<ref name=Vox>{{cite web
|url=https://www.vox.com/2020/6/23/21293875/internet-archive-website-lawsuit-open-library-wayback-machine-controversy-copyright
|url=https://www.vox.com/2020/6/23/21293875/internet-archive-website-lawsuit-open-library-wayback-machine-controversy-copyright
|title=A lawsuit is threatening the Internet Archive — but it’s not as dire as you may have heard
|title=A lawsuit is threatening the Internet Archive — but it’s not as dire as you may have heard
== Характеристика ==
== Характеристика ==
С запуском Wayback Machine «Архив Интернета» стал одним из самых популярных и узнаваемых онлайн-порталов и главным сервисом [[Архивирование веб-сайтов|веб-архивирования]]<ref name=Bryant/>{{sfn|Price|2011}}. В 1999 году «Архив» начал расширять коллекцию за пределы архивного веб-контента, чтобы обеспечить статус как к оцифрованным, так и изначально цифровым ресурсам, в том числе книгам, аудио, фильмам, изображениям, документам, программному обеспечению и видеоиграм{{sfn|Odgen|2017}}. Некоторые сканирования выполняются поисковыми роботами самого архива, а другие — партнёрскими организациями. Отдельные базы данных могут приобретаться за счёт пожертвований пользователей и целевых приобретений<ref name=Forbes/>. Сами создатели организации сравнивали свою коллекцию с [[Александрийская библиотека|Александрийской библиотекой]]{{sfn|Odgen|2017}}. На 2021 год Wayback Machine содержал более 424 млрд веб-страниц{{sfn|Bowyer|2021|с=43—57}} — больше, чем документов в [[Библиотека Конгресса|Библиотеке Конгресса]]{{sfn|O'Connor|2008|с=64}}{{sfn|Odgen|2017}}<ref name=Forbes />.
С запуском Wayback Machine «Архив Интернета» стал одним из самых популярных и узнаваемых онлайн-порталов и главным сервисом [[Архивирование веб-сайтов|веб-архивирования]]<ref name=Bryant/>{{sfn|Price|2011}}. В 1999 году «Архив» начал расширять коллекцию за пределы архивного веб-контента, чтобы обеспечить статус как к оцифрованным, так и изначально цифровым ресурсам, в том числе книгам, аудио, фильмам, изображениям, документам, программному обеспечению и видеоиграм{{sfn|Odgen|2017}}. Некоторые сканирования выполняются поисковыми роботами самого архива, а другие — партнёрскими организациями. Отдельные базы данных могут приобретаться за счёт пожертвований пользователей и целевых приобретений<ref name=Forbes/>. Сами создатели организации сравнивали свою коллекцию с [[Александрийская библиотека|Александрийской библиотекой]]{{sfn|Odgen|2017}}. На 2021 год Wayback Machine содержал более 424 млрд веб-страниц{{sfn|Bowyer|2021|pp=43—57}} — больше, чем документов в [[Библиотека Конгресса|Библиотеке Конгресса]]{{sfn|O'Connor|2008|p=64}}{{sfn|Odgen|2017}}<ref name=Forbes />.
== Принцип работы ==
== Принцип работы ==
Платформа Wayback Machine функционирует за счёт двух основных элементов — [[Поисковый робот|поисковых роботов]] (или веб-краулеров) и интерфейса. Веб-краулеры занимаются посещением, извлечением, загрузкой и архивацией веб-страниц. В свою очередь, через интерфейс пользователи получают доступ к онлайн-коллекциям{{sfn|Lerner|2017|с=1741—1755}}.
Платформа Wayback Machine функционирует за счёт двух основных элементов — [[Поисковый робот|поисковых роботов]] (или веб-краулеров) и интерфейса. Веб-краулеры занимаются посещением, извлечением, загрузкой и архивацией веб-страниц. В свою очередь, через интерфейс пользователи получают доступ к онлайн-коллекциям{{sfn|Lerner|2017|pp=1741—1755}}.
=== Поисковые роботы ===
=== Поисковые роботы ===
}}</ref>.
}}</ref>.
Веб-краулеры запечатляют версию сайта такой, какой она была сохранена на момент доступа к ней через URL. Роботы регулярно сканируют большое количество веб-страниц, рекурсивно загружая, анализируя и отображая [[HTML]]-, [[JavaScript]]- и [[CSS]]-страницы{{sfn|Lerner|2017|с=1741—1755}}. Механизм работы краулеров похож на работу поисковых систем — роботы самостоятельно ищут порталы для архивирования через систему поиска путей, сканируя страницы и связанные с ними сайты, таким образом формируя сеть порталов. На момент создания «Архива Интернета» всемирная сеть была настолько маленькой, что веб-краулеры могли совершить обход всех сайтов за один сеанс. Однако со временем постоянный рост онлайн-порталов и их изменчивость сделали полный обход всей сети практически невозможным. Таким образом, не все изменения на сайтах зафиксированы в Wayback Machine{{sfn|Price|2011}}. Руководство «Архива Интернета» не уточняет то, как роботы находят и выбирают страницы для сканирования, однако заявляет, что чаще всего краулеры направляются на те сайты, которые имеют перекрёстные ссылки с других порталов и находятся в открытом доступе. Сканер начинает с веб-страницы, а затем следует по каждой гиперссылке на этой веб-странице, чтобы перейти на новые сайты. На каждой из новых веб-страниц поисковый робот повторяет процесс{{sfn|Bowyer|2021|с=43—57}}. Он будет продолжаться до того момента, пока архивация не будет остановлена или не достигнет установленного скриптом лимита<ref>{{cite web
Веб-краулеры запечатляют версию сайта такой, какой она была сохранена на момент доступа к ней через URL. Роботы регулярно сканируют большое количество веб-страниц, рекурсивно загружая, анализируя и отображая [[HTML]]-, [[JavaScript]]- и [[CSS]]-страницы{{sfn|Lerner|2017|pp=1741—1755}}. Механизм работы краулеров похож на работу поисковых систем — роботы самостоятельно ищут порталы для архивирования через систему поиска путей, сканируя страницы и связанные с ними сайты, таким образом формируя сеть порталов. На момент создания «Архива Интернета» всемирная сеть была настолько маленькой, что веб-краулеры могли совершить обход всех сайтов за один сеанс. Однако со временем постоянный рост онлайн-порталов и их изменчивость сделали полный обход всей сети практически невозможным. Таким образом, не все изменения на сайтах зафиксированы в Wayback Machine{{sfn|Price|2011}}. Руководство «Архива Интернета» не уточняет то, как роботы находят и выбирают страницы для сканирования, однако заявляет, что чаще всего краулеры направляются на те сайты, которые имеют перекрёстные ссылки с других порталов и находятся в открытом доступе. Сканер начинает с веб-страницы, а затем следует по каждой гиперссылке на этой веб-странице, чтобы перейти на новые сайты. На каждой из новых веб-страниц поисковый робот повторяет процесс{{sfn|Bowyer|2021|pp=43—57}}. Он будет продолжаться до того момента, пока архивация не будет остановлена или не достигнет установленного скриптом лимита<ref>{{cite web
|url=https://archive.org/details/widecrawl&tab=about
|url=https://archive.org/details/widecrawl&tab=about
|title=Worldwide Web Crawls
|title=Worldwide Web Crawls
|accessdate=2021-06-05
|accessdate=2021-06-05
|lang=en}}
|lang=en}}
</ref>. Помимо этого, каждый пользователь может использовать специальную форму на портале и вызвать краулер, который сохранит страницу в текущем состоянии{{sfn|Lerner|2017|с=1741—1755}}. Wayback Machine сканирует только общедоступные веб-страницы и не может получить доступ к контенту, защищённому паролем или расположенному на частном сервере<ref name=McKinnon/>{{sfn|Bowyer|2021|с=43—57}}<ref name=Bryant/>.
</ref>. Помимо этого, каждый пользователь может использовать специальную форму на портале и вызвать краулер, который сохранит страницу в текущем состоянии{{sfn|Lerner|2017|pp=1741—1755}}. Wayback Machine сканирует только общедоступные веб-страницы и не может получить доступ к контенту, защищённому паролем или расположенному на частном сервере<ref name=McKinnon/>{{sfn|Bowyer|2021|pp=43—57}}<ref name=Bryant/>.
=== Интерфейс ===
=== Интерфейс ===
Интерфейс Wayback Machine позволяет пользователям осуществить два основных действия — получить доступ к истории изменений сайта и просмотреть все сделанные на порталах правки. Также доступна функция сравнения разных версий сайтов{{sfn|Rogers|2017|с=160—172}}<ref>{{cite web
Интерфейс Wayback Machine позволяет пользователям осуществить два основных действия — получить доступ к истории изменений сайта и просмотреть все сделанные на порталах правки. Также доступна функция сравнения разных версий сайтов{{sfn|Rogers|2017|pp=160—172}}<ref>{{cite web
|url=https://news.jrn.msu.edu/2017/12/wayback-machine-archives-websites-for-over-20-years/
|url=https://news.jrn.msu.edu/2017/12/wayback-machine-archives-websites-for-over-20-years/
|title=Wayback Machine archives websites for over 20 years
|title=Wayback Machine archives websites for over 20 years
|archive-url=https://web.archive.org/web/20210624202004/https://news.jrn.msu.edu/2017/12/wayback-machine-archives-websites-for-over-20-years/
|archive-url=https://web.archive.org/web/20210624202004/https://news.jrn.msu.edu/2017/12/wayback-machine-archives-websites-for-over-20-years/
|deadlink=no
|deadlink=no
}}</ref>{{sfn|O'Connor|2008|с=64}}{{sfn|Maemura|2018}}. Для этого в специальное окно поиска вводится URL интересующего портала, после чего Wayback Machine выдаёт список дат архивации. Звёздочка после некоторых дат используется для обозначения обнаруженных на странице изменений. URL-адрес заархивированной страницы начинается с web.archive.org{{sfn|Notess|2002}}{{sfn|Bowyer|2021|с=43—57}}.
}}</ref>{{sfn|O'Connor|2008|p=64}}{{sfn|Maemura|2018}}. Для этого в специальное окно поиска вводится URL интересующего портала, после чего Wayback Machine выдаёт список дат архивации. Звёздочка после некоторых дат используется для обозначения обнаруженных на странице изменений. URL-адрес заархивированной страницы начинается с web.archive.org{{sfn|Notess|2002}}{{sfn|Bowyer|2021|pp=43—57}}.
Любой пользователь может сохранить URL-адреса для архивирования, а с бесплатной учётной записью в архиве можно создать и заархивировать любые исходящие или внешние ссылки на исходной странице и получить обзорный отчёт<ref name=Graham>{{cite web
Любой пользователь может сохранить URL-адреса для архивирования, а с бесплатной учётной записью в архиве можно создать и заархивировать любые исходящие или внешние ссылки на исходной странице и получить обзорный отчёт<ref name=Graham>{{cite web
|author=Евгений Делюкин
|author=Евгений Делюкин
|date=2020-02-26
|date=2020-02-26
|publisher=VcRu
|publisher=vc.ru
|accessdate=2021-06-01
|accessdate=2021-06-01
|lang=en
|lang=en
== Использование ==
== Использование ==
Портал Wayback Machine зачастую применяют в правовой сфере — юристы используют сервис для поиска информации по гражданским искам, уголовным делам, в административном делопроизводстве и патентных процессах. Полученные через Wayback Machine архивные версии сайтов могут использоваться для решения вопросов о [[Патентное право|патентном праве]] или установлении наказания за публикацию материалов, которые впоследствии были удалены из сети{{sfn|Lerner|2017|с=1741—1755}}{{sfn|Rogers|2017|с=160—172}}. Несмотря на широкое использование коллекции «Архива Интернета» для предоставления доказательств, некоторые суды США отказывались принимать скриншоты веб-страниц, ссылаясь на юридическую сложность отождествления оригинала документа и его заархивированной версии{{sfn|Eltgroth|2009}}. В 2018 году [[Апелляционный суд США по второму федеральному апелляционному округу]] постановил, что скрины с архива веб-страниц Wayback Machine относятся к законным доказательствам, которые могут быть использованы в судебных разбирательствах; ранее аналогичное решение вынес [[Апелляционный суд США по третьему федеральному апелляционному округу]]<ref>{{cite web
Портал Wayback Machine зачастую применяют в правовой сфере — юристы используют сервис для поиска информации по гражданским искам, уголовным делам, в административном делопроизводстве и патентных процессах. Полученные через Wayback Machine архивные версии сайтов могут использоваться для решения вопросов о [[Патентное право|патентном праве]] или установлении наказания за публикацию материалов, которые впоследствии были удалены из сети{{sfn|Lerner|2017|pp=1741—1755}}{{sfn|Rogers|2017|pp=160—172}}. Несмотря на широкое использование коллекции «Архива Интернета» для предоставления доказательств, некоторые суды США отказывались принимать скриншоты веб-страниц, ссылаясь на юридическую сложность отождествления оригинала документа и его заархивированной версии{{sfn|Eltgroth|2009}}. В 2018 году [[Апелляционный суд США по второму федеральному апелляционному округу]] постановил, что скрины с архива веб-страниц Wayback Machine относятся к законным доказательствам, которые могут быть использованы в судебных разбирательствах; ранее аналогичное решение вынес [[Апелляционный суд США по третьему федеральному апелляционному округу]]<ref>{{cite web
|url=https://www.theregister.com/2018/09/04/wayback_machine_legit/
|url=https://www.theregister.com/2018/09/04/wayback_machine_legit/
|title=Archive.org's Wayback Machine is legit legal evidence, US appeals court judges rule
|title=Archive.org's Wayback Machine is legit legal evidence, US appeals court judges rule
}}</ref>.
}}</ref>.
Благодаря архивированным в Wayback Machine статьям авторы могут устанавливать право на открытие или на публикацию{{sfn|Pearce|2009|с=875}}. Для социологов и историков Wayback Machine предлагает ценный крупномасштабный источник данных для анализа поведения компаний, стратегий продаж, социальных практик{{sfn|Arora|2015}}{{sfn|Milligan|2016}}. Также Wayback Machine позволяет получать доступ к журналам [[открытый доступ|открытого доступа]]. Так, с начала 2000-х годов из интернета исчезло 84 журнала ОД по естественным наукам и ещё около 100 — по социальным и гуманитарным<ref>{{cite web
Благодаря архивированным в Wayback Machine статьям авторы могут устанавливать право на открытие или на публикацию{{sfn|Pearce|2009|p=875}}. Для социологов и историков Wayback Machine предлагает ценный крупномасштабный источник данных для анализа поведения компаний, стратегий продаж, социальных практик{{sfn|Arora|2015}}{{sfn|Milligan|2016}}. Также Wayback Machine позволяет получать доступ к журналам [[открытый доступ|открытого доступа]]. Так, с начала 2000-х годов из интернета исчезло 84 журнала ОД по естественным наукам и ещё около 100 — по социальным и гуманитарным<ref>{{cite web
|url=https://www.sciencemag.org/news/2020/09/dozens-scientific-journals-have-vanished-internet-and-no-one-preserved-them
|url=https://www.sciencemag.org/news/2020/09/dozens-scientific-journals-have-vanished-internet-and-no-one-preserved-them
|title=Dozens of scientific journals have vanished from the internet, and no one preserved them
|title=Dozens of scientific journals have vanished from the internet, and no one preserved them
|author=Mary Kay Magistad
|author=Mary Kay Magistad
|date=2017-02-23
|date=2017-02-23
|publisher=The World
|publisher=PRI.org
|accessdate=2021-06-07
|accessdate=2021-06-07
|lang=en
|lang=en
|author=Дамир Камалетдинов
|author=Дамир Камалетдинов
|date=2021-05-30
|date=2021-05-30
|publisher=T Journal
|publisher=TJournal
|accessdate=2021-06-05
|accessdate=2021-06-05
|lang=en
|lang=en
|author=Lisa M. Bowman
|author=Lisa M. Bowman
|date=2002-09-24
|date=2002-09-24
|publisher=C Net
|publisher=CNET
|accessdate=2021-06-10
|accessdate=2021-06-10
|lang=en}}
|lang=en}}
|author=Дмитрий Шестоперов, Анастасия Евтушенко
|author=Дмитрий Шестоперов, Анастасия Евтушенко
|date=2016-04-18
|date=2016-04-18
|publisher=газета.ru
|publisher=Газета.ru
|accessdate=2021-12-09
|accessdate=2021-12-09
|lang=ru}}
|lang=ru}}
|title=«Архив интернета» могут навечно заблокировать в России
|title=«Архив интернета» могут навечно заблокировать в России
|date=2019-08-23
|date=2019-08-23
|publisher=C News
|publisher=CNews
|accessdate=2021-06-07
|accessdate=2021-06-07
|lang=ru
|lang=ru
|title=Россияне потребовали запретить в Европе Telegram, YouTube и Mail.ru
|title=Россияне потребовали запретить в Европе Telegram, YouTube и Mail.ru
|date=2020-08-19
|date=2020-08-19
|publisher=C News
|publisher=CNews
|accessdate=2021-06-07
|accessdate=2021-06-07
|lang=ru
|lang=ru