Изменения

Перейти к навигации Перейти к поиску
8 байт убрано ,  3 года назад
нет описания правки
Строка 13: Строка 13:  
}}
 
}}
   −
'''Wayback Machine''' ({{tr-en|Машина времени}}) — бесплатный онлайн-архив [[Некоммерческая организация|некоммерческой библиотеки]] «[[Архив Интернета]]». С помощью [[Поисковый робот|поисковых роботов]] Wayback Machine архивирует и делает общедоступной бо́льшую часть «открытого» интернета{{sfn|Arora|2015}}. Сервис был запущен в 1996 году, однако стал доступен для общественности только в 2001-м. За первые 20 лет существования Wayback Machine каталогизировал и сохранил коллекцию из более чем 286 млрд веб-страниц. Архивные снимки отображаются в формате [[HTML]], [[JavaScript]] и [[CSS]]{{sfn|Lerner|2017|с=1741—1755}}. Благодаря сохранённым в Wayback Machine документам пользователи могут отслеживать происходящие на сайтах изменения и сравнивать разные версии правок<ref name=Bryant>{{cite web
+
'''Wayback Machine''' ({{tr-en|Машина времени}}) — бесплатный онлайн-архив [[Некоммерческая организация|некоммерческой библиотеки]] «[[Архив Интернета]]». С помощью [[Поисковый робот|поисковых роботов]] Wayback Machine архивирует и делает общедоступной бо́льшую часть «открытого» интернета{{sfn|Arora|2015}}. Сервис был запущен в 1996 году, однако стал доступен для общественности только в 2001-м. За первые 20 лет существования Wayback Machine каталогизировал и сохранил коллекцию из более чем 286 млрд веб-страниц. Архивные снимки отображаются в формате [[HTML]], [[JavaScript]] и [[CSS]]{{sfn|Lerner|2017|pp=1741—1755}}. Благодаря сохранённым в Wayback Machine документам пользователи могут отслеживать происходящие на сайтах изменения и сравнивать разные версии правок<ref name=Bryant>{{cite web
 
|url=https://www.groovypost.com/explaier/what-is-the-wayback-machine-and-why-is-it-useful/
 
|url=https://www.groovypost.com/explaier/what-is-the-wayback-machine-and-why-is-it-useful/
 
|title=What is the Wayback Machine and Why is it Useful?
 
|title=What is the Wayback Machine and Why is it Useful?
Строка 91: Строка 91:  
|archive-url=https://web.archive.org/web/20170507173716/https://www.theatlantic.com/technology/archive/2015/10/raiders-of-the-lost-web/409210/
 
|archive-url=https://web.archive.org/web/20170507173716/https://www.theatlantic.com/technology/archive/2015/10/raiders-of-the-lost-web/409210/
 
|deadlink=no
 
|deadlink=no
}}</ref>. Благодаря интеграции с Alexa столкнувшийся с сообщением об ошибке пользователь мог получить доступ к заархивированной версии страницы через внедрённую в браузер панель инструментов. Если копия недоступной страницы присутствовала в базе данных Wayback Machine, то загоралась специальная кнопка. При этом пользователи могли предоставить браузеру разрешение на просмотр и регистрацию активности — в таком случае все посещаемые сайты архивировались на портале{{sfn|Rogers|2017|с=160—172}}.
+
}}</ref>. Благодаря интеграции с Alexa столкнувшийся с сообщением об ошибке пользователь мог получить доступ к заархивированной версии страницы через внедрённую в браузер панель инструментов. Если копия недоступной страницы присутствовала в базе данных Wayback Machine, то загоралась специальная кнопка. При этом пользователи могли предоставить браузеру разрешение на просмотр и регистрацию активности — в таком случае все посещаемые сайты архивировались на портале{{sfn|Rogers|2017|pp=160—172}}.
   −
Wayback Machine был запущен в мае 1996 года, однако стал доступным для общественности только в 2001-м — до этого вся записанная на цифровых магнитных лентах информация была открыта только для ограниченного числа учёных и исследователей{{sfn|Hartelius|2020|c=378}}. К моменту «открытия» архив содержал более 10 млрд заархивированных страниц<ref name=Bryant/>. К декабрю 2014 года руководство Wayback Machine сообщило, что сохранило 435 млрд веб-страниц по всему миру{{sfn|Arora|2015}}. С технической точки зрения программное обеспечение Wayback Machine не является архивом, а скорее общедоступным интерфейсом к ограниченному подмножеству всех хранилищ{{sfn|Bowyer|2021|с=43—57}}. Так, Wayback Machine нельзя считать поисковой системой коллекции организации, так как она не осуществляет поиск по базе данных другой крупной виртуальной библиотеки — [[Open Library]], позволяющей пользователям бесплатно получать доступ к цифровым копиям книг, которые загружаются и архивируются в рамках проекта<ref name=Vox>{{cite web
+
Wayback Machine был запущен в мае 1996 года, однако стал доступным для общественности только в 2001-м — до этого вся записанная на цифровых магнитных лентах информация была открыта только для ограниченного числа учёных и исследователей{{sfn|Hartelius|2020|p=378}}. К моменту «открытия» архив содержал более 10 млрд заархивированных страниц<ref name=Bryant/>. К декабрю 2014 года руководство Wayback Machine сообщило, что сохранило 435 млрд веб-страниц по всему миру{{sfn|Arora|2015}}. С технической точки зрения программное обеспечение Wayback Machine не является архивом, а скорее общедоступным интерфейсом к ограниченному подмножеству всех хранилищ{{sfn|Bowyer|2021|pp=43—57}}. Так, Wayback Machine нельзя считать поисковой системой коллекции организации, так как она не осуществляет поиск по базе данных другой крупной виртуальной библиотеки — [[Open Library]], позволяющей пользователям бесплатно получать доступ к цифровым копиям книг, которые загружаются и архивируются в рамках проекта<ref name=Vox>{{cite web
 
|url=https://www.vox.com/2020/6/23/21293875/internet-archive-website-lawsuit-open-library-wayback-machine-controversy-copyright
 
|url=https://www.vox.com/2020/6/23/21293875/internet-archive-website-lawsuit-open-library-wayback-machine-controversy-copyright
 
|title=A lawsuit is threatening the Internet Archive — but it’s not as dire as you may have heard
 
|title=A lawsuit is threatening the Internet Archive — but it’s not as dire as you may have heard
Строка 118: Строка 118:     
== Характеристика ==
 
== Характеристика ==
С запуском Wayback Machine «Архив Интернета» стал одним из самых популярных и узнаваемых онлайн-порталов и главным сервисом [[Архивирование веб-сайтов|веб-архивирования]]<ref name=Bryant/>{{sfn|Price|2011}}. В 1999 году  «Архив» начал расширять коллекцию за пределы архивного веб-контента, чтобы обеспечить статус как к оцифрованным, так и изначально цифровым ресурсам, в том числе книгам, аудио, фильмам, изображениям, документам, программному обеспечению и видеоиграм{{sfn|Odgen|2017}}. Некоторые сканирования выполняются поисковыми роботами самого архива, а другие — партнёрскими организациями. Отдельные базы данных могут приобретаться за счёт пожертвований пользователей и целевых приобретений<ref name=Forbes/>. Сами создатели организации сравнивали свою коллекцию с [[Александрийская библиотека|Александрийской библиотекой]]{{sfn|Odgen|2017}}. На 2021 год Wayback Machine содержал более 424 млрд веб-страниц{{sfn|Bowyer|2021|с=43—57}} — больше, чем документов в [[Библиотека Конгресса|Библиотеке Конгресса]]{{sfn|O'Connor|2008|с=64}}{{sfn|Odgen|2017}}<ref name=Forbes />.
+
С запуском Wayback Machine «Архив Интернета» стал одним из самых популярных и узнаваемых онлайн-порталов и главным сервисом [[Архивирование веб-сайтов|веб-архивирования]]<ref name=Bryant/>{{sfn|Price|2011}}. В 1999 году  «Архив» начал расширять коллекцию за пределы архивного веб-контента, чтобы обеспечить статус как к оцифрованным, так и изначально цифровым ресурсам, в том числе книгам, аудио, фильмам, изображениям, документам, программному обеспечению и видеоиграм{{sfn|Odgen|2017}}. Некоторые сканирования выполняются поисковыми роботами самого архива, а другие — партнёрскими организациями. Отдельные базы данных могут приобретаться за счёт пожертвований пользователей и целевых приобретений<ref name=Forbes/>. Сами создатели организации сравнивали свою коллекцию с [[Александрийская библиотека|Александрийской библиотекой]]{{sfn|Odgen|2017}}. На 2021 год Wayback Machine содержал более 424 млрд веб-страниц{{sfn|Bowyer|2021|pp=43—57}} — больше, чем документов в [[Библиотека Конгресса|Библиотеке Конгресса]]{{sfn|O'Connor|2008|p=64}}{{sfn|Odgen|2017}}<ref name=Forbes />.
    
== Принцип работы ==
 
== Принцип работы ==
Платформа Wayback Machine функционирует за счёт двух основных элементов — [[Поисковый робот|поисковых роботов]] (или веб-краулеров) и интерфейса. Веб-краулеры занимаются посещением, извлечением, загрузкой и архивацией веб-страниц. В свою очередь, через интерфейс пользователи получают доступ к онлайн-коллекциям{{sfn|Lerner|2017|с=1741—1755}}.
+
Платформа Wayback Machine функционирует за счёт двух основных элементов — [[Поисковый робот|поисковых роботов]] (или веб-краулеров) и интерфейса. Веб-краулеры занимаются посещением, извлечением, загрузкой и архивацией веб-страниц. В свою очередь, через интерфейс пользователи получают доступ к онлайн-коллекциям{{sfn|Lerner|2017|pp=1741—1755}}.
    
=== Поисковые роботы ===
 
=== Поисковые роботы ===
Строка 171: Строка 171:  
}}</ref>.
 
}}</ref>.
   −
Веб-краулеры запечатляют версию сайта такой, какой она была сохранена на момент доступа к ней через URL. Роботы регулярно сканируют большое количество веб-страниц, рекурсивно загружая, анализируя и отображая [[HTML]]-, [[JavaScript]]- и [[CSS]]-страницы{{sfn|Lerner|2017|с=1741—1755}}. Механизм работы краулеров похож на работу поисковых систем — роботы самостоятельно ищут порталы для архивирования через систему поиска путей, сканируя страницы и связанные с ними сайты, таким образом формируя сеть порталов. На момент создания «Архива Интернета» всемирная сеть была настолько маленькой, что веб-краулеры могли совершить обход всех сайтов за один сеанс. Однако со временем постоянный рост онлайн-порталов и их изменчивость сделали полный обход всей сети практически невозможным. Таким образом, не все изменения на сайтах зафиксированы в Wayback Machine{{sfn|Price|2011}}. Руководство «Архива Интернета» не уточняет то, как роботы находят и выбирают страницы для сканирования, однако заявляет, что чаще всего краулеры направляются на те сайты, которые имеют перекрёстные ссылки с других порталов и находятся в открытом доступе. Сканер начинает с веб-страницы, а затем следует по каждой гиперссылке на этой веб-странице, чтобы перейти на новые сайты. На каждой из новых веб-страниц поисковый робот повторяет процесс{{sfn|Bowyer|2021|с=43—57}}. Он будет продолжаться до того момента, пока архивация не будет остановлена или не достигнет установленного скриптом лимита<ref>{{cite web
+
Веб-краулеры запечатляют версию сайта такой, какой она была сохранена на момент доступа к ней через URL. Роботы регулярно сканируют большое количество веб-страниц, рекурсивно загружая, анализируя и отображая [[HTML]]-, [[JavaScript]]- и [[CSS]]-страницы{{sfn|Lerner|2017|pp=1741—1755}}. Механизм работы краулеров похож на работу поисковых систем — роботы самостоятельно ищут порталы для архивирования через систему поиска путей, сканируя страницы и связанные с ними сайты, таким образом формируя сеть порталов. На момент создания «Архива Интернета» всемирная сеть была настолько маленькой, что веб-краулеры могли совершить обход всех сайтов за один сеанс. Однако со временем постоянный рост онлайн-порталов и их изменчивость сделали полный обход всей сети практически невозможным. Таким образом, не все изменения на сайтах зафиксированы в Wayback Machine{{sfn|Price|2011}}. Руководство «Архива Интернета» не уточняет то, как роботы находят и выбирают страницы для сканирования, однако заявляет, что чаще всего краулеры направляются на те сайты, которые имеют перекрёстные ссылки с других порталов и находятся в открытом доступе. Сканер начинает с веб-страницы, а затем следует по каждой гиперссылке на этой веб-странице, чтобы перейти на новые сайты. На каждой из новых веб-страниц поисковый робот повторяет процесс{{sfn|Bowyer|2021|pp=43—57}}. Он будет продолжаться до того момента, пока архивация не будет остановлена или не достигнет установленного скриптом лимита<ref>{{cite web
 
|url=https://archive.org/details/widecrawl&tab=about
 
|url=https://archive.org/details/widecrawl&tab=about
 
|title=Worldwide Web Crawls
 
|title=Worldwide Web Crawls
Строка 179: Строка 179:  
|accessdate=2021-06-05
 
|accessdate=2021-06-05
 
|lang=en}}
 
|lang=en}}
</ref>. Помимо этого, каждый пользователь может использовать специальную форму на портале и вызвать краулер, который сохранит страницу в текущем состоянии{{sfn|Lerner|2017|с=1741—1755}}. Wayback Machine сканирует только общедоступные веб-страницы и не может получить доступ к контенту, защищённому паролем или расположенному на частном сервере<ref name=McKinnon/>{{sfn|Bowyer|2021|с=43—57}}<ref name=Bryant/>.
+
</ref>. Помимо этого, каждый пользователь может использовать специальную форму на портале и вызвать краулер, который сохранит страницу в текущем состоянии{{sfn|Lerner|2017|pp=1741—1755}}. Wayback Machine сканирует только общедоступные веб-страницы и не может получить доступ к контенту, защищённому паролем или расположенному на частном сервере<ref name=McKinnon/>{{sfn|Bowyer|2021|pp=43—57}}<ref name=Bryant/>.
    
=== Интерфейс ===
 
=== Интерфейс ===
Интерфейс Wayback Machine позволяет пользователям осуществить два основных действия — получить доступ к истории изменений сайта и просмотреть все сделанные на порталах правки. Также доступна функция сравнения разных версий сайтов{{sfn|Rogers|2017|с=160—172}}<ref>{{cite web
+
Интерфейс Wayback Machine позволяет пользователям осуществить два основных действия — получить доступ к истории изменений сайта и просмотреть все сделанные на порталах правки. Также доступна функция сравнения разных версий сайтов{{sfn|Rogers|2017|pp=160—172}}<ref>{{cite web
 
|url=https://news.jrn.msu.edu/2017/12/wayback-machine-archives-websites-for-over-20-years/
 
|url=https://news.jrn.msu.edu/2017/12/wayback-machine-archives-websites-for-over-20-years/
 
|title=Wayback Machine archives websites for over 20 years
 
|title=Wayback Machine archives websites for over 20 years
Строка 193: Строка 193:  
|archive-url=https://web.archive.org/web/20210624202004/https://news.jrn.msu.edu/2017/12/wayback-machine-archives-websites-for-over-20-years/
 
|archive-url=https://web.archive.org/web/20210624202004/https://news.jrn.msu.edu/2017/12/wayback-machine-archives-websites-for-over-20-years/
 
|deadlink=no
 
|deadlink=no
}}</ref>{{sfn|O'Connor|2008|с=64}}{{sfn|Maemura|2018}}. Для этого в специальное окно поиска вводится URL интересующего портала, после чего Wayback Machine выдаёт список дат архивации. Звёздочка после некоторых дат используется для обозначения обнаруженных на странице изменений. URL-адрес заархивированной страницы начинается с web.archive.org{{sfn|Notess|2002}}{{sfn|Bowyer|2021|с=43—57}}.
+
}}</ref>{{sfn|O'Connor|2008|p=64}}{{sfn|Maemura|2018}}. Для этого в специальное окно поиска вводится URL интересующего портала, после чего Wayback Machine выдаёт список дат архивации. Звёздочка после некоторых дат используется для обозначения обнаруженных на странице изменений. URL-адрес заархивированной страницы начинается с web.archive.org{{sfn|Notess|2002}}{{sfn|Bowyer|2021|pp=43—57}}.
    
Любой пользователь может сохранить URL-адреса для архивирования, а с бесплатной учётной записью в архиве можно создать и заархивировать любые исходящие или внешние ссылки на исходной странице и получить обзорный отчёт<ref name=Graham>{{cite web
 
Любой пользователь может сохранить URL-адреса для архивирования, а с бесплатной учётной записью в архиве можно создать и заархивировать любые исходящие или внешние ссылки на исходной странице и получить обзорный отчёт<ref name=Graham>{{cite web
Строка 225: Строка 225:  
|author=Евгений Делюкин
 
|author=Евгений Делюкин
 
|date=2020-02-26
 
|date=2020-02-26
|publisher=VcRu
+
|publisher=vc.ru
 
|accessdate=2021-06-01
 
|accessdate=2021-06-01
 
|lang=en
 
|lang=en
Строка 234: Строка 234:     
== Использование ==
 
== Использование ==
Портал Wayback Machine зачастую применяют в правовой сфере — юристы используют сервис для поиска информации по гражданским искам, уголовным делам, в административном делопроизводстве и патентных процессах. Полученные через Wayback Machine архивные версии сайтов могут использоваться для решения вопросов о [[Патентное право|патентном праве]] или установлении наказания за публикацию материалов, которые впоследствии были удалены из сети{{sfn|Lerner|2017|с=1741—1755}}{{sfn|Rogers|2017|с=160—172}}. Несмотря на широкое использование коллекции «Архива Интернета» для предоставления доказательств, некоторые суды США отказывались принимать скриншоты веб-страниц, ссылаясь на юридическую сложность отождествления оригинала документа и его заархивированной версии{{sfn|Eltgroth|2009}}. В 2018 году [[Апелляционный суд США по второму федеральному апелляционному округу]] постановил, что скрины с архива веб-страниц Wayback Machine относятся к законным доказательствам, которые могут быть использованы в судебных разбирательствах; ранее аналогичное решение вынес [[Апелляционный суд США по третьему федеральному апелляционному округу]]<ref>{{cite web
+
Портал Wayback Machine зачастую применяют в правовой сфере — юристы используют сервис для поиска информации по гражданским искам, уголовным делам, в административном делопроизводстве и патентных процессах. Полученные через Wayback Machine архивные версии сайтов могут использоваться для решения вопросов о [[Патентное право|патентном праве]] или установлении наказания за публикацию материалов, которые впоследствии были удалены из сети{{sfn|Lerner|2017|pp=1741—1755}}{{sfn|Rogers|2017|pp=160—172}}. Несмотря на широкое использование коллекции «Архива Интернета» для предоставления доказательств, некоторые суды США отказывались принимать скриншоты веб-страниц, ссылаясь на юридическую сложность отождествления оригинала документа и его заархивированной версии{{sfn|Eltgroth|2009}}. В 2018 году [[Апелляционный суд США по второму федеральному апелляционному округу]] постановил, что скрины с архива веб-страниц Wayback Machine относятся к законным доказательствам, которые могут быть использованы в судебных разбирательствах; ранее аналогичное решение вынес [[Апелляционный суд США по третьему федеральному апелляционному округу]]<ref>{{cite web
 
|url=https://www.theregister.com/2018/09/04/wayback_machine_legit/
 
|url=https://www.theregister.com/2018/09/04/wayback_machine_legit/
 
|title=Archive.org's Wayback Machine is legit legal evidence, US appeals court judges rule
 
|title=Archive.org's Wayback Machine is legit legal evidence, US appeals court judges rule
Строка 258: Строка 258:  
}}</ref>.
 
}}</ref>.
   −
Благодаря архивированным в Wayback Machine статьям авторы могут устанавливать право на открытие или на публикацию{{sfn|Pearce|2009|с=875}}. Для социологов и историков Wayback Machine предлагает ценный крупномасштабный источник данных для анализа поведения компаний, стратегий продаж, социальных практик{{sfn|Arora|2015}}{{sfn|Milligan|2016}}. Также Wayback Machine позволяет получать доступ к журналам [[открытый доступ|открытого доступа]]. Так, с начала 2000-х годов из интернета исчезло 84 журнала ОД по естественным наукам и ещё около 100 — по социальным и гуманитарным<ref>{{cite web
+
Благодаря архивированным в Wayback Machine статьям авторы могут устанавливать право на открытие или на публикацию{{sfn|Pearce|2009|p=875}}. Для социологов и историков Wayback Machine предлагает ценный крупномасштабный источник данных для анализа поведения компаний, стратегий продаж, социальных практик{{sfn|Arora|2015}}{{sfn|Milligan|2016}}. Также Wayback Machine позволяет получать доступ к журналам [[открытый доступ|открытого доступа]]. Так, с начала 2000-х годов из интернета исчезло 84 журнала ОД по естественным наукам и ещё около 100 — по социальным и гуманитарным<ref>{{cite web
 
|url=https://www.sciencemag.org/news/2020/09/dozens-scientific-journals-have-vanished-internet-and-no-one-preserved-them
 
|url=https://www.sciencemag.org/news/2020/09/dozens-scientific-journals-have-vanished-internet-and-no-one-preserved-them
 
|title=Dozens of scientific journals have vanished from the internet, and no one preserved them
 
|title=Dozens of scientific journals have vanished from the internet, and no one preserved them
Строка 309: Строка 309:  
|author=Mary Kay Magistad
 
|author=Mary Kay Magistad
 
|date=2017-02-23
 
|date=2017-02-23
|publisher=The World
+
|publisher=PRI.org
 
|accessdate=2021-06-07
 
|accessdate=2021-06-07
 
|lang=en
 
|lang=en
Строка 363: Строка 363:  
|author=Дамир Камалетдинов
 
|author=Дамир Камалетдинов
 
|date=2021-05-30
 
|date=2021-05-30
|publisher=T Journal
+
|publisher=TJournal
 
|accessdate=2021-06-05
 
|accessdate=2021-06-05
 
|lang=en
 
|lang=en
Строка 411: Строка 411:  
|author=Lisa M. Bowman
 
|author=Lisa M. Bowman
 
|date=2002-09-24
 
|date=2002-09-24
|publisher=C Net
+
|publisher=CNET
 
|accessdate=2021-06-10
 
|accessdate=2021-06-10
 
|lang=en}}
 
|lang=en}}
Строка 476: Строка 476:  
|author=Дмитрий Шестоперов, Анастасия Евтушенко
 
|author=Дмитрий Шестоперов, Анастасия Евтушенко
 
|date=2016-04-18
 
|date=2016-04-18
|publisher=газета.ru
+
|publisher=Газета.ru
 
|accessdate=2021-12-09
 
|accessdate=2021-12-09
 
|lang=ru}}
 
|lang=ru}}
Строка 495: Строка 495:  
|title=«Архив интернета» могут навечно заблокировать в России
 
|title=«Архив интернета» могут навечно заблокировать в России
 
|date=2019-08-23
 
|date=2019-08-23
|publisher=C News
+
|publisher=CNews
 
|accessdate=2021-06-07
 
|accessdate=2021-06-07
 
|lang=ru
 
|lang=ru
Строка 505: Строка 505:  
|title=Россияне потребовали запретить в Европе Telegram, YouTube и Mail.ru
 
|title=Россияне потребовали запретить в Европе Telegram, YouTube и Mail.ru
 
|date=2020-08-19
 
|date=2020-08-19
|publisher=C News
+
|publisher=CNews
 
|accessdate=2021-06-07
 
|accessdate=2021-06-07
 
|lang=ru
 
|lang=ru
Анонимный участник

Реклама:

Навигация