Изменения

Перейти к навигации Перейти к поиску
48 байт убрано ,  4 года назад
нет описания правки
Строка 12: Строка 12:  
}}
 
}}
   −
'''Wayback Machine''' ({{tr-en|Машина времени}}) — бесплатный онлайн-архив [[Некоммерческая организация|некоммерческой библиотеки]] [[Архив Интернета]]. С помощью [[Поисковый робот|поисковых роботов]] или ''веб-краулеров'' Wayback Machine архивирует и делает общедоступной бо́льшую часть «открытого» интернета{{sfn|Arora|2015}}. Сервис был запущен в 1996 году, однако стал доступен для общественности только в 2001-м. За первые 20 лет существования Wayback Machine каталогизировал и сохранил коллекцию из более чем 286 млрд веб-сайтов. Архивные снимки отображаются в формате [[HTML]], [[JavaScript]] и [[CSS]]{{sfn|Lerner|2017|с=1741—1755}}. Благодаря сохранённым в Wayback Machine документам пользователи могут отслеживать происходящие на сайтах изменения и сравнивать разные версии правок<ref name=Bryant>{{cite web
+
'''Wayback Machine''' ({{tr-en|Машина времени}}) — бесплатный онлайн-архив [[Некоммерческая организация|некоммерческой библиотеки]] «[[Архив Интернета]]». С помощью [[Поисковый робот|поисковых роботов]] или ''веб-краулеров'' Wayback Machine архивирует и делает общедоступной бо́льшую часть «открытого» интернета{{sfn|Arora|2015}}. Сервис был запущен в 1996 году, однако стал доступен для общественности только в 2001-м. За первые 20 лет существования Wayback Machine каталогизировал и сохранил коллекцию из более чем 286 млрд веб-сайтов. Архивные снимки отображаются в формате [[HTML]], [[JavaScript]] и [[CSS]]{{sfn|Lerner|2017|с=1741—1755}}. Благодаря сохранённым в Wayback Machine документам пользователи могут отслеживать происходящие на сайтах изменения и сравнивать разные версии правок<ref name=Bryant>{{cite web
 
|url=https://www.groovypost.com/explaier/what-is-the-wayback-machine-and-why-is-it-useful/
 
|url=https://www.groovypost.com/explaier/what-is-the-wayback-machine-and-why-is-it-useful/
 
|title=What is the Wayback Machine and Why is it Useful?
 
|title=What is the Wayback Machine and Why is it Useful?
Строка 30: Строка 30:  
[[Файл:Brewster Kahle 2009.jpg|thumb|250px|right|[[Кейл, Брюстер|Брюстер Кейл]] в 2009 году]]
 
[[Файл:Brewster Kahle 2009.jpg|thumb|250px|right|[[Кейл, Брюстер|Брюстер Кейл]] в 2009 году]]
   −
В 1989 году английский учёный [[Бернерс-Ли, Тим|Тим Бернерс-Ли]] создал [[всемирная паутина|всемирную паутину]] — систему, позволяющую передавать данные через подключённые к интернету компьютеры. Однако с распространением всемирной паутины были выявлены две основные проблемы. Первая состояла в нехватке мест для хранения всех данных, из-за чего многие документы и веб-страницы удалялись. Другая проблема заключалась в том, что после редактирования веб-страницы (например, по юридическим причинам), пользователи не могли посмотреть её изначальную версию. Решить эти недостатки стремилась американская цифровая библиотека  [[Архив Интернета]], — некоммерческая организация, созданная программистами [[Кейл, Брюстер|Брюстером Кейлом]] и {{iw|Галлиат, Брюс|Брюсом Галлиатом|en|Bruce Gilliat}} в 1996 году. При сотрудничестве с [[Alexa Internet]] ([[Дочернее общество|дочерней компанией]] [[Amazon]], занимающейся веб-индексированием) Архив инициировал создание и хранение копий существующих сайтов для развития «универсального доступа к знанию». Организация предоставляла [[открытый доступ|бесплатный публичный доступ]] к оцифрованным материалам, таким как веб-страницы, книги, аудиозаписи, включая живые концерты, видео, изображения и программное обеспечение. На 2021 год штаб-квартира Архива Интернета находится в [[Сан-Франциско]], в здании бывшей христианской церкви, расположенной в районе [[Ричмонд (район Сан-Франциско)|Ричмонд]]. Журналист местной радиостанции {{iw|Kawl|||}} в 2019 году сравнивал офис Архива с римским храмом<ref>{{cite web
+
В 1989 году английский учёный [[Бернерс-Ли, Тим|Тим Бернерс-Ли]] создал [[всемирная паутина|всемирную паутину]] — систему, позволяющую передавать данные через подключённые к интернету компьютеры. Однако с распространением всемирной паутины были выявлены две основные проблемы. Первая состояла в нехватке мест для хранения всех данных, из-за чего многие документы и веб-страницы удалялись. Другая проблема заключалась в том, что после редактирования веб-страницы (например, по юридическим причинам), пользователи не могли посмотреть её изначальную версию. Решить эти недостатки стремилась американская цифровая библиотека  «[[Архив Интернета]]», — некоммерческая организация, созданная программистами [[Кейл, Брюстер|Брюстером Кейлом]] и {{iw|Галлиат, Брюс|Брюсом Галлиатом|en|Bruce Gilliat}} в 1996 году. При сотрудничестве с [[Alexa Internet]] ([[Дочернее общество|дочерней компанией]] [[Amazon]], занимающейся веб-индексированием) Архив инициировал создание и хранение копий существующих сайтов для развития «универсального доступа к знанию». Организация предоставляла [[открытый доступ|бесплатный публичный доступ]] к оцифрованным материалам, таким как веб-страницы, книги, аудиозаписи, включая живые концерты, видео, изображения и программное обеспечение. На 2021 год штаб-квартира Архива Интернета находится в [[Сан-Франциско]], в здании бывшей христианской церкви, расположенной в районе [[Ричмонд (район Сан-Франциско)|Ричмонд]]. Журналист местной радиостанции {{iw|Kawl|||}} в 2019 году сравнивал офис Архива с римским храмом<ref>{{cite web
 
|url=https://theconversation.com/dominic-cummings-how-the-internet-knows-when-youve-updated-your-blog-139517
 
|url=https://theconversation.com/dominic-cummings-how-the-internet-knows-when-youve-updated-your-blog-139517
 
|title=Dominic Cummings: how the internet knows when you’ve updated your blog
 
|title=Dominic Cummings: how the internet knows when you’ve updated your blog
Строка 83: Строка 83:  
</ref>.
 
</ref>.
 
== Характеристика ==
 
== Характеристика ==
С запуском Wayback Machine Архив Интернета стал одним из самых популярных и узнаваемых онлайн-порталов и главным сервисом [[Архивирование веб-сайтов|веб-архивирования]]<ref name=Bryant/>{{sfn|Price|2011}}. В 1999 году Архив начал расширять коллекцию за пределы архивного веб-контента, чтобы обеспечить статус как к оцифрованным так и изначально цифровым ресурсам, в том числе книгам, аудио, фильмам, изображениям, документам, программному обеспечению и видеоиграм{{sfn|Odgen|2017}}. Некоторые сканирования выполняются поисковыми роботами самого архива, а другие — партнёрскими организациями. Отдельные базы данных могут приобретаться за счёт пожертвований пользователей и целевых приобретений<ref name=Forbes/>. Сами создатели организации сравнивали свою коллекцию с [[Александрийская библиотека|Александрийской библиотекой]]{{sfn|Odgen|2017}}. На 2021 год Wayback Machine содержал более 424 млрд веб-страниц{{sfn|Bowyer|2021|с=43—57}} — больше, чем документов в [[Библиотека Конгресса|Библиотеке Конгресса]]{{sfn|O'Connor|2008|с=64}}{{sfn|Odgen|2017}}<ref name=Forbes>{{cite web
+
С запуском Wayback Machine «Архив Интернета» стал одним из самых популярных и узнаваемых онлайн-порталов и главным сервисом [[Архивирование веб-сайтов|веб-архивирования]]<ref name=Bryant/>{{sfn|Price|2011}}. В 1999 году Архив начал расширять коллекцию за пределы архивного веб-контента, чтобы обеспечить статус как к оцифрованным так и изначально цифровым ресурсам, в том числе книгам, аудио, фильмам, изображениям, документам, программному обеспечению и видеоиграм{{sfn|Odgen|2017}}. Некоторые сканирования выполняются поисковыми роботами самого архива, а другие — партнёрскими организациями. Отдельные базы данных могут приобретаться за счёт пожертвований пользователей и целевых приобретений<ref name=Forbes/>. Сами создатели организации сравнивали свою коллекцию с [[Александрийская библиотека|Александрийской библиотекой]]{{sfn|Odgen|2017}}. На 2021 год Wayback Machine содержал более 424 млрд веб-страниц{{sfn|Bowyer|2021|с=43—57}} — больше, чем документов в [[Библиотека Конгресса|Библиотеке Конгресса]]{{sfn|O'Connor|2008|с=64}}{{sfn|Odgen|2017}}<ref name=Forbes>{{cite web
 
|url=https://www.forbes.com/sites/kalevleetaru/2016/01/18/the-internet-archive-turns-20-a-behind-the-scenes-look-at-archiving-the-web/?sh=533ba6e282e0
 
|url=https://www.forbes.com/sites/kalevleetaru/2016/01/18/the-internet-archive-turns-20-a-behind-the-scenes-look-at-archiving-the-web/?sh=533ba6e282e0
 
|title=The Internet Archive Turns 20: A Behind The Scenes Look At Archiving The Web
 
|title=The Internet Archive Turns 20: A Behind The Scenes Look At Archiving The Web
Строка 127: Строка 127:  
|label8=2021
 
|label8=2021
 
|data8=581}}
 
|data8=581}}
Изначально коллекция архива пополнялась за счёт браузерного [[плагин]]а от Alexa Internet, который автоматически фиксировал и сохранял каждую веб-страницу по мере её посещения, затем передавая всю собранную информацию в Архив Интернета. Пользователи также могли установить бесплатную панель инструментов, позволявшую проверять статус архивирования выбранного веб-сайта<ref name=Forbes/>.  
+
Изначально коллекция архива пополнялась за счёт браузерного [[плагин]]а от Alexa Internet, который автоматически фиксировал и сохранял каждую веб-страницу по мере её посещения, затем передавая всю собранную информацию в «Архив Интернета». Пользователи также могли установить бесплатную панель инструментов, позволявшую проверять статус архивирования выбранного веб-сайта<ref name=Forbes/>.  
   −
В 2002 году Архив запустил собственный [[поисковой робот]] — {{iw|Heritrix|||}} с открытым исходным кодом.  Коды краулеров записаны с помощью комбинации [[Си (язык программирования)|программных языков Cи]] и [[Perl]]. Помимо этого, Архив Интернета также принимает данные сканирования от других доноров{{sfn|Odgen|2017}}. Отсканированные копии веб-сайтов автоматически конвертируются в файлы размером около 100 МБ, которые затем сохраняются на серверах. Общая скорость пополнения архива составляет около 10 [[терабайт]] в месяц<ref name=Kahle>{{cite web
+
В 2002 году Архив запустил собственный [[поисковой робот]] — {{iw|Heritrix|||}} с открытым исходным кодом.  Коды краулеров записаны с помощью комбинации [[Си (язык программирования)|программных языков Cи]] и [[Perl]]. Помимо этого, «Архив Интернета» также принимает данные сканирования от других доноров{{sfn|Odgen|2017}}. Отсканированные копии веб-сайтов автоматически конвертируются в файлы размером около 100 МБ, которые затем сохраняются на серверах. Общая скорость пополнения архива составляет около 10 [[терабайт]] в месяц<ref name=Kahle>{{cite web
 
|url=https://www.xml.com/pub/a/ws/2002/01/18/brewster.html
 
|url=https://www.xml.com/pub/a/ws/2002/01/18/brewster.html
 
|title=How the Wayback Machine Works
 
|title=How the Wayback Machine Works
Строка 222: Строка 222:  
</ref>.
 
</ref>.
   −
Активисты и исследователи используют портал для борьбы с [[Дезинформация|дезинформацией]], особенно усилившейся после избрания президента [[Президентские выборы в США (2016)|Дональда Трампа в США]]. В ответ на участившиеся противоречивые заявления со стороны [[Исполнительный офис президента США|администрации президента]], Архив Интернета создал отдельную коллекцию под названием «Архив Трампа», содержащую выступления президента на телевидении и [[твиттер|твиты]]. Архив надеется, что его хранилище поможет другим выявлять ложную информацию и проверять подозрительный контент<ref>{{cite web
+
Активисты и исследователи используют портал для борьбы с [[Дезинформация|дезинформацией]], особенно усилившейся после избрания президента [[Президентские выборы в США (2016)|Дональда Трампа в США]]. В ответ на участившиеся противоречивые заявления со стороны [[Исполнительный офис президента США|администрации президента]], Архив создал отдельную коллекцию под названием «Архив Трампа», содержащую выступления президента на телевидении и [[твиттер|твиты]]. Архив надеется, что его хранилище поможет другим выявлять ложную информацию и проверять подозрительный контент<ref>{{cite web
 
|url=https://www.ft.com/content/5be1f2ee-d60b-11e9-a0bd-ab8ec6435630
 
|url=https://www.ft.com/content/5be1f2ee-d60b-11e9-a0bd-ab8ec6435630
 
|title=How the Internet Archive is waging war on misinformation
 
|title=How the Internet Archive is waging war on misinformation
Строка 236: Строка 236:  
|publisher=The World
 
|publisher=The World
 
|accessdate=2021-06-07}}
 
|accessdate=2021-06-07}}
</ref>. Однако в некоторых случаях отдельные активисты утверждали, что заархивированные Wayback Machine ресурсы наоборот способствовали распространению дезинформации. Так, с началом [[Пандемия COVID-19|пандемии коронавируса]], сторонники [[Конспирологические теории о пандемии COVID-19|конспиративных теорий]] использовали сохранённые порталом скриншоты для распространения ложной информации о [[COVID-19|коронавирусе]]{{sfn|Acker|2020}}. В качестве [[контрмеры|контрмер]] в ноябре 2020 года Архив Интернета внедрил в Wayback Machine инструменты проверки информации на достоверность. Для этого некоммерческая организация начала сотрудничать с различными компаниями, занимающимися проверкой фактов, чтобы предоставлять пользователям причины удаления той или иной страницы из коллекции. При открытии заархивированной версии сайта Wayback Machine предоставляет пользователям сведения о причине её удаления в виде жёлтого баннера вверху экрана. При подозрении на причастность веб-страницы к кампании по дезинформации Wayback Machine предоставляет данные об организации, проводившей проверку на достоверность, и ссылку на её отчёт<ref>{{cite web
+
</ref>. Однако в некоторых случаях отдельные активисты утверждали, что заархивированные Wayback Machine ресурсы наоборот способствовали распространению дезинформации. Так, с началом [[Пандемия COVID-19|пандемии коронавируса]], сторонники [[Конспирологические теории о пандемии COVID-19|конспиративных теорий]] использовали сохранённые порталом скриншоты для распространения ложной информации о [[COVID-19|коронавирусе]]{{sfn|Acker|2020}}. В качестве [[контрмеры|контрмер]] в ноябре 2020 года Архив внедрил в Wayback Machine инструменты проверки информации на достоверность. Для этого некоммерческая организация начала сотрудничать с различными компаниями, занимающимися проверкой фактов, чтобы предоставлять пользователям причины удаления той или иной страницы из коллекции. При открытии заархивированной версии сайта Wayback Machine предоставляет пользователям сведения о причине её удаления в виде жёлтого баннера вверху экрана. При подозрении на причастность веб-страницы к кампании по дезинформации Wayback Machine предоставляет данные об организации, проводившей проверку на достоверность, и ссылку на её отчёт<ref>{{cite web
 
|url=https://trashbox.ru/link/2020-11-02-wayback-machine-fact-checking?utm_source=yxnews&utm_medium=desktop&utm_referrer=https%3A%2F%2Fyandex.ru%2Fnews%2Fsearch%3Ftext%3D
 
|url=https://trashbox.ru/link/2020-11-02-wayback-machine-fact-checking?utm_source=yxnews&utm_medium=desktop&utm_referrer=https%3A%2F%2Fyandex.ru%2Fnews%2Fsearch%3Ftext%3D
 
|title=Wayback Machine теперь проверяет информацию на достоверность для архивных веб-страниц
 
|title=Wayback Machine теперь проверяет информацию на достоверность для архивных веб-страниц
Строка 273: Строка 273:     
== Правовой статус ==
 
== Правовой статус ==
Архив Интернета не запрашивает разрешения на копирование веб-сайтов перед удалённым сбором данных, однако удаляет или ограничивает доступ к архивным материалам по запросу. Например, владельцам веб-сайтов предоставляется возможность «отказаться» от архивирования через стандартный файл [[robots.txt]], который исключает веб-сайты из списка порталов для веб-краулеров{{sfn|Price|2011}}<ref>{{cite web
+
«Архив Интернета» не запрашивает разрешения на копирование веб-сайтов перед удалённым сбором данных, однако удаляет или ограничивает доступ к архивным материалам по запросу. Например, владельцам веб-сайтов предоставляется возможность «отказаться» от архивирования через стандартный файл [[robots.txt]], который исключает веб-сайты из списка порталов для веб-краулеров{{sfn|Price|2011}}<ref>{{cite web
 
|url=https://www.lutzker.com/internet-archives-open-library-and-copyright-law/
 
|url=https://www.lutzker.com/internet-archives-open-library-and-copyright-law/
 
|title=Internet Archive’s Open Library and Copyright Law
 
|title=Internet Archive’s Open Library and Copyright Law
Строка 280: Строка 280:  
|publisher=Lutzker
 
|publisher=Lutzker
 
|accessdate=2021-06-04}}
 
|accessdate=2021-06-04}}
</ref>. Однако из-за сохранения других данных Архив Интернета находится в уязвимом юридическом положении<ref>{{cite web
+
</ref>. Однако из-за сохранения других данных «Архив Интернета» находится в уязвимом юридическом положении<ref>{{cite web
 
|url=https://arstechnica.com/tech-policy/2011/01/copy-some-web-pages-owe-more-than-the-national-debt/
 
|url=https://arstechnica.com/tech-policy/2011/01/copy-some-web-pages-owe-more-than-the-national-debt/
 
|title=Copy some webpages, owe more than the national debt
 
|title=Copy some webpages, owe more than the national debt
Строка 287: Строка 287:  
|publisher=Ars Technica
 
|publisher=Ars Technica
 
|accessdate=2021-06-05}}
 
|accessdate=2021-06-05}}
</ref>. Так, в 2005 году Wayback Machine оказался втянутым в спор о товарных знаках между компаниями Healthcare Advocates и Health Advocate. Последняя использовала Wayback Machine для доступа к веб-страницам Healthcare Advocates, датируемым 1999 годом, в попытке найти информацию, которая поддержала бы дело. В ответ Healthcare Advocates подала в суд как на Health Advocatt, так и на Архив Интернета, утверждая что архив нарушил [[Digital Millennium Copyright Act|Закон об авторском праве в цифровую эпоху]]. Впоследствии дело было урегулировано в досудебном порядке<ref>{{cite web
+
</ref>. Так, в 2005 году Wayback Machine оказался втянутым в спор о товарных знаках между компаниями Healthcare Advocates и Health Advocate. Последняя использовала Wayback Machine для доступа к веб-страницам Healthcare Advocates, датируемым 1999 годом, в попытке найти информацию, которая поддержала бы дело. В ответ Healthcare Advocates подала в суд как на Health Advocatt, так и на Архив, утверждая что архив нарушил [[Digital Millennium Copyright Act|Закон об авторском праве в цифровую эпоху]]. Впоследствии дело было урегулировано в досудебном порядке<ref>{{cite web
 
|url=https://arstechnica.com/uncategorized/2006/08/7634/
 
|url=https://arstechnica.com/uncategorized/2006/08/7634/
 
|title=Internet Archive settles suit over Wayback Machine
 
|title=Internet Archive settles suit over Wayback Machine
Строка 296: Строка 296:  
</ref>.
 
</ref>.
   −
В 2002 году Архив Интернета удалил из своей системы ссылки на архивные копии портала Xenu.net, принадлежащего  критику церкви Андреасу Хельдал-Лунду. Удаление произошло по требованию юристов [[Церковь Саентологии|Церкви Саентологии]], заявивших, что владеют правом собственности на выдержки из документов Церкви, опубликованные на сайте<ref>{{cite web
+
В 2002 году Архив удалил из своей системы ссылки на архивные копии портала Xenu.net, принадлежащего  критику церкви Андреасу Хельдал-Лунду. Удаление произошло по требованию юристов [[Церковь Саентологии|Церкви Саентологии]], заявивших, что владеют правом собственности на выдержки из документов Церкви, опубликованные на сайте<ref>{{cite web
 
|url=https://web.archive.org/web/20120515210932/http://news.cnet.com/2100-1023-959236.html
 
|url=https://web.archive.org/web/20120515210932/http://news.cnet.com/2100-1023-959236.html
 
|title=Net archive silences Scientology critic
 
|title=Net archive silences Scientology critic
Анонимный участник

Реклама:

Навигация