Изменения
Перейти к навигации
Перейти к поиску
Строка 36:
Строка 36:
− +
Строка 118:
Строка 118:
− +
Строка 158:
Строка 158:
− +
Строка 293:
Строка 293:
− +
Строка 315:
Строка 315:
− +
Строка 394:
Строка 394:
− +
Строка 440:
Строка 440:
− +
Строка 481:
Строка 481:
− +
− +
Строка 576:
Строка 576:
+
Строка 584:
Строка 585:
+
Строка 593:
Строка 595:
+
Строка 601:
Строка 604:
+
Строка 609:
Строка 613:
+
Строка 618:
Строка 623:
− +
+
Строка 628:
Строка 634:
+
Строка 636:
Строка 643:
+
Строка 643:
Строка 651:
+
Строка 653:
Строка 662:
+
Строка 659:
Строка 669:
+
Строка 667:
Строка 678:
+
Строка 674:
Строка 686:
+
Строка 681:
Строка 694:
+
Строка 688:
Строка 702:
+
Строка 696:
Строка 711:
+
Строка 706:
Строка 722:
+
оформление
[[Файл:Brewster Kahle 2009.jpg|thumb|250px|right|[[Кейл, Брюстер|Брюстер Кейл]] в 2009 году]]
[[Файл:Brewster Kahle 2009.jpg|thumb|250px|right|[[Кейл, Брюстер|Брюстер Кейл]] в 2009 году]]
В 1989 году английский учёный [[Бернерс-Ли, Тим|Тим Бернерс-Ли]] создал [[всемирная паутина|всемирную паутину]] — систему, позволяющую передавать данные через подключённые к интернету компьютеры. Однако с распространением всемирной паутины были выявлены две основные проблемы. Первая состояла в нехватке мест для хранения всех данных, из-за чего многие документы и веб-страницы удалялись. Другая проблема заключалась в том, что после редактирования веб-страницы (например, по юридическим причинам), пользователи не могли посмотреть её изначальную версию. Решить эти недостатки стремилась американская цифровая библиотека «[[Архив Интернета]]» — некоммерческая организация, созданная программистами [[Кейл, Брюстер|Брюстером Кейлом]] и {{iw|Галлиат, Брюс|Брюсом Галлиатом|en|Bruce Gilliat}} в 1996 году. При сотрудничестве с [[Alexa Internet]] ([[Дочернее общество|дочерней компанией]] [[Amazon]], занимающейся веб-индексированием) Архив инициировал создание и хранение копий существующих сайтов для развития «универсального доступа к знанию». Организация предоставляла [[открытый доступ|бесплатный публичный доступ]] к оцифрованным материалам, таким как веб-страницы, книги, аудиозаписи, включая живые концерты, видео, изображения и программное обеспечение. На 2021 год штаб-квартира Архива Интернета находится в [[Сан-Франциско]], в здании бывшей христианской церкви, расположенной в районе [[Ричмонд (район Сан-Франциско)|Ричмонд]]. Журналист местной радиостанции {{iw|Kawl|||}} в 2019 году сравнивал офис Архива с римским храмом<ref>{{cite web
В 1989 году английский учёный [[Бернерс-Ли, Тим|Тим Бернерс-Ли]] создал [[всемирная паутина|всемирную паутину]] — систему, позволяющую передавать данные через подключённые к интернету компьютеры. Однако с распространением всемирной паутины были выявлены две основные проблемы. Первая состояла в нехватке мест для хранения всех данных, из-за чего многие документы и веб-страницы удалялись. Другая проблема заключалась в том, что после редактирования веб-страницы (например, по юридическим причинам), пользователи не могли посмотреть её изначальную версию. Решить эти недостатки стремилась американская цифровая библиотека «[[Архив Интернета]]» — некоммерческая организация, созданная программистами [[Кейл, Брюстер|Брюстером Кейлом]] и {{iw|Галлиат, Брюс|Брюсом Галлиатом|en|Bruce Gilliat}} в 1996 году. При сотрудничестве с [[Alexa Internet]] ([[Дочернее общество|дочерней компанией]] [[Amazon]], занимающейся веб-индексированием) «Архив» инициировал создание и хранение копий существующих сайтов для развития «универсального доступа к знанию». Организация предоставляла [[открытый доступ|бесплатный публичный доступ]] к оцифрованным материалам, таким как веб-страницы, книги, аудиозаписи, включая живые концерты, видео, изображения и программное обеспечение. На 2021 год штаб-квартира Архива Интернета находится в [[Сан-Франциско]], в здании бывшей христианской церкви, расположенной в районе [[Ричмонд (район Сан-Франциско)|Ричмонд]]. Журналист местной радиостанции {{iw|Kawl|||}} в 2019 году сравнивал офис Архива с римским храмом<ref>{{cite web
|url=https://theconversation.com/dominic-cummings-how-the-internet-knows-when-youve-updated-your-blog-139517
|url=https://theconversation.com/dominic-cummings-how-the-internet-knows-when-youve-updated-your-blog-139517
|title=Dominic Cummings: how the internet knows when you’ve updated your blog
|title=Dominic Cummings: how the internet knows when you’ve updated your blog
== Характеристика ==
== Характеристика ==
С запуском Wayback Machine «Архив Интернета» стал одним из самых популярных и узнаваемых онлайн-порталов и главным сервисом [[Архивирование веб-сайтов|веб-архивирования]]<ref name=Bryant/>{{sfn|Price|2011}}. В 1999 году Архив начал расширять коллекцию за пределы архивного веб-контента, чтобы обеспечить статус как к оцифрованным, так и изначально цифровым ресурсам, в том числе книгам, аудио, фильмам, изображениям, документам, программному обеспечению и видеоиграм{{sfn|Odgen|2017}}. Некоторые сканирования выполняются поисковыми роботами самого архива, а другие — партнёрскими организациями. Отдельные базы данных могут приобретаться за счёт пожертвований пользователей и целевых приобретений<ref name=Forbes/>. Сами создатели организации сравнивали свою коллекцию с [[Александрийская библиотека|Александрийской библиотекой]]{{sfn|Odgen|2017}}. На 2021 год Wayback Machine содержал более 424 млрд веб-страниц{{sfn|Bowyer|2021|с=43—57}} — больше, чем документов в [[Библиотека Конгресса|Библиотеке Конгресса]]{{sfn|O'Connor|2008|с=64}}{{sfn|Odgen|2017}}<ref name=Forbes />.
С запуском Wayback Machine «Архив Интернета» стал одним из самых популярных и узнаваемых онлайн-порталов и главным сервисом [[Архивирование веб-сайтов|веб-архивирования]]<ref name=Bryant/>{{sfn|Price|2011}}. В 1999 году «Архив» начал расширять коллекцию за пределы архивного веб-контента, чтобы обеспечить статус как к оцифрованным, так и изначально цифровым ресурсам, в том числе книгам, аудио, фильмам, изображениям, документам, программному обеспечению и видеоиграм{{sfn|Odgen|2017}}. Некоторые сканирования выполняются поисковыми роботами самого архива, а другие — партнёрскими организациями. Отдельные базы данных могут приобретаться за счёт пожертвований пользователей и целевых приобретений<ref name=Forbes/>. Сами создатели организации сравнивали свою коллекцию с [[Александрийская библиотека|Александрийской библиотекой]]{{sfn|Odgen|2017}}. На 2021 год Wayback Machine содержал более 424 млрд веб-страниц{{sfn|Bowyer|2021|с=43—57}} — больше, чем документов в [[Библиотека Конгресса|Библиотеке Конгресса]]{{sfn|O'Connor|2008|с=64}}{{sfn|Odgen|2017}}<ref name=Forbes />.
== Принцип работы ==
== Принцип работы ==
Изначально коллекция архива пополнялась за счёт браузерного [[плагин]]а от Alexa Internet, который автоматически фиксировал и сохранял каждую веб-страницу по мере её посещения, затем передавая всю собранную информацию в «Архив Интернета». Пользователи также могли установить бесплатную панель инструментов, позволявшую проверять статус архивирования выбранного веб-сайта<ref name=Forbes/>.
Изначально коллекция архива пополнялась за счёт браузерного [[плагин]]а от Alexa Internet, который автоматически фиксировал и сохранял каждую веб-страницу по мере её посещения, затем передавая всю собранную информацию в «Архив Интернета». Пользователи также могли установить бесплатную панель инструментов, позволявшую проверять статус архивирования выбранного веб-сайта<ref name=Forbes/>.
В 2002 году Архив запустил собственного поискового робота с [[Открытое программное обеспечение|открытым исходным кодом]] — {{iw|Heritrix|||}}. Коды краулеров записаны с помощью комбинации [[Си (язык программирования)|программных языков Cи]] и [[Perl]]. Помимо этого, «Архив Интернета» также принимает данные сканирования от других доноров{{sfn|Odgen|2017}}. Отсканированные копии веб-сайтов автоматически конвертируются в файлы размером около 100 МБ, которые затем сохраняются на серверах. Общая скорость пополнения архива составляет около 10 [[терабайт]] в месяц<ref name=Kahle>{{cite web
В 2002 году «Архив» запустил собственного поискового робота с [[Открытое программное обеспечение|открытым исходным кодом]] — {{iw|Heritrix|||}}. Коды краулеров записаны с помощью комбинации [[Си (язык программирования)|программных языков Cи]] и [[Perl]]. Помимо этого, «Архив Интернета» также принимает данные сканирования от других доноров{{sfn|Odgen|2017}}. Отсканированные копии веб-сайтов автоматически конвертируются в файлы размером около 100 МБ, которые затем сохраняются на серверах. Общая скорость пополнения архива составляет около 10 [[терабайт]] в месяц<ref name=Kahle>{{cite web
|url=https://www.xml.com/pub/a/ws/2002/01/18/brewster.html
|url=https://www.xml.com/pub/a/ws/2002/01/18/brewster.html
|title=How the Wayback Machine Works
|title=How the Wayback Machine Works
}}</ref>.
}}</ref>.
Активисты и исследователи используют портал для борьбы с [[Дезинформация|дезинформацией]], особенно усилившейся после избрания президента [[Президентские выборы в США (2016)|Дональда Трампа в США]]. В ответ на участившиеся противоречивые заявления со стороны [[Исполнительный офис президента США|администрации президента]] Архив создал отдельную коллекцию под названием «Архив Трампа», содержащую выступления президента на телевидении и [[твиттер|твиты]]. Архив надеется, что его хранилище поможет другим выявлять ложную информацию и проверять подозрительный контент<ref>{{cite web
Активисты и исследователи используют портал для борьбы с [[Дезинформация|дезинформацией]], особенно усилившейся после избрания президента [[Президентские выборы в США (2016)|Дональда Трампа в США]]. В ответ на участившиеся противоречивые заявления со стороны [[Исполнительный офис президента США|администрации президента]] «Архив» создал отдельную коллекцию под названием «Архив Трампа», содержащую выступления президента на телевидении и [[твиттер|твиты]]. «Архив» надеется, что его хранилище поможет другим выявлять ложную информацию и проверять подозрительный контент<ref>{{cite web
|url=https://www.ft.com/content/5be1f2ee-d60b-11e9-a0bd-ab8ec6435630
|url=https://www.ft.com/content/5be1f2ee-d60b-11e9-a0bd-ab8ec6435630
|title=How the Internet Archive is waging war on misinformation
|title=How the Internet Archive is waging war on misinformation
|archive-url=https://web.archive.org/web/20170328092846/https://www.pri.org/stories/2017-02-23/where-find-whats-disappeared-online-and-whole-lot-more-internet-archive
|archive-url=https://web.archive.org/web/20170328092846/https://www.pri.org/stories/2017-02-23/where-find-whats-disappeared-online-and-whole-lot-more-internet-archive
|deadlink=no
|deadlink=no
}}</ref>. Однако в некоторых случаях отдельные активисты утверждали, что заархивированные Wayback Machine ресурсы наоборот способствовали распространению дезинформации. Так, с началом [[Пандемия COVID-19|пандемии коронавируса]] сторонники [[Конспирологические теории о пандемии COVID-19|конспиративных теорий]] использовали сохранённые порталом скриншоты для распространения ложной информации о [[COVID-19|коронавирусе]]{{sfn|Acker|2020}}. В качестве [[контрмеры|контрмер]] в ноябре 2020 года Архив внедрил в Wayback Machine инструменты проверки информации на достоверность. Для этого некоммерческая организация начала сотрудничать с различными компаниями, занимающимися проверкой фактов, чтобы предоставлять пользователям причины удаления той или иной страницы из коллекции. При открытии заархивированной версии сайта Wayback Machine предоставляет пользователям сведения о причине её удаления в виде жёлтого баннера вверху экрана. При подозрении на причастность веб-страницы к кампании по дезинформации Wayback Machine предоставляет данные об организации, проводившей проверку на достоверность, и ссылку на её отчёт<ref>{{cite web
}}</ref>. Однако в некоторых случаях отдельные активисты утверждали, что заархивированные Wayback Machine ресурсы наоборот способствовали распространению дезинформации. Так, с началом [[Пандемия COVID-19|пандемии коронавируса]] сторонники [[Конспирологические теории о пандемии COVID-19|конспиративных теорий]] использовали сохранённые порталом скриншоты для распространения ложной информации о [[COVID-19|коронавирусе]]{{sfn|Acker|2020}}. В качестве [[контрмеры|контрмер]] в ноябре 2020 года «Архив» внедрил в Wayback Machine инструменты проверки информации на достоверность. Для этого некоммерческая организация начала сотрудничать с различными компаниями, занимающимися проверкой фактов, чтобы предоставлять пользователям причины удаления той или иной страницы из коллекции. При открытии заархивированной версии сайта Wayback Machine предоставляет пользователям сведения о причине её удаления в виде жёлтого баннера вверху экрана. При подозрении на причастность веб-страницы к кампании по дезинформации Wayback Machine предоставляет данные об организации, проводившей проверку на достоверность, и ссылку на её отчёт<ref>{{cite web
|url=https://trashbox.ru/link/2020-11-02-wayback-machine-fact-checking
|url=https://trashbox.ru/link/2020-11-02-wayback-machine-fact-checking
|title=Wayback Machine теперь проверяет информацию на достоверность для архивных веб-страниц
|title=Wayback Machine теперь проверяет информацию на достоверность для архивных веб-страниц
|archive-url=https://web.archive.org/web/20210624203555/https://arstechnica.com/tech-policy/2011/01/copy-some-web-pages-owe-more-than-the-national-debt/
|archive-url=https://web.archive.org/web/20210624203555/https://arstechnica.com/tech-policy/2011/01/copy-some-web-pages-owe-more-than-the-national-debt/
|deadlink=no
|deadlink=no
}}</ref>. Так, в 2005 году Wayback Machine оказался втянутым в спор о товарных знаках между компаниями Healthcare Advocates и Health Advocate. Последняя использовала Wayback Machine для доступа к веб-страницам Healthcare Advocates, датируемым 1999 годом, в попытке найти информацию, которая поддержала бы дело. В ответ Healthcare Advocates подала в суд как на Health Advocatt, так и на Архив, утверждая что архив нарушил [[Digital Millennium Copyright Act|Закон об авторском праве в цифровую эпоху]]. Впоследствии дело было урегулировано в досудебном порядке<ref>{{cite web
}}</ref>. Так, в 2005 году Wayback Machine оказался втянутым в спор о товарных знаках между компаниями Healthcare Advocates и Health Advocate. Последняя использовала Wayback Machine для доступа к веб-страницам Healthcare Advocates, датируемым 1999 годом, в попытке найти информацию, которая поддержала бы дело. В ответ Healthcare Advocates подала в суд как на Health Advocatt, так и на «Архив», утверждая что архив нарушил [[Digital Millennium Copyright Act|Закон об авторском праве в цифровую эпоху]]. Впоследствии дело было урегулировано в досудебном порядке<ref>{{cite web
|url=https://arstechnica.com/uncategorized/2006/08/7634/
|url=https://arstechnica.com/uncategorized/2006/08/7634/
|title=Internet Archive settles suit over Wayback Machine
|title=Internet Archive settles suit over Wayback Machine
== Блокировки ==
== Блокировки ==
В 2015 году [[Роскомнадзор]] принял решение заблокировать Wayback Machine за копию страницы текста «Одиночный джихад в России», содержащего информацию о «теории и практике партизанского сопротивления». Соответствующая страница в Архиве Интернета была добавлена в официальный реестр запрещенных веб-сайтов в России 23 июня 2015 года, из-за чего некоторые российские интернет-провайдеры были вынуждены полностью заблокировать сайт Архива Интернета<ref>{{cite web
В 2015 году [[Роскомнадзор]] принял решение заблокировать Wayback Machine за копию страницы текста «Одиночный джихад в России», содержащего информацию о «теории и практике партизанского сопротивления». Соответствующая страница в «Архиве Интернета» была добавлена в официальный реестр запрещенных веб-сайтов в России 23 июня 2015 года, из-за чего некоторые российские интернет-провайдеры были вынуждены полностью заблокировать сайт Архива Интернета<ref>{{cite web
|url=https://www.techdirt.com/articles/20150626/11213631474/russia-blocks-internet-archives-wayback-machine-over-single-page.shtml
|url=https://www.techdirt.com/articles/20150626/11213631474/russia-blocks-internet-archives-wayback-machine-over-single-page.shtml
|title=Russia Blocks The Internet Archive's Wayback Machine Over A Single Page
|title=Russia Blocks The Internet Archive's Wayback Machine Over A Single Page
</ref>.
</ref>.
В 2019 году представители Ассоциации по защите авторских прав в интернете (АЗАПИ) подали серию исков против сервиса Wayback Machine за нарушение авторских прав. Представители АЗАПИ запросили [[Московский городской суд|Мосгорсуд]] вынести решение о вечной блокировке портала на территории России, однако на август 2020 года Архив Интернета по-прежнему продолжал свою работу<ref>{{cite web
В 2019 году представители Ассоциации по защите авторских прав в интернете (АЗАПИ) подали серию исков против сервиса Wayback Machine за нарушение авторских прав. Представители АЗАПИ запросили [[Московский городской суд|Мосгорсуд]] вынести решение о вечной блокировке портала на территории России, однако на август 2020 года «Архив Интернета» по-прежнему продолжал свою работу<ref>{{cite web
|url=https://roskomsvoboda.org/49067/
|url=https://roskomsvoboda.org/49067/
|title=АЗАПИ хочет навечно заблокировать «Архив интернета»
|title=АЗАПИ хочет навечно заблокировать «Архив Интернета»
|publisher=Роскомсвобода
|publisher=Роскомсвобода
|date=2019-08-22
|date=2019-08-22
|doi=10.37016/mr-2020-41
|doi=10.37016/mr-2020-41
|год=2020
|год=2020
|язык=en
|ref=Acker
|ref=Acker
|ссылка=https://misinforeview.hks.harvard.edu/article/the-weaponization-of-web-archives-data-craft-and-covid-19-publics/}}
|ссылка=https://misinforeview.hks.harvard.edu/article/the-weaponization-of-web-archives-data-craft-and-covid-19-publics/}}
|год=2018
|год=2018
|doi=10.1080/24701475.2018.1455412
|doi=10.1080/24701475.2018.1455412
|язык=en
|ref=Ben-David}}
|ref=Ben-David}}
* {{статья
* {{статья
|выпуск=8
|выпуск=8
|страницы=1904—1915
|страницы=1904—1915
|язык=en
|ref=Arora}}
|ref=Arora}}
* {{статья
* {{статья
|том=21
|том=21
|страницы=43—57
|страницы=43—57
|язык=en
|ref=Bowyer}}
|ref=Bowyer}}
* {{статья
* {{статья
|выпуск=181
|выпуск=181
|год=2009
|год=2009
|язык=en
|ссылка=https://ir.lawnet.fordham.edu/flr/vol78/iss1/5
|ссылка=https://ir.lawnet.fordham.edu/flr/vol78/iss1/5
|ref=Eltgroth}}
|ref=Eltgroth}}
|том=26
|том=26
|выпуск=2
|выпуск=2
|ссылка=https://www.infotoday.com/online/mar02/OnTheNet.htm
|ссылка=https://www.infotoday.com/online/mar02/OnTheNet.htm
|язык=en
|ref=Notess}}
|ref=Notess}}
* {{статья
* {{статья
|выпуск=4
|выпуск=4
|страницы=377—398
|страницы=377—398
|язык=en
|ref=Hartelius}}
|ref=Hartelius}}
* {{статья
* {{статья
|выпуск=3
|выпуск=3
|год=2014
|год=2014
|язык=en
|ref=Crudo}}
|ref=Crudo}}
* {{статья
* {{статья
|год=2017
|год=2017
|doi=10.1145/3133956.3134042
|doi=10.1145/3133956.3134042
|язык=en
|ref=Lerner
|ref=Lerner
|ссылка=https://acmccs.github.io/papers/p1741-lernerAT3.pdf}}
|ссылка=https://acmccs.github.io/papers/p1741-lernerAT3.pdf}}
|выпуск=10
|выпуск=10
|страницы=1223—1233
|страницы=1223—1233
|язык=en
|ref=Maemura}}
|ref=Maemura}}
* {{статья
* {{статья
|издание=International Journal of Humanities and Arts Computing
|издание=International Journal of Humanities and Arts Computing
|год=2016
|год=2016
|язык=en
|ref=Milligan}}
|ref=Milligan}}
* {{статья
* {{статья
|год=2008
|год=2008
|страницы=60—75
|страницы=60—75
|язык=en
|ref=O'Connor}}
|ref=O'Connor}}
* {{статья
* {{статья
|год=2017
|год=2017
|страницы=299—308
|страницы=299—308
|язык=en
|ref=Odgen}}
|ref=Odgen}}
* {{статья
* {{статья
|год=2009
|год=2009
|страницы=875
|страницы=875
|язык=en
|ref=Pearce}}
|ref=Pearce}}
* {{статья
* {{статья
|ссылка=https://mla.hcommons.org/deposits/item/hc:16755/
|ссылка=https://mla.hcommons.org/deposits/item/hc:16755/
|год=2011
|год=2011
|язык=en
|ref=Price}}
|ref=Price}}
* {{статья
* {{статья
|выпуск=2
|выпуск=2
|год=2011
|год=2011
|язык=en
|ref=Weisbard}}
|ref=Weisbard}}
* {{статья
* {{статья
|выпуск=1—2
|выпуск=1—2
|doi=10.1080/24701475.2017.1307542
|doi=10.1080/24701475.2017.1307542
|язык=en
|ref=Rogers}}
|ref=Rogers}}
{{refend}}
{{refend}}