Wayback Machine: различия между версиями
w>Folcvine |
w>Folcvine (Спасено источников — 40, отмечено мёртвыми — 0. Сообщить об ошибке. См. FAQ.) #IABot (v2.0.8.2) |
||
Строка 17: | Строка 17: | ||
|date=2021-04-22 | |date=2021-04-22 | ||
|publisher=Groovy Post | |publisher=Groovy Post | ||
− | |accessdate=2021-05-29}} | + | |accessdate=2021-05-29 |
− | </ref>. На июль 2021 года Wayback Machine предоставлял доступ к более чем 591 млрд сохранённым веб-страницам<ref name=web>{{cite web | + | |archive-date=2021-05-18 |
+ | |archive-url=https://web.archive.org/web/20210518200214/https://www.groovypost.com/explaier/what-is-the-wayback-machine-and-why-is-it-useful/ | ||
+ | |deadlink=no | ||
+ | }}</ref>. На июль 2021 года Wayback Machine предоставлял доступ к более чем 591 млрд сохранённым веб-страницам<ref name=web>{{cite web | ||
|url=https://archive.org/web/ | |url=https://archive.org/web/ | ||
|title=Wayback Machine | |title=Wayback Machine | ||
Строка 34: | Строка 37: | ||
|date=2020-05-28 | |date=2020-05-28 | ||
|publisher=The Conversation | |publisher=The Conversation | ||
− | |accessdate=2021-06-03}} | + | |accessdate=2021-06-03 |
− | </ref>{{sfn|Odgen|2017}}<ref>{{cite web | + | |archive-date=2021-07-25 |
+ | |archive-url=https://web.archive.org/web/20210725222234/https://theconversation.com/dominic-cummings-how-the-internet-knows-when-youve-updated-your-blog-139517 | ||
+ | |deadlink=no | ||
+ | }}</ref>{{sfn|Odgen|2017}}<ref>{{cite web | ||
|url=https://www.kalw.org/show/crosscurrents/2019-09-11/in-an-old-church-the-internet-archive-stores-our-digital-history | |url=https://www.kalw.org/show/crosscurrents/2019-09-11/in-an-old-church-the-internet-archive-stores-our-digital-history | ||
|title=In An Old Church, The Internet Archive Stores Our Digital History | |title=In An Old Church, The Internet Archive Stores Our Digital History | ||
|date=2019-09-11 | |date=2019-09-11 | ||
|publisher=Kalw. San Francisco local public radio | |publisher=Kalw. San Francisco local public radio | ||
− | |accessdate=2021-06-03}} | + | |accessdate=2021-06-03 |
− | </ref>. Организация ставит перед собой цель спасти интернет от исчезновения{{sfn|Price|2011}}. | + | |archive-date=2021-05-06 |
+ | |archive-url=https://web.archive.org/web/20210506120243/https://www.kalw.org/show/crosscurrents/2019-09-11/in-an-old-church-the-internet-archive-stores-our-digital-history | ||
+ | |deadlink=no | ||
+ | }}</ref>. Организация ставит перед собой цель спасти интернет от исчезновения{{sfn|Price|2011}}. | ||
Wayback Machine стал самым известным проектом Архива. Онлайн-сервис был назван в честь машины времени из мультсериала 1960-х годов «[[Шоу Рокки и Буллвинкля]]». Он предоставляет доступ к цифровой коллекции из примерно 562 млрд веб-страниц<ref name=Bryant/><ref>{{cite web | Wayback Machine стал самым известным проектом Архива. Онлайн-сервис был назван в честь машины времени из мультсериала 1960-х годов «[[Шоу Рокки и Буллвинкля]]». Он предоставляет доступ к цифровой коллекции из примерно 562 млрд веб-страниц<ref name=Bryant/><ref>{{cite web | ||
Строка 49: | Строка 58: | ||
|date=2007-11-19 | |date=2007-11-19 | ||
|publisher=The Guardian | |publisher=The Guardian | ||
− | |accessdate=2021-06-01}} | + | |accessdate=2021-06-01 |
− | </ref><ref name=McKinnon>{{cite web | + | |archive-date=2021-04-19 |
+ | |archive-url=https://web.archive.org/web/20210419133845/https://www.theguardian.com/technology/2007/nov/19/archive.internet | ||
+ | |deadlink=no | ||
+ | }}</ref><ref name=McKinnon>{{cite web | ||
|url=https://wpmudev.com/blog/archiving-with-wayback-machine/ | |url=https://wpmudev.com/blog/archiving-with-wayback-machine/ | ||
|title=Using the Wayback Machine to Archive (and Backup) WordPress | |title=Using the Wayback Machine to Archive (and Backup) WordPress | ||
Строка 56: | Строка 68: | ||
|date=2017-05-25 | |date=2017-05-25 | ||
|publisher=WPMudev | |publisher=WPMudev | ||
− | |accessdate=2021-05-29}} | + | |accessdate=2021-05-29 |
− | </ref>. Проект Wayback Machine был задуман как решение проблемы [[Ошибка 404|ошибки 404]], означающей, что сервер не может найти данные по запрошенному адресу. Это связано с так называемым [[вымирание ссылок|вымиранием ссылок]] — нарастающей недоступностью некогда опубликованных данных. Так, в 1997 году средняя продолжительность жизни веб-страницы составляла 44 дня. В 2003 году этот показатель составил 100 дней. Проведённый в 2008 году анализ ссылок на 2700 цифровых ресурсов, большинство из которых не имеет печатных аналогов, показал, что около 8 процентов ссылок переставали работать через год. К 2011 году, по прошествии трёх лет, 30 процентов ссылок в коллекции были неработающими<ref>{{cite web | + | |archive-date=2021-04-13 |
+ | |archive-url=https://web.archive.org/web/20210413234350/https://wpmudev.com/blog/archiving-with-wayback-machine/ | ||
+ | |deadlink=no | ||
+ | }}</ref>. Проект Wayback Machine был задуман как решение проблемы [[Ошибка 404|ошибки 404]], означающей, что сервер не может найти данные по запрошенному адресу. Это связано с так называемым [[вымирание ссылок|вымиранием ссылок]] — нарастающей недоступностью некогда опубликованных данных. Так, в 1997 году средняя продолжительность жизни веб-страницы составляла 44 дня. В 2003 году этот показатель составил 100 дней. Проведённый в 2008 году анализ ссылок на 2700 цифровых ресурсов, большинство из которых не имеет печатных аналогов, показал, что около 8 процентов ссылок переставали работать через год. К 2011 году, по прошествии трёх лет, 30 процентов ссылок в коллекции были неработающими<ref>{{cite web | ||
|url=https://www.theatlantic.com/technology/archive/2015/10/raiders-of-the-lost-web/409210/ | |url=https://www.theatlantic.com/technology/archive/2015/10/raiders-of-the-lost-web/409210/ | ||
|title=Raiders of the Lost Web | |title=Raiders of the Lost Web | ||
Строка 63: | Строка 78: | ||
|date=2015-10-14 | |date=2015-10-14 | ||
|publisher=The Atlantic | |publisher=The Atlantic | ||
− | |accessdate=2021-06-07}} | + | |accessdate=2021-06-07 |
− | </ref>. Благодаря интеграции с Alexa столкнувшийся с сообщением об ошибке пользователь мог получить доступ к заархивированной версии страницы через внедрённую в браузер панель инструментов. Если копия недоступной страницы присутствовала в базе данных Wayback Machine, то загоралась специальная кнопка. При этом пользователи могли предоставить браузеру разрешение на просмотр и регистрацию активности — в таком случае все посещаемые сайты архивировались на портале{{sfn|Rogers|2017|с=160—172}}. | + | |archive-date=2017-05-07 |
+ | |archive-url=https://web.archive.org/web/20170507173716/https://www.theatlantic.com/technology/archive/2015/10/raiders-of-the-lost-web/409210/ | ||
+ | |deadlink=no | ||
+ | }}</ref>. Благодаря интеграции с Alexa столкнувшийся с сообщением об ошибке пользователь мог получить доступ к заархивированной версии страницы через внедрённую в браузер панель инструментов. Если копия недоступной страницы присутствовала в базе данных Wayback Machine, то загоралась специальная кнопка. При этом пользователи могли предоставить браузеру разрешение на просмотр и регистрацию активности — в таком случае все посещаемые сайты архивировались на портале{{sfn|Rogers|2017|с=160—172}}. | ||
Wayback Machine был запущен в мае 1996 года, однако стал доступным для общественности только в 2001-м — до этого вся записанная на цифровых магнитных лентах информация была открыта только для ограниченного числа учёных и исследователей{{sfn|Hartelius|2020|c=378}}. К моменту «открытия» архив содержал более 10 млрд заархивированных страниц<ref name=Bryant/>. К декабрю 2014 года руководство Wayback Machine сообщило, что сохранило 435 млрд веб-страниц по всему миру{{sfn|Arora|2015}}. С технической точки зрения программное обеспечение Wayback Machine не является архивом, а скорее общедоступным интерфейсом к ограниченному подмножеству всех хранилищ{{sfn|Bowyer|2021|с=43—57}}. Так, Wayback Machine нельзя считать поисковой системой коллекции организации, так как она не осуществляет поиск по базе данных другой крупной виртуальной библиотеки — [[Open Library]], позволяющей пользователям бесплатно получать доступ к цифровым копиям книг, которые загружаются и архивируются в рамках проекта<ref name=Vox>{{cite web | Wayback Machine был запущен в мае 1996 года, однако стал доступным для общественности только в 2001-м — до этого вся записанная на цифровых магнитных лентах информация была открыта только для ограниченного числа учёных и исследователей{{sfn|Hartelius|2020|c=378}}. К моменту «открытия» архив содержал более 10 млрд заархивированных страниц<ref name=Bryant/>. К декабрю 2014 года руководство Wayback Machine сообщило, что сохранило 435 млрд веб-страниц по всему миру{{sfn|Arora|2015}}. С технической точки зрения программное обеспечение Wayback Machine не является архивом, а скорее общедоступным интерфейсом к ограниченному подмножеству всех хранилищ{{sfn|Bowyer|2021|с=43—57}}. Так, Wayback Machine нельзя считать поисковой системой коллекции организации, так как она не осуществляет поиск по базе данных другой крупной виртуальной библиотеки — [[Open Library]], позволяющей пользователям бесплатно получать доступ к цифровым копиям книг, которые загружаются и архивируются в рамках проекта<ref name=Vox>{{cite web | ||
Строка 72: | Строка 90: | ||
|date=2020-01-23 | |date=2020-01-23 | ||
|publisher=Vox | |publisher=Vox | ||
− | |accessdate=2021-05-29}} | + | |accessdate=2021-05-29 |
− | </ref><ref name=Forbes>{{cite web | + | |archive-date=2021-08-18 |
+ | |archive-url=https://web.archive.org/web/20210818211013/https://www.vox.com/2020/6/23/21293875/internet-archive-website-lawsuit-open-library-wayback-machine-controversy-copyright | ||
+ | |deadlink=no | ||
+ | }}</ref><ref name=Forbes>{{cite web | ||
|url=https://www.forbes.com/sites/kalevleetaru/2016/01/18/the-internet-archive-turns-20-a-behind-the-scenes-look-at-archiving-the-web/?sh=533ba6e282e0 | |url=https://www.forbes.com/sites/kalevleetaru/2016/01/18/the-internet-archive-turns-20-a-behind-the-scenes-look-at-archiving-the-web/?sh=533ba6e282e0 | ||
|title=The Internet Archive Turns 20: A Behind The Scenes Look At Archiving The Web | |title=The Internet Archive Turns 20: A Behind The Scenes Look At Archiving The Web | ||
Строка 79: | Строка 100: | ||
|date=2016-01-18 | |date=2016-01-18 | ||
|publisher=Forbes | |publisher=Forbes | ||
− | |accessdate=2021-06-05}} | + | |accessdate=2021-06-05 |
− | </ref>. | + | |archive-date=2021-08-15 |
+ | |archive-url=https://web.archive.org/web/20210815171017/https://www.forbes.com/sites/kalevleetaru/2016/01/18/the-internet-archive-turns-20-a-behind-the-scenes-look-at-archiving-the-web/?sh=533ba6e282e0 | ||
+ | |deadlink=no | ||
+ | }}</ref>. | ||
== Характеристика == | == Характеристика == | ||
Строка 128: | Строка 152: | ||
|date=2002-01-21 | |date=2002-01-21 | ||
|publisher=Xml.com | |publisher=Xml.com | ||
− | |accessdate=2021-06-05}} | + | |accessdate=2021-06-05 |
− | </ref>. | + | |archive-date=2021-05-28 |
+ | |archive-url=https://web.archive.org/web/20210528134057/https://www.xml.com/pub/a/ws/2002/01/18/brewster.html | ||
+ | |deadlink=no | ||
+ | }}</ref>. | ||
Веб-краулеры запечатляют версию сайта такой, какой она была сохранена на момент доступа к ней через URL. Роботы регулярно сканируют большое количество веб-страниц, рекурсивно загружая, анализируя и отображая [[HTML]]-, [[JavaScript]]- и [[CSS]]-страницы{{sfn|Lerner|2017|с=1741—1755}}. Механизм работы краулеров похож на работу поисковых систем — роботы самостоятельно ищут порталы для архивирования через систему поиска путей, сканируя страницы и связанные с ними сайты, таким образом формируя сеть порталов. На момент создания Архива всемирная сеть была настолько маленькой, что веб-краулеры могли совершить обход всех сайтов за один сеанс. Однако со временем постоянный рост онлайн-порталов и их изменчивость сделали полный обход всей сети практически невозможным. Таким образом, не все изменения на сайтах зафиксированы в Wayback Machine{{sfn|Price|2011}}. Руководство Архива не уточняет то, как роботы находят и выбирают страницы для сканирования, однако заявляет, что чаще всего краулеры направляются на те сайты, которые имеют перекрёстные ссылки с других порталов и находятся в открытом доступе. Сканер начинает с веб-страницы, а затем следует по каждой гиперссылке на этой веб-странице, чтобы перейти на новые сайты. На каждой из новых веб-страниц поисковый робот повторяет процесс{{sfn|Bowyer|2021|с=43—57}}. Он будет продолжаться до того момента, пока архивация не будет остановлена или не достигнет установленного скриптом лимита<ref>{{cite web | Веб-краулеры запечатляют версию сайта такой, какой она была сохранена на момент доступа к ней через URL. Роботы регулярно сканируют большое количество веб-страниц, рекурсивно загружая, анализируя и отображая [[HTML]]-, [[JavaScript]]- и [[CSS]]-страницы{{sfn|Lerner|2017|с=1741—1755}}. Механизм работы краулеров похож на работу поисковых систем — роботы самостоятельно ищут порталы для архивирования через систему поиска путей, сканируя страницы и связанные с ними сайты, таким образом формируя сеть порталов. На момент создания Архива всемирная сеть была настолько маленькой, что веб-краулеры могли совершить обход всех сайтов за один сеанс. Однако со временем постоянный рост онлайн-порталов и их изменчивость сделали полный обход всей сети практически невозможным. Таким образом, не все изменения на сайтах зафиксированы в Wayback Machine{{sfn|Price|2011}}. Руководство Архива не уточняет то, как роботы находят и выбирают страницы для сканирования, однако заявляет, что чаще всего краулеры направляются на те сайты, которые имеют перекрёстные ссылки с других порталов и находятся в открытом доступе. Сканер начинает с веб-страницы, а затем следует по каждой гиперссылке на этой веб-странице, чтобы перейти на новые сайты. На каждой из новых веб-страниц поисковый робот повторяет процесс{{sfn|Bowyer|2021|с=43—57}}. Он будет продолжаться до того момента, пока архивация не будет остановлена или не достигнет установленного скриптом лимита<ref>{{cite web | ||
Строка 144: | Строка 171: | ||
|url=https://news.jrn.msu.edu/2017/12/wayback-machine-archives-websites-for-over-20-years/ | |url=https://news.jrn.msu.edu/2017/12/wayback-machine-archives-websites-for-over-20-years/ | ||
|title=Wayback Machine archives websites for over 20 years | |title=Wayback Machine archives websites for over 20 years | ||
− | |author=Laura Bohannon | + | |author=Laura Bohannon |
|date=2017-12-07 | |date=2017-12-07 | ||
|publisher=Spartan News Room | |publisher=Spartan News Room | ||
− | |accessdate=2021-06-05}} | + | |accessdate=2021-06-05 |
− | </ref>{{sfn|O'Connor|2008|с=64}}{{sfn|Maemura|2018}}. Для этого в специальное окно поиска вводится URL интересующего портала, после чего Wayback Machine выдаёт список дат архивации. Звёздочка после некоторых дат используется для обозначения обнаруженных на странице изменений. URL-адрес заархивированной страницы начинается с web.archive.org{{sfn|Notess|2002}}{{sfn|Bowyer|2021|с=43—57}}. | + | |archive-date=2021-06-24 |
+ | |archive-url=https://web.archive.org/web/20210624202004/https://news.jrn.msu.edu/2017/12/wayback-machine-archives-websites-for-over-20-years/ | ||
+ | |deadlink=no | ||
+ | }}</ref>{{sfn|O'Connor|2008|с=64}}{{sfn|Maemura|2018}}. Для этого в специальное окно поиска вводится URL интересующего портала, после чего Wayback Machine выдаёт список дат архивации. Звёздочка после некоторых дат используется для обозначения обнаруженных на странице изменений. URL-адрес заархивированной страницы начинается с web.archive.org{{sfn|Notess|2002}}{{sfn|Bowyer|2021|с=43—57}}. | ||
Любой пользователь может сохранить URL-адреса для архивирования, а с бесплатной учётной записью в архиве можно создать и заархивировать любые исходящие или внешние ссылки на исходной странице и получить обзорный отчёт<ref name=Graham>{{cite web | Любой пользователь может сохранить URL-адреса для архивирования, а с бесплатной учётной записью в архиве можно создать и заархивировать любые исходящие или внешние ссылки на исходной странице и получить обзорный отчёт<ref name=Graham>{{cite web | ||
Строка 156: | Строка 186: | ||
|date=2021-05-05 | |date=2021-05-05 | ||
|publisher=Global Investigative Journalism Network | |publisher=Global Investigative Journalism Network | ||
− | |accessdate=2021-05-29}} | + | |accessdate=2021-05-29 |
− | </ref><ref name=Graham/>. | + | |archive-date=2021-05-29 |
+ | |archive-url=https://web.archive.org/web/20210529020740/https://gijn.org/2021/05/05/tips-for-using-the-internet-archives-wayback-machine-in-your-next-investigation/ | ||
+ | |deadlink=no | ||
+ | }}</ref><ref name=Graham/>. | ||
== Хранение == | == Хранение == | ||
Строка 166: | Строка 199: | ||
|date=2018-09-28 | |date=2018-09-28 | ||
|publisher=The Hustle | |publisher=The Hustle | ||
− | |accessdate=2021-05-29}} | + | |accessdate=2021-05-29 |
− | </ref>. На февраль 2020 года в архиве Wayback Machine числилось более 900 млрд URL-адресов и более 400 млрд веб-страниц<ref name=VC>{{cite web | + | |archive-date=2018-10-02 |
+ | |archive-url=https://web.archive.org/web/20181002145800/https://thehustle.co/inside-wayback-machine-internet-archive | ||
+ | |deadlink=no | ||
+ | }}</ref>. На февраль 2020 года в архиве Wayback Machine числилось более 900 млрд URL-адресов и более 400 млрд веб-страниц<ref name=VC>{{cite web | ||
|url=https://vc.ru/services/109219-brauzer-brave-ot-soosnovatelya-mozilla-stal-predlagat-kopii-iz-arhiva-interneta-vmesto-udalennyh-veb-stranic?from=yandex&utm_source=yxnews&utm_medium=desktop&utm_referrer=https%3A%2F%2Fyandex.ru%2Fnews%2Fsearch%3Ftext%3D | |url=https://vc.ru/services/109219-brauzer-brave-ot-soosnovatelya-mozilla-stal-predlagat-kopii-iz-arhiva-interneta-vmesto-udalennyh-veb-stranic?from=yandex&utm_source=yxnews&utm_medium=desktop&utm_referrer=https%3A%2F%2Fyandex.ru%2Fnews%2Fsearch%3Ftext%3D | ||
|title=Браузер Brave от сооснователя Mozilla стал предлагать копии из «архива интернета» вместо удалённых веб-страниц | |title=Браузер Brave от сооснователя Mozilla стал предлагать копии из «архива интернета» вместо удалённых веб-страниц | ||
|author=Евгений Делюкин | |author=Евгений Делюкин | ||
|date=2020-02-26 | |date=2020-02-26 | ||
− | |publisher=VcRu | + | |publisher=VcRu |
− | |accessdate=2021-06-01}} | + | |accessdate=2021-06-01 |
− | </ref>. На июнь 2021 года Wayback Machine предоставлял доступ к более чем 581 млрд сохранённых веб-страниц<ref name=web/>. | + | |archive-date=2021-06-24 |
+ | |archive-url=https://web.archive.org/web/20210624201130/https://vc.ru/services/109219-brauzer-brave-ot-soosnovatelya-mozilla-stal-predlagat-kopii-iz-arhiva-interneta-vmesto-udalennyh-veb-stranic?from=yandex&utm_source=yxnews&utm_medium=desktop&utm_referrer=https%3A%2F%2Fyandex.ru%2Fnews%2Fsearch%3Ftext%3D | ||
+ | |deadlink=no | ||
+ | }}</ref>. На июнь 2021 года Wayback Machine предоставлял доступ к более чем 581 млрд сохранённых веб-страниц<ref name=web/>. | ||
== Использование == | == Использование == | ||
Строка 183: | Строка 222: | ||
|date=2018-09-04 | |date=2018-09-04 | ||
|publisher=The Register | |publisher=The Register | ||
− | |accessdate=2021-06-04}} | + | |accessdate=2021-06-04 |
− | </ref>; позднее [[Апелляционный суд США по седьмому федеральному апелляционному округу]] также признал скриншоты веб-архивов допустимыми электронными доказательствами<ref>{{cite web | + | |archive-date=2021-06-02 |
+ | |archive-url=https://web.archive.org/web/20210602231920/https://www.theregister.com/2018/09/04/wayback_machine_legit/ | ||
+ | |deadlink=no | ||
+ | }}</ref>; позднее [[Апелляционный суд США по седьмому федеральному апелляционному округу]] также признал скриншоты веб-архивов допустимыми электронными доказательствами<ref>{{cite web | ||
|url=http://www.garant.ru/news/1418353/?utm_source=yxnews&utm_medium=desktop&utm_referrer=https%3A%2F%2Fyandex.ru%2Fnews%2Fsearch%3Ftext%3D | |url=http://www.garant.ru/news/1418353/?utm_source=yxnews&utm_medium=desktop&utm_referrer=https%3A%2F%2Fyandex.ru%2Fnews%2Fsearch%3Ftext%3D | ||
|title=Электронные доказательства в спорах в сфере интеллектуальной собственности | |title=Электронные доказательства в спорах в сфере интеллектуальной собственности | ||
Строка 190: | Строка 232: | ||
|date=2020-10-26 | |date=2020-10-26 | ||
|publisher=Гарант | |publisher=Гарант | ||
− | |accessdate=2021-06-05}} | + | |accessdate=2021-06-05 |
− | </ref>. | + | |archive-date=2021-06-24 |
+ | |archive-url=https://web.archive.org/web/20210624202716/http://www.garant.ru/news/1418353/?utm_source=yxnews&utm_medium=desktop&utm_referrer=https%3A%2F%2Fyandex.ru%2Fnews%2Fsearch%3Ftext%3D | ||
+ | |deadlink=no | ||
+ | }}</ref>. | ||
Благодаря архивированным в Wayback Machine статьям авторы могут устанавливать право на открытие или на публикацию{{sfn|Pearce|2009|с=875}}. Для социологов и историков Wayback Machine предлагает ценный крупномасштабный источник данных для анализа поведения компаний, стратегий продаж, социальных практик{{sfn|Arora|2015}}{{sfn|Milligan|2016}}. Также Wayback Machine позволяет получать доступ к журналам [[открытый доступ|открытого доступа]]. Так, с начала 2000-х годов из интернета исчезло 84 журнала ОД по естественным наукам и ещё около 100 — по социальным и гуманитарным<ref>{{cite web | Благодаря архивированным в Wayback Machine статьям авторы могут устанавливать право на открытие или на публикацию{{sfn|Pearce|2009|с=875}}. Для социологов и историков Wayback Machine предлагает ценный крупномасштабный источник данных для анализа поведения компаний, стратегий продаж, социальных практик{{sfn|Arora|2015}}{{sfn|Milligan|2016}}. Также Wayback Machine позволяет получать доступ к журналам [[открытый доступ|открытого доступа]]. Так, с начала 2000-х годов из интернета исчезло 84 журнала ОД по естественным наукам и ещё около 100 — по социальным и гуманитарным<ref>{{cite web | ||
Строка 199: | Строка 244: | ||
|date=2020-09-08 | |date=2020-09-08 | ||
|publisher=Science | |publisher=Science | ||
− | |accessdate=2021-06-01}} | + | |accessdate=2021-06-01 |
− | </ref><ref>{{cite web | + | |archive-date=2020-10-15 |
+ | |archive-url=https://web.archive.org/web/20201015230626/https://www.sciencemag.org/news/2020/09/dozens-scientific-journals-have-vanished-internet-and-no-one-preserved-them | ||
+ | |deadlink=no | ||
+ | }}</ref><ref>{{cite web | ||
|url=https://www.nature.com/articles/d41586-020-02610-z | |url=https://www.nature.com/articles/d41586-020-02610-z | ||
|title=More than 100 scientific journals have disappeared from the Internet | |title=More than 100 scientific journals have disappeared from the Internet | ||
Строка 206: | Строка 254: | ||
|date=2020-09-10 | |date=2020-09-10 | ||
|publisher=Nature | |publisher=Nature | ||
− | |accessdate=2021-06-01}} | + | |accessdate=2021-06-01 |
− | </ref><ref>{{cite web | + | |archive-date=2020-10-03 |
+ | |archive-url=https://web.archive.org/web/20201003135120/https://www.nature.com/articles/d41586-020-02610-z | ||
+ | |deadlink=no | ||
+ | }}</ref><ref>{{cite web | ||
|url=https://habr.com/ru/news/t/518594/?utm_source=yxnews&utm_medium=desktop&utm_referrer=https%3A%2F%2Fyandex.ru%2Fnews%2Fsearch%3Ftext%3D | |url=https://habr.com/ru/news/t/518594/?utm_source=yxnews&utm_medium=desktop&utm_referrer=https%3A%2F%2Fyandex.ru%2Fnews%2Fsearch%3Ftext%3D | ||
|title=Десятки научных журналов исчезли из интернета за последние 20 лет и никто их не сохранил | |title=Десятки научных журналов исчезли из интернета за последние 20 лет и никто их не сохранил | ||
Строка 213: | Строка 264: | ||
|date=2020-09-10 | |date=2020-09-10 | ||
|publisher=Хабр | |publisher=Хабр | ||
− | |accessdate=2021-06-05}} | + | |accessdate=2021-06-05 |
− | </ref>. | + | |archive-date=2021-06-24 |
+ | |archive-url=https://web.archive.org/web/20210624203211/https://habr.com/ru/news/t/518594/?utm_source=yxnews&utm_medium=desktop&utm_referrer=https%3A%2F%2Fyandex.ru%2Fnews%2Fsearch%3Ftext%3D | ||
+ | |deadlink=no | ||
+ | }}</ref>. | ||
Активисты и исследователи используют портал для борьбы с [[Дезинформация|дезинформацией]], особенно усилившейся после избрания президента [[Президентские выборы в США (2016)|Дональда Трампа в США]]. В ответ на участившиеся противоречивые заявления со стороны [[Исполнительный офис президента США|администрации президента]] Архив создал отдельную коллекцию под названием «Архив Трампа», содержащую выступления президента на телевидении и [[твиттер|твиты]]. Архив надеется, что его хранилище поможет другим выявлять ложную информацию и проверять подозрительный контент<ref>{{cite web | Активисты и исследователи используют портал для борьбы с [[Дезинформация|дезинформацией]], особенно усилившейся после избрания президента [[Президентские выборы в США (2016)|Дональда Трампа в США]]. В ответ на участившиеся противоречивые заявления со стороны [[Исполнительный офис президента США|администрации президента]] Архив создал отдельную коллекцию под названием «Архив Трампа», содержащую выступления президента на телевидении и [[твиттер|твиты]]. Архив надеется, что его хранилище поможет другим выявлять ложную информацию и проверять подозрительный контент<ref>{{cite web | ||
Строка 222: | Строка 276: | ||
|date=2019-09-17 | |date=2019-09-17 | ||
|publisher=Financial Times | |publisher=Financial Times | ||
− | |accessdate=2021-06-03}} | + | |accessdate=2021-06-03 |
− | </ref><ref>{{cite web | + | |archive-date=2021-06-28 |
+ | |archive-url=https://web.archive.org/web/20210628083500/https://www.ft.com/content/5be1f2ee-d60b-11e9-a0bd-ab8ec6435630 | ||
+ | |deadlink=no | ||
+ | }}</ref><ref>{{cite web | ||
|url=https://www.pri.org/stories/2017-02-23/where-find-whats-disappeared-online-and-whole-lot-more-internet-archive | |url=https://www.pri.org/stories/2017-02-23/where-find-whats-disappeared-online-and-whole-lot-more-internet-archive | ||
|title=Where to find what's disappeared online, and a whole lot more: the Internet Archive | |title=Where to find what's disappeared online, and a whole lot more: the Internet Archive | ||
Строка 229: | Строка 286: | ||
|date=2017-02-23 | |date=2017-02-23 | ||
|publisher=The World | |publisher=The World | ||
− | |accessdate=2021-06-07}} | + | |accessdate=2021-06-07 |
− | </ref>. Однако в некоторых случаях отдельные активисты утверждали, что заархивированные Wayback Machine ресурсы наоборот способствовали распространению дезинформации. Так, с началом [[Пандемия COVID-19|пандемии коронавируса]] сторонники [[Конспирологические теории о пандемии COVID-19|конспиративных теорий]] использовали сохранённые порталом скриншоты для распространения ложной информации о [[COVID-19|коронавирусе]]{{sfn|Acker|2020}}. В качестве [[контрмеры|контрмер]] в ноябре 2020 года Архив внедрил в Wayback Machine инструменты проверки информации на достоверность. Для этого некоммерческая организация начала сотрудничать с различными компаниями, занимающимися проверкой фактов, чтобы предоставлять пользователям причины удаления той или иной страницы из коллекции. При открытии заархивированной версии сайта Wayback Machine предоставляет пользователям сведения о причине её удаления в виде жёлтого баннера вверху экрана. При подозрении на причастность веб-страницы к кампании по дезинформации Wayback Machine предоставляет данные об организации, проводившей проверку на достоверность, и ссылку на её отчёт<ref>{{cite web | + | |archive-date=2017-03-28 |
+ | |archive-url=https://web.archive.org/web/20170328092846/https://www.pri.org/stories/2017-02-23/where-find-whats-disappeared-online-and-whole-lot-more-internet-archive | ||
+ | |deadlink=no | ||
+ | }}</ref>. Однако в некоторых случаях отдельные активисты утверждали, что заархивированные Wayback Machine ресурсы наоборот способствовали распространению дезинформации. Так, с началом [[Пандемия COVID-19|пандемии коронавируса]] сторонники [[Конспирологические теории о пандемии COVID-19|конспиративных теорий]] использовали сохранённые порталом скриншоты для распространения ложной информации о [[COVID-19|коронавирусе]]{{sfn|Acker|2020}}. В качестве [[контрмеры|контрмер]] в ноябре 2020 года Архив внедрил в Wayback Machine инструменты проверки информации на достоверность. Для этого некоммерческая организация начала сотрудничать с различными компаниями, занимающимися проверкой фактов, чтобы предоставлять пользователям причины удаления той или иной страницы из коллекции. При открытии заархивированной версии сайта Wayback Machine предоставляет пользователям сведения о причине её удаления в виде жёлтого баннера вверху экрана. При подозрении на причастность веб-страницы к кампании по дезинформации Wayback Machine предоставляет данные об организации, проводившей проверку на достоверность, и ссылку на её отчёт<ref>{{cite web | ||
|url=https://trashbox.ru/link/2020-11-02-wayback-machine-fact-checking?utm_source=yxnews&utm_medium=desktop&utm_referrer=https%3A%2F%2Fyandex.ru%2Fnews%2Fsearch%3Ftext%3D | |url=https://trashbox.ru/link/2020-11-02-wayback-machine-fact-checking?utm_source=yxnews&utm_medium=desktop&utm_referrer=https%3A%2F%2Fyandex.ru%2Fnews%2Fsearch%3Ftext%3D | ||
|title=Wayback Machine теперь проверяет информацию на достоверность для архивных веб-страниц | |title=Wayback Machine теперь проверяет информацию на достоверность для архивных веб-страниц | ||
|date=2020-11-02 | |date=2020-11-02 | ||
|publisher=Trash Box | |publisher=Trash Box | ||
− | |accessdate=2021-06-05}} | + | |accessdate=2021-06-05 |
− | </ref>. | + | |archive-date=2021-06-24 |
+ | |archive-url=https://web.archive.org/web/20210624203219/https://trashbox.ru/link/2020-11-02-wayback-machine-fact-checking?utm_source=yxnews&utm_medium=desktop&utm_referrer=https%3A%2F%2Fyandex.ru%2Fnews%2Fsearch%3Ftext%3D | ||
+ | |deadlink=no | ||
+ | }}</ref>. | ||
В отдельных случаях полученная через Wayback Machine информация фигурировала в крупных скандалах. Так, с помощью портала было выяснено, что официальный представитель [[Министерство здравоохранения и социальных служб США|Министерства здравоохранения и социальных служб США]] {{iw|Капуто, Майкл|Майкл Капуто|en|Michael Caputo}} в серии уже удалённых твитов публиковал [[Расизм|расистские]] и уничижительные комментарии о [[Китайцы|китайском народе]]<ref>{{cite web | В отдельных случаях полученная через Wayback Machine информация фигурировала в крупных скандалах. Так, с помощью портала было выяснено, что официальный представитель [[Министерство здравоохранения и социальных служб США|Министерства здравоохранения и социальных служб США]] {{iw|Капуто, Майкл|Майкл Капуто|en|Michael Caputo}} в серии уже удалённых твитов публиковал [[Расизм|расистские]] и уничижительные комментарии о [[Китайцы|китайском народе]]<ref>{{cite web | ||
Строка 243: | Строка 306: | ||
|date=2020-04-24 | |date=2020-04-24 | ||
|publisher=Красная весна | |publisher=Красная весна | ||
− | |accessdate=2021-06-05}} | + | |accessdate=2021-06-05 |
− | </ref>. Помимо этого, Wayback Machine хранит копию позже удалённого сообщения о том, что лидер [[Сепаратизм на Украине|украинских сепаратистов]] [[Стрелков, Игорь Иванович|Игорь Стрелков]] взял ответственность за [[Катастрофа Boeing 777 в Донецкой области|катастрофу Boeing 777 в Донецкой области]]<ref>{{cite web | + | |archive-date=2021-06-24 |
+ | |archive-url=https://web.archive.org/web/20210624202305/https://rossaprimavera.ru/news/3d93baba?utm_source=yxnews&utm_medium=desktop&utm_referrer=https%3A%2F%2Fyandex.ru%2Fnews%2Fsearch%3Ftext%3D | ||
+ | |deadlink=no | ||
+ | }}</ref>. Помимо этого, Wayback Machine хранит копию позже удалённого сообщения о том, что лидер [[Сепаратизм на Украине|украинских сепаратистов]] [[Стрелков, Игорь Иванович|Игорь Стрелков]] взял ответственность за [[Катастрофа Boeing 777 в Донецкой области|катастрофу Boeing 777 в Донецкой области]]<ref>{{cite web | ||
|url=https://www.openculture.com/2014/07/did-the-wayback-machine-catch-russian-backed-rebels.html | |url=https://www.openculture.com/2014/07/did-the-wayback-machine-catch-russian-backed-rebels.html | ||
|title=Did the Wayback Machine Catch Russian-Backed Rebels Claiming Responsibility for Malaysian Airlines Flight MH17? | |title=Did the Wayback Machine Catch Russian-Backed Rebels Claiming Responsibility for Malaysian Airlines Flight MH17? | ||
|date=2014-07-19 | |date=2014-07-19 | ||
|publisher=Open Culture | |publisher=Open Culture | ||
− | |accessdate=2021-06-03}} | + | |accessdate=2021-06-03 |
− | </ref><ref>{{cite web | + | |archive-date=2021-06-24 |
+ | |archive-url=https://web.archive.org/web/20210624205440/https://www.openculture.com/2014/07/did-the-wayback-machine-catch-russian-backed-rebels.html | ||
+ | |deadlink=no | ||
+ | }}</ref><ref>{{cite web | ||
|url=https://www.newyorker.com/magazine/2015/01/26/cobweb | |url=https://www.newyorker.com/magazine/2015/01/26/cobweb | ||
|title=The Cobweb | |title=The Cobweb | ||
Строка 256: | Строка 325: | ||
|date=2015-01-19 | |date=2015-01-19 | ||
|publisher=New Yorker | |publisher=New Yorker | ||
− | |accessdate=2021-06-07}} | + | |accessdate=2021-06-07 |
− | </ref>. В мае 2021 года издание [[Bellingcat]] выяснило, что находящиеся в Европе американские военные использовали для хранения засекреченных данных детские мобильные приложения для запоминания информации. Из-за неправильно установленных настроек приватности другие пользователи получили доступ к секретной информации. После обнаружения утечки информации военные удалили все карточки, но они остались в сервисе Wayback Machine<ref>{{cite web | + | |archive-date=2015-01-25 |
+ | |archive-url=https://web.archive.org/web/20150125141230/http://www.newyorker.com/magazine/2015/01/26/cobweb | ||
+ | |deadlink=no | ||
+ | }}</ref>. В мае 2021 года издание [[Bellingcat]] выяснило, что находящиеся в Европе американские военные использовали для хранения засекреченных данных детские мобильные приложения для запоминания информации. Из-за неправильно установленных настроек приватности другие пользователи получили доступ к секретной информации. После обнаружения утечки информации военные удалили все карточки, но они остались в сервисе Wayback Machine<ref>{{cite web | ||
|url=https://tjournal.ru/news/389570-v-set-popali-sekretnye-dannye-ob-amerikanskom-yadernom-oruzhii-voennye-zapisyvali-ih-v-shkolnyh-prilozheniyah?from=yandex&utm_source=yxnews&utm_medium=desktop&utm_referrer=https%3A%2F%2Fyandex.ru%2Fnews%2Fsearch%3Ftext%3D | |url=https://tjournal.ru/news/389570-v-set-popali-sekretnye-dannye-ob-amerikanskom-yadernom-oruzhii-voennye-zapisyvali-ih-v-shkolnyh-prilozheniyah?from=yandex&utm_source=yxnews&utm_medium=desktop&utm_referrer=https%3A%2F%2Fyandex.ru%2Fnews%2Fsearch%3Ftext%3D | ||
− | |title=В сеть попали секретные данные об американском ядерном оружии — военные записывали их в школьных приложениях | + | |title=В сеть попали секретные данные об американском ядерном оружии — военные записывали их в школьных приложениях |
|author=Дамир Камалетдинов | |author=Дамир Камалетдинов | ||
|date=2021-05-30 | |date=2021-05-30 | ||
|publisher=T Journal | |publisher=T Journal | ||
− | |accessdate=2021-06-05}} | + | |accessdate=2021-06-05 |
− | </ref>. | + | |archive-date=2021-06-24 |
+ | |archive-url=https://web.archive.org/web/20210624201326/https://tjournal.ru/news/389570-v-set-popali-sekretnye-dannye-ob-amerikanskom-yadernom-oruzhii-voennye-zapisyvali-ih-v-shkolnyh-prilozheniyah?from=yandex&utm_source=yxnews&utm_medium=desktop&utm_referrer=https%3A%2F%2Fyandex.ru%2Fnews%2Fsearch%3Ftext%3D | ||
+ | |deadlink=no | ||
+ | }}</ref>. | ||
== Правовой статус == | == Правовой статус == | ||
Строка 273: | Строка 348: | ||
|date=2020-05-15 | |date=2020-05-15 | ||
|publisher=Lutzker | |publisher=Lutzker | ||
− | |accessdate=2021-06-04}} | + | |accessdate=2021-06-04 |
− | </ref>. Однако из-за сохранения других данных «Архив Интернета» находится в уязвимом юридическом положении<ref>{{cite web | + | |archive-date=2021-06-24 |
+ | |archive-url=https://web.archive.org/web/20210624201547/https://www.lutzker.com/internet-archives-open-library-and-copyright-law/ | ||
+ | |deadlink=no | ||
+ | }}</ref>. Однако из-за сохранения других данных «Архив Интернета» находится в уязвимом юридическом положении<ref>{{cite web | ||
|url=https://arstechnica.com/tech-policy/2011/01/copy-some-web-pages-owe-more-than-the-national-debt/ | |url=https://arstechnica.com/tech-policy/2011/01/copy-some-web-pages-owe-more-than-the-national-debt/ | ||
|title=Copy some webpages, owe more than the national debt | |title=Copy some webpages, owe more than the national debt | ||
Строка 280: | Строка 358: | ||
|date=2011-05-01 | |date=2011-05-01 | ||
|publisher=Ars Technica | |publisher=Ars Technica | ||
− | |accessdate=2021-06-05}} | + | |accessdate=2021-06-05 |
− | </ref>. Так, в 2005 году Wayback Machine оказался втянутым в спор о товарных знаках между компаниями Healthcare Advocates и Health Advocate. Последняя использовала Wayback Machine для доступа к веб-страницам Healthcare Advocates, датируемым 1999 годом, в попытке найти информацию, которая поддержала бы дело. В ответ Healthcare Advocates подала в суд как на Health Advocatt, так и на Архив, утверждая что архив нарушил [[Digital Millennium Copyright Act|Закон об авторском праве в цифровую эпоху]]. Впоследствии дело было урегулировано в досудебном порядке<ref>{{cite web | + | |archive-date=2021-06-24 |
+ | |archive-url=https://web.archive.org/web/20210624203555/https://arstechnica.com/tech-policy/2011/01/copy-some-web-pages-owe-more-than-the-national-debt/ | ||
+ | |deadlink=no | ||
+ | }}</ref>. Так, в 2005 году Wayback Machine оказался втянутым в спор о товарных знаках между компаниями Healthcare Advocates и Health Advocate. Последняя использовала Wayback Machine для доступа к веб-страницам Healthcare Advocates, датируемым 1999 годом, в попытке найти информацию, которая поддержала бы дело. В ответ Healthcare Advocates подала в суд как на Health Advocatt, так и на Архив, утверждая что архив нарушил [[Digital Millennium Copyright Act|Закон об авторском праве в цифровую эпоху]]. Впоследствии дело было урегулировано в досудебном порядке<ref>{{cite web | ||
|url=https://arstechnica.com/uncategorized/2006/08/7634/ | |url=https://arstechnica.com/uncategorized/2006/08/7634/ | ||
|title=Internet Archive settles suit over Wayback Machine | |title=Internet Archive settles suit over Wayback Machine | ||
Строка 287: | Строка 368: | ||
|date=2006-08-31 | |date=2006-08-31 | ||
|publisher=Ars Technica | |publisher=Ars Technica | ||
− | |accessdate=2021-06-07}} | + | |accessdate=2021-06-07 |
− | </ref>. | + | |archive-date=2007-11-05 |
+ | |archive-url=https://web.archive.org/web/20071105205430/http://arstechnica.com/news.ars/post/20060831-7634.html | ||
+ | |deadlink=no | ||
+ | }}</ref>. | ||
В 2002 году Архив удалил из своей системы ссылки на архивные копии портала Xenu.net, принадлежащего критику церкви Андреасу Хельдал-Лунду. Удаление произошло по требованию юристов [[Церковь Саентологии|Церкви Саентологии]], заявивших, что владеют правом собственности на выдержки из документов Церкви, опубликованные на сайте<ref>{{cite web | В 2002 году Архив удалил из своей системы ссылки на архивные копии портала Xenu.net, принадлежащего критику церкви Андреасу Хельдал-Лунду. Удаление произошло по требованию юристов [[Церковь Саентологии|Церкви Саентологии]], заявивших, что владеют правом собственности на выдержки из документов Церкви, опубликованные на сайте<ref>{{cite web | ||
Строка 308: | Строка 392: | ||
== Ограничения == | == Ограничения == | ||
Исследователи и активисты критикуют Wayback Machine и деятельность Архива Интернета за попытку сохранить все онлайн-материалы, многие из которых не представляют должной ценности. По мнению отдельных исследователей, это связано с устаревшей политикой Архива Интернета, который был основан в конце 1990-х годов — тогда, на заре создания интернет-архивов, считалось, что данные интернета должны сохраняться в полном объёме. Однако с созданием множества однодневных сайтов многие исследователи и активисты поменяли свое мнение<ref>{{cite web | Исследователи и активисты критикуют Wayback Machine и деятельность Архива Интернета за попытку сохранить все онлайн-материалы, многие из которых не представляют должной ценности. По мнению отдельных исследователей, это связано с устаревшей политикой Архива Интернета, который был основан в конце 1990-х годов — тогда, на заре создания интернет-архивов, считалось, что данные интернета должны сохраняться в полном объёме. Однако с созданием множества однодневных сайтов многие исследователи и активисты поменяли свое мнение<ref>{{cite web | ||
− | |url=https://harpers.org/archive/2018/12/preservation-acts-archiving-twitter-social-media-movements/ | + | |url=https://harpers.org/archive/2018/12/preservation-acts-archiving-twitter-social-media-movements/ |
|title=Preservation Acts | |title=Preservation Acts | ||
|author=Nora Caplan-Bricker | |author=Nora Caplan-Bricker | ||
|date=2018-12 | |date=2018-12 | ||
|publisher=Harper's Magazine | |publisher=Harper's Magazine | ||
− | |accessdate=2021-06-02}} | + | |accessdate=2021-06-02 |
− | </ref>. Другие критические замечания относятся к техническим ограничениям сервиса — Wayback Machine не позволяет сохранять и обрабатывать | + | |archive-date=2021-05-05 |
+ | |archive-url=https://web.archive.org/web/20210505235528/https://harpers.org/archive/2018/12/preservation-acts-archiving-twitter-social-media-movements/ | ||
+ | |deadlink=no | ||
+ | }}</ref>. Другие критические замечания относятся к техническим ограничениям сервиса — Wayback Machine не позволяет сохранять и обрабатывать | ||
определённые элементы JavaScript, а также может создавать заархивированные страницы, содержащие неработающие ссылки, отсутствующую графику или являющиеся неполными по иным причинам{{sfn|Crudo|2014}}. Сканеры захватывают только статистический снимок сайта — функции порталов на основе Java или Flash работать не будут. Это означает, что бо́льшая часть функциональных возможностей исходной веб-страницы теряется{{sfn|Price|2011}}. | определённые элементы JavaScript, а также может создавать заархивированные страницы, содержащие неработающие ссылки, отсутствующую графику или являющиеся неполными по иным причинам{{sfn|Crudo|2014}}. Сканеры захватывают только статистический снимок сайта — функции порталов на основе Java или Flash работать не будут. Это означает, что бо́льшая часть функциональных возможностей исходной веб-страницы теряется{{sfn|Price|2011}}. | ||
Строка 324: | Строка 411: | ||
|date=2015-06-26 | |date=2015-06-26 | ||
|publisher=Tech dirt | |publisher=Tech dirt | ||
− | |accessdate=2021-06-03}} | + | |accessdate=2021-06-03 |
− | </ref><ref>{{cite web | + | |archive-date=2021-06-04 |
+ | |archive-url=https://web.archive.org/web/20210604213725/https://www.techdirt.com/articles/20150626/11213631474/russia-blocks-internet-archives-wayback-machine-over-single-page.shtml | ||
+ | |deadlink=no | ||
+ | }}</ref><ref>{{cite web | ||
|url=https://www.mk.ru/social/2015/06/25/roskomnadzor-zablokiroval-arkhiv-interneta-izza-odinochnogo-dzhikhada.html | |url=https://www.mk.ru/social/2015/06/25/roskomnadzor-zablokiroval-arkhiv-interneta-izza-odinochnogo-dzhikhada.html | ||
|title=Роскомнадзор заблокировал архив интернета из-за "Одиночного джихада" | |title=Роскомнадзор заблокировал архив интернета из-за "Одиночного джихада" | ||
|date=2015-06-25 | |date=2015-06-25 | ||
|publisher=Московский комсомолец | |publisher=Московский комсомолец | ||
− | |accessdate=2021-06-05}} | + | |accessdate=2021-06-05 |
− | </ref><ref>{{cite web | + | |archive-date=2021-06-24 |
+ | |archive-url=https://web.archive.org/web/20210624201601/https://www.mk.ru/social/2015/06/25/roskomnadzor-zablokiroval-arkhiv-interneta-izza-odinochnogo-dzhikhada.html | ||
+ | |deadlink=no | ||
+ | }}</ref><ref>{{cite web | ||
|url=https://lenta.ru/news/2015/06/25/rkn/ | |url=https://lenta.ru/news/2015/06/25/rkn/ | ||
|title=Роскомнадзор заблокировал страницу «архива интернета» за экстремизм | |title=Роскомнадзор заблокировал страницу «архива интернета» за экстремизм | ||
|date=2015-06-25 | |date=2015-06-25 | ||
|publisher=Lenta | |publisher=Lenta | ||
− | |accessdate=2021-06-05}} | + | |accessdate=2021-06-05 |
− | </ref>. В 2019 году представители Ассоциации по защите авторских прав в интернете (АЗАПИ) подали серию исков против сервиса Wayback Machine за нарушение авторских прав. Представители АЗАПИ запросили [[Московский городской суд|Мосгорсуд]] вынести решение о вечной блокировке портала на территории России, однако на август 2020 года Архив Интернета по-прежнему продолжал свою работу<ref>{{cite web | + | |archive-date=2021-09-22 |
+ | |archive-url=https://web.archive.org/web/20210922150736/https://lenta.ru/news/2015/06/25/rkn/ | ||
+ | |deadlink=no | ||
+ | }}</ref>. В 2019 году представители Ассоциации по защите авторских прав в интернете (АЗАПИ) подали серию исков против сервиса Wayback Machine за нарушение авторских прав. Представители АЗАПИ запросили [[Московский городской суд|Мосгорсуд]] вынести решение о вечной блокировке портала на территории России, однако на август 2020 года Архив Интернета по-прежнему продолжал свою работу<ref>{{cite web | ||
|url=https://roskomsvoboda.org/49067/ | |url=https://roskomsvoboda.org/49067/ | ||
|title=АЗАПИ хочет навечно заблокировать «Архив интернета» | |title=АЗАПИ хочет навечно заблокировать «Архив интернета» | ||
|publisher=Роскомсвобода | |publisher=Роскомсвобода | ||
|date=2019-08-22 | |date=2019-08-22 | ||
− | |accessdate=2021-06-05}} | + | |accessdate=2021-06-05 |
− | </ref><ref>{{cite web | + | |archive-date=2021-06-04 |
+ | |archive-url=https://web.archive.org/web/20210604024806/https://roskomsvoboda.org/49067/ | ||
+ | |deadlink=no | ||
+ | }}</ref><ref>{{cite web | ||
|url=https://www.cnews.ru/news/top/2019-08-23_arhiv_interneta_mogut | |url=https://www.cnews.ru/news/top/2019-08-23_arhiv_interneta_mogut | ||
|title=«Архив интернета» могут навечно заблокировать в России | |title=«Архив интернета» могут навечно заблокировать в России | ||
|date=2019-08-23 | |date=2019-08-23 | ||
|publisher=C News | |publisher=C News | ||
− | |accessdate=2021-06-07}} | + | |accessdate=2021-06-07 |
− | </ref><ref>{{cite web | + | |archive-date=2021-06-24 |
+ | |archive-url=https://web.archive.org/web/20210624202847/https://www.cnews.ru/news/top/2019-08-23_arhiv_interneta_mogut | ||
+ | |deadlink=no | ||
+ | }}</ref><ref>{{cite web | ||
|url=https://www.cnews.ru/news/top/2020-08-19_rossijskie_izdatelstva | |url=https://www.cnews.ru/news/top/2020-08-19_rossijskie_izdatelstva | ||
|title=Россияне потребовали запретить в Европе Telegram, YouTube и Mail.ru | |title=Россияне потребовали запретить в Европе Telegram, YouTube и Mail.ru | ||
|date=2020-08-19 | |date=2020-08-19 | ||
|publisher=C News | |publisher=C News | ||
− | |accessdate=2021-06-07}} | + | |accessdate=2021-06-07 |
− | </ref><ref>{{cite web | + | |archive-date=2021-06-24 |
+ | |archive-url=https://web.archive.org/web/20210624211239/https://www.cnews.ru/news/top/2020-08-19_rossijskie_izdatelstva | ||
+ | |deadlink=no | ||
+ | }}</ref><ref>{{cite web | ||
|url=https://www.vedomosti.ru/media/news/2020/06/02/831699-internet-archive?utm_source=yxnews&utm_medium=desktop&utm_referrer=https%3A%2F%2Fyandex.ru%2Fnews%2Fsearch%3Ftext%3D | |url=https://www.vedomosti.ru/media/news/2020/06/02/831699-internet-archive?utm_source=yxnews&utm_medium=desktop&utm_referrer=https%3A%2F%2Fyandex.ru%2Fnews%2Fsearch%3Ftext%3D | ||
|title=Американские издатели книг подали в суд на Internet Archive | |title=Американские издатели книг подали в суд на Internet Archive | ||
|date=2020-06-02 | |date=2020-06-02 | ||
|publisher=Ведомости | |publisher=Ведомости | ||
− | |accessdate=2021-06-05}} | + | |accessdate=2021-06-05 |
− | </ref>. | + | |archive-date=2021-06-24 |
+ | |archive-url=https://web.archive.org/web/20210624203346/https://www.vedomosti.ru/media/news/2020/06/02/831699-internet-archive?utm_source=yxnews&utm_medium=desktop&utm_referrer=https%3A%2F%2Fyandex.ru%2Fnews%2Fsearch%3Ftext%3D | ||
+ | |deadlink=no | ||
+ | }}</ref>. | ||
В 2017 году портал был заблокирован в [[Индия|Индии]] и [[Киргизия|Киргизии]] за содержание «экстремистских материалов»<ref>{{cite web | В 2017 году портал был заблокирован в [[Индия|Индии]] и [[Киргизия|Киргизии]] за содержание «экстремистских материалов»<ref>{{cite web | ||
Строка 368: | Строка 476: | ||
|date=2017-08-08 | |date=2017-08-08 | ||
|publisher=The Wire | |publisher=The Wire | ||
− | |accessdate=2021-06-03}} | + | |accessdate=2021-06-03 |
− | </ref><ref>{{cite web | + | |archive-date=2021-06-24 |
+ | |archive-url=https://web.archive.org/web/20210624202300/https://thewire.in/tech/access-internet-archives-wayback-machine-blocked | ||
+ | |deadlink=no | ||
+ | }}</ref><ref>{{cite web | ||
|url=https://www.theverge.com/2017/8/9/16117578/wayback-machine-blocked-india-internet-archive | |url=https://www.theverge.com/2017/8/9/16117578/wayback-machine-blocked-india-internet-archive | ||
|title=Wayback Machine has been blocked in India | |title=Wayback Machine has been blocked in India | ||
|date=2017-08-09 | |date=2017-08-09 | ||
|publisher=The Verge | |publisher=The Verge | ||
− | |accessdate=2021-06-05}} | + | |accessdate=2021-06-05 |
− | </ref><ref>{{cite web | + | |archive-date=2021-06-24 |
+ | |archive-url=https://web.archive.org/web/20210624202435/https://www.theverge.com/2017/8/9/16117578/wayback-machine-blocked-india-internet-archive | ||
+ | |deadlink=no | ||
+ | }}</ref><ref>{{cite web | ||
|url=https://advox.globalvoices.org/2017/07/21/kyrgyzstan-blocks-archive-org-on-extremism-grounds/ | |url=https://advox.globalvoices.org/2017/07/21/kyrgyzstan-blocks-archive-org-on-extremism-grounds/ | ||
|title=Kyrgyzstan Blocks Archive.org on ‘Extremism’ Grounds | |title=Kyrgyzstan Blocks Archive.org on ‘Extremism’ Grounds | ||
− | |publisher=Global Voices | + | |publisher=Global Voices |
− | |accessdate=2021-06-05}} | + | |accessdate=2021-06-05 |
− | </ref>. По данным на 2021 год сайт заблокирован в Китае<ref>{{cite web | + | |archive-date=2021-05-18 |
+ | |archive-url=https://web.archive.org/web/20210518164919/https://advox.globalvoices.org/2017/07/21/kyrgyzstan-blocks-archive-org-on-extremism-grounds/ | ||
+ | |deadlink=no | ||
+ | }}</ref>. По данным на 2021 год сайт заблокирован в Китае<ref>{{cite web | ||
|url=https://www.protocol.com/internet-archive-preserving-future | |url=https://www.protocol.com/internet-archive-preserving-future | ||
|title=The internet is splitting apart. The Internet Archive wants to save it all forever | |title=The internet is splitting apart. The Internet Archive wants to save it all forever | ||
Строка 386: | Строка 503: | ||
|date=2021-03-10 | |date=2021-03-10 | ||
|publisher=Protocol | |publisher=Protocol | ||
− | |accessdate=2021-06-09}} | + | |accessdate=2021-06-09 |
− | </ref>. | + | |archive-date=2021-06-01 |
+ | |archive-url=https://web.archive.org/web/20210601200035/https://www.protocol.com/internet-archive-preserving-future | ||
+ | |deadlink=no | ||
+ | }}</ref>. | ||
== Примечания == | == Примечания == |
Версия от 12:11, 8 декабря 2021
Wayback Machine Wayback Machine logo 2010.svg
|
- Владелец::
- Архив Интернета
- Начало работы::
- 24 октября 2001
Wayback Machine (с англ. — «Машина времени») — бесплатный онлайн-архив некоммерческой библиотеки «Архив Интернета». С помощью поисковых роботов или веб-краулеров Wayback Machine архивирует и делает общедоступной бо́льшую часть «открытого» интернета[1]. Сервис был запущен в 1996 году, однако стал доступен для общественности только в 2001-м. За первые 20 лет существования Wayback Machine каталогизировал и сохранил коллекцию из более чем 286 млрд веб-страниц. Архивные снимки отображаются в формате HTML, JavaScript и CSS[2]. Благодаря сохранённым в Wayback Machine документам пользователи могут отслеживать происходящие на сайтах изменения и сравнивать разные версии правок[3]. На июль 2021 года Wayback Machine предоставлял доступ к более чем 591 млрд сохранённым веб-страницам[4].
Создание

В 1989 году английский учёный Тим Бернерс-Ли создал всемирную паутину — систему, позволяющую передавать данные через подключённые к интернету компьютеры. Однако с распространением всемирной паутины были выявлены две основные проблемы. Первая состояла в нехватке мест для хранения всех данных, из-за чего многие документы и веб-страницы удалялись. Другая проблема заключалась в том, что после редактирования веб-страницы (например, по юридическим причинам), пользователи не могли посмотреть её изначальную версию. Решить эти недостатки стремилась американская цифровая библиотека «Архив Интернета» — некоммерческая организация, созданная программистами Брюстером Кейлом и Брюсом Галлиатом[англ.] в 1996 году. При сотрудничестве с Alexa Internet (дочерней компанией Amazon, занимающейся веб-индексированием) Архив инициировал создание и хранение копий существующих сайтов для развития «универсального доступа к знанию». Организация предоставляла бесплатный публичный доступ к оцифрованным материалам, таким как веб-страницы, книги, аудиозаписи, включая живые концерты, видео, изображения и программное обеспечение. На 2021 год штаб-квартира Архива Интернета находится в Сан-Франциско, в здании бывшей христианской церкви, расположенной в районе Ричмонд. Журналист местной радиостанции Kawl[англ.] в 2019 году сравнивал офис Архива с римским храмом[5][6][7]. Организация ставит перед собой цель спасти интернет от исчезновения[8].
Wayback Machine стал самым известным проектом Архива. Онлайн-сервис был назван в честь машины времени из мультсериала 1960-х годов «Шоу Рокки и Буллвинкля». Он предоставляет доступ к цифровой коллекции из примерно 562 млрд веб-страниц[3][9][10]. Проект Wayback Machine был задуман как решение проблемы ошибки 404, означающей, что сервер не может найти данные по запрошенному адресу. Это связано с так называемым вымиранием ссылок — нарастающей недоступностью некогда опубликованных данных. Так, в 1997 году средняя продолжительность жизни веб-страницы составляла 44 дня. В 2003 году этот показатель составил 100 дней. Проведённый в 2008 году анализ ссылок на 2700 цифровых ресурсов, большинство из которых не имеет печатных аналогов, показал, что около 8 процентов ссылок переставали работать через год. К 2011 году, по прошествии трёх лет, 30 процентов ссылок в коллекции были неработающими[11]. Благодаря интеграции с Alexa столкнувшийся с сообщением об ошибке пользователь мог получить доступ к заархивированной версии страницы через внедрённую в браузер панель инструментов. Если копия недоступной страницы присутствовала в базе данных Wayback Machine, то загоралась специальная кнопка. При этом пользователи могли предоставить браузеру разрешение на просмотр и регистрацию активности — в таком случае все посещаемые сайты архивировались на портале[12].
Wayback Machine был запущен в мае 1996 года, однако стал доступным для общественности только в 2001-м — до этого вся записанная на цифровых магнитных лентах информация была открыта только для ограниченного числа учёных и исследователей[13]. К моменту «открытия» архив содержал более 10 млрд заархивированных страниц[3]. К декабрю 2014 года руководство Wayback Machine сообщило, что сохранило 435 млрд веб-страниц по всему миру[1]. С технической точки зрения программное обеспечение Wayback Machine не является архивом, а скорее общедоступным интерфейсом к ограниченному подмножеству всех хранилищ[14]. Так, Wayback Machine нельзя считать поисковой системой коллекции организации, так как она не осуществляет поиск по базе данных другой крупной виртуальной библиотеки — Open Library, позволяющей пользователям бесплатно получать доступ к цифровым копиям книг, которые загружаются и архивируются в рамках проекта[15][16].
Характеристика
С запуском Wayback Machine «Архив Интернета» стал одним из самых популярных и узнаваемых онлайн-порталов и главным сервисом веб-архивирования[3][8]. В 1999 году Архив начал расширять коллекцию за пределы архивного веб-контента, чтобы обеспечить статус как к оцифрованным, так и изначально цифровым ресурсам, в том числе книгам, аудио, фильмам, изображениям, документам, программному обеспечению и видеоиграм[6]. Некоторые сканирования выполняются поисковыми роботами самого архива, а другие — партнёрскими организациями. Отдельные базы данных могут приобретаться за счёт пожертвований пользователей и целевых приобретений[16]. Сами создатели организации сравнивали свою коллекцию с Александрийской библиотекой[6]. На 2021 год Wayback Machine содержал более 424 млрд веб-страниц[14] — больше, чем документов в Библиотеке Конгресса[17][6][16].
Принцип работы
Платформа Wayback Machine функционирует за счёт двух основных элементов — поисковых роботов (или веб-краулеров) и интерфейса. Веб-краулеры занимаются посещением, извлечением, загрузкой и архивацией веб-страниц. В свою очередь, через интерфейс пользователи получают доступ к онлайн-коллекциям[2].
Поисковые роботы
Шаблон:Bar chart Изначально коллекция архива пополнялась за счёт браузерного плагина от Alexa Internet, который автоматически фиксировал и сохранял каждую веб-страницу по мере её посещения, затем передавая всю собранную информацию в «Архив Интернета». Пользователи также могли установить бесплатную панель инструментов, позволявшую проверять статус архивирования выбранного веб-сайта[16].
В 2002 году Архив запустил собственного поискового робота с открытым исходным кодом — Heritrix[англ.]. Коды краулеров записаны с помощью комбинации программных языков Cи и Perl. Помимо этого, «Архив Интернета» также принимает данные сканирования от других доноров[6]. Отсканированные копии веб-сайтов автоматически конвертируются в файлы размером около 100 МБ, которые затем сохраняются на серверах. Общая скорость пополнения архива составляет около 10 терабайт в месяц[18].
Веб-краулеры запечатляют версию сайта такой, какой она была сохранена на момент доступа к ней через URL. Роботы регулярно сканируют большое количество веб-страниц, рекурсивно загружая, анализируя и отображая HTML-, JavaScript- и CSS-страницы[2]. Механизм работы краулеров похож на работу поисковых систем — роботы самостоятельно ищут порталы для архивирования через систему поиска путей, сканируя страницы и связанные с ними сайты, таким образом формируя сеть порталов. На момент создания Архива всемирная сеть была настолько маленькой, что веб-краулеры могли совершить обход всех сайтов за один сеанс. Однако со временем постоянный рост онлайн-порталов и их изменчивость сделали полный обход всей сети практически невозможным. Таким образом, не все изменения на сайтах зафиксированы в Wayback Machine[8]. Руководство Архива не уточняет то, как роботы находят и выбирают страницы для сканирования, однако заявляет, что чаще всего краулеры направляются на те сайты, которые имеют перекрёстные ссылки с других порталов и находятся в открытом доступе. Сканер начинает с веб-страницы, а затем следует по каждой гиперссылке на этой веб-странице, чтобы перейти на новые сайты. На каждой из новых веб-страниц поисковый робот повторяет процесс[14]. Он будет продолжаться до того момента, пока архивация не будет остановлена или не достигнет установленного скриптом лимита[19]. Помимо этого, каждый пользователь может использовать специальную форму на портале и вызвать краулер, который сохранит страницу в текущем состоянии[2]. Wayback Machine сканирует только общедоступные веб-страницы и не может получить доступ к контенту, защищённому паролем или расположенному на частном сервере[10][14][3].
Интерфейс
Интерфейс Wayback Machine позволяет пользователям осуществить два основных действия — получить доступ к истории изменений сайта и просмотреть все сделанные на порталах правки. Также доступна функция сравнения разных версий сайтов[12][20][17][21]. Для этого в специальное окно поиска вводится URL интересующего портала, после чего Wayback Machine выдаёт список дат архивации. Звёздочка после некоторых дат используется для обозначения обнаруженных на странице изменений. URL-адрес заархивированной страницы начинается с web.archive.org[22][14].
Любой пользователь может сохранить URL-адреса для архивирования, а с бесплатной учётной записью в архиве можно создать и заархивировать любые исходящие или внешние ссылки на исходной странице и получить обзорный отчёт[23][23].
Хранение
На 2018 год коллекция Архива Интернета составляла более 40 петабайт или 40 млн гигабайт данных, Wayback Machine предоставлял доступ к примерно 63 % всех имеющихся материалов[24]. На февраль 2020 года в архиве Wayback Machine числилось более 900 млрд URL-адресов и более 400 млрд веб-страниц[25]. На июнь 2021 года Wayback Machine предоставлял доступ к более чем 581 млрд сохранённых веб-страниц[4].
Использование
Портал Wayback Machine зачастую применяют в правовой сфере — юристы используют сервис для поиска информации по гражданским искам, уголовным делам, в административном делопроизводстве и патентных процессах. Полученные через Wayback Machine архивные версии сайтов могут использоваться для решения вопросов о патентном праве или установлении наказания за публикацию материалов, которые впоследствии были удалены из сети[2][12]. Несмотря на широкое использование коллекции Архива Интернета для предоставления доказательств, некоторые суды США отказывались принимать скриншоты веб-страниц, ссылаясь на юридическую сложность отождествления оригинала документа и его заархивированной версии[26]. В 2018 году Апелляционный суд США по второму федеральному апелляционному округу постановил, что скрины с архива веб-страниц Wayback Machine относятся к законным доказательствам, которые могут быть использованы в судебных разбирательствах; ранее аналогичное решение вынес Апелляционный суд США по третьему федеральному апелляционному округу[27]; позднее Апелляционный суд США по седьмому федеральному апелляционному округу также признал скриншоты веб-архивов допустимыми электронными доказательствами[28].
Благодаря архивированным в Wayback Machine статьям авторы могут устанавливать право на открытие или на публикацию[29]. Для социологов и историков Wayback Machine предлагает ценный крупномасштабный источник данных для анализа поведения компаний, стратегий продаж, социальных практик[1][30]. Также Wayback Machine позволяет получать доступ к журналам открытого доступа. Так, с начала 2000-х годов из интернета исчезло 84 журнала ОД по естественным наукам и ещё около 100 — по социальным и гуманитарным[31][32][33].
Активисты и исследователи используют портал для борьбы с дезинформацией, особенно усилившейся после избрания президента Дональда Трампа в США. В ответ на участившиеся противоречивые заявления со стороны администрации президента Архив создал отдельную коллекцию под названием «Архив Трампа», содержащую выступления президента на телевидении и твиты. Архив надеется, что его хранилище поможет другим выявлять ложную информацию и проверять подозрительный контент[34][35]. Однако в некоторых случаях отдельные активисты утверждали, что заархивированные Wayback Machine ресурсы наоборот способствовали распространению дезинформации. Так, с началом пандемии коронавируса сторонники конспиративных теорий использовали сохранённые порталом скриншоты для распространения ложной информации о коронавирусе[36]. В качестве контрмер в ноябре 2020 года Архив внедрил в Wayback Machine инструменты проверки информации на достоверность. Для этого некоммерческая организация начала сотрудничать с различными компаниями, занимающимися проверкой фактов, чтобы предоставлять пользователям причины удаления той или иной страницы из коллекции. При открытии заархивированной версии сайта Wayback Machine предоставляет пользователям сведения о причине её удаления в виде жёлтого баннера вверху экрана. При подозрении на причастность веб-страницы к кампании по дезинформации Wayback Machine предоставляет данные об организации, проводившей проверку на достоверность, и ссылку на её отчёт[37].
В отдельных случаях полученная через Wayback Machine информация фигурировала в крупных скандалах. Так, с помощью портала было выяснено, что официальный представитель Министерства здравоохранения и социальных служб США Майкл Капуто[англ.] в серии уже удалённых твитов публиковал расистские и уничижительные комментарии о китайском народе[38]. Помимо этого, Wayback Machine хранит копию позже удалённого сообщения о том, что лидер украинских сепаратистов Игорь Стрелков взял ответственность за катастрофу Boeing 777 в Донецкой области[39][40]. В мае 2021 года издание Bellingcat выяснило, что находящиеся в Европе американские военные использовали для хранения засекреченных данных детские мобильные приложения для запоминания информации. Из-за неправильно установленных настроек приватности другие пользователи получили доступ к секретной информации. После обнаружения утечки информации военные удалили все карточки, но они остались в сервисе Wayback Machine[41].
Правовой статус
«Архив Интернета» не запрашивает разрешения на копирование веб-сайтов перед удалённым сбором данных, однако удаляет или ограничивает доступ к архивным материалам по запросу. Например, владельцам веб-сайтов предоставляется возможность «отказаться» от архивирования через стандартный файл robots.txt, который исключает веб-сайты из списка порталов для веб-краулеров[8][42]. Однако из-за сохранения других данных «Архив Интернета» находится в уязвимом юридическом положении[43]. Так, в 2005 году Wayback Machine оказался втянутым в спор о товарных знаках между компаниями Healthcare Advocates и Health Advocate. Последняя использовала Wayback Machine для доступа к веб-страницам Healthcare Advocates, датируемым 1999 годом, в попытке найти информацию, которая поддержала бы дело. В ответ Healthcare Advocates подала в суд как на Health Advocatt, так и на Архив, утверждая что архив нарушил Закон об авторском праве в цифровую эпоху. Впоследствии дело было урегулировано в досудебном порядке[44].
В 2002 году Архив удалил из своей системы ссылки на архивные копии портала Xenu.net, принадлежащего критику церкви Андреасу Хельдал-Лунду. Удаление произошло по требованию юристов Церкви Саентологии, заявивших, что владеют правом собственности на выдержки из документов Церкви, опубликованные на сайте[45][46].
Ограничения
Исследователи и активисты критикуют Wayback Machine и деятельность Архива Интернета за попытку сохранить все онлайн-материалы, многие из которых не представляют должной ценности. По мнению отдельных исследователей, это связано с устаревшей политикой Архива Интернета, который был основан в конце 1990-х годов — тогда, на заре создания интернет-архивов, считалось, что данные интернета должны сохраняться в полном объёме. Однако с созданием множества однодневных сайтов многие исследователи и активисты поменяли свое мнение[47]. Другие критические замечания относятся к техническим ограничениям сервиса — Wayback Machine не позволяет сохранять и обрабатывать определённые элементы JavaScript, а также может создавать заархивированные страницы, содержащие неработающие ссылки, отсутствующую графику или являющиеся неполными по иным причинам[48]. Сканеры захватывают только статистический снимок сайта — функции порталов на основе Java или Flash работать не будут. Это означает, что бо́льшая часть функциональных возможностей исходной веб-страницы теряется[8].
Блокировки
В 2015 году Роскомнадзор принял решение заблокировать Wayback Machine за копию страницы текста «Одиночный джихад в России», содержащего информацию о «теории и практике партизанского сопротивления». Соответствующая страница в Архиве Интернета была добавлена в официальный реестр запрещенных веб-сайтов в России 23 июня 2015 года, из-за чего некоторые российские интернет-провайдеры были вынуждены полностью заблокировать сайт Архива Интернета[49][50][51]. В 2019 году представители Ассоциации по защите авторских прав в интернете (АЗАПИ) подали серию исков против сервиса Wayback Machine за нарушение авторских прав. Представители АЗАПИ запросили Мосгорсуд вынести решение о вечной блокировке портала на территории России, однако на август 2020 года Архив Интернета по-прежнему продолжал свою работу[52][53][54][55].
В 2017 году портал был заблокирован в Индии и Киргизии за содержание «экстремистских материалов»[56][57][58]. По данным на 2021 год сайт заблокирован в Китае[59].
Примечания
- ↑ 1,0 1,1 1,2 Arora, 2015.
- ↑ 2,0 2,1 2,2 2,3 2,4 Lerner, 2017, с. 1741—1755.
- ↑ 3,0 3,1 3,2 3,3 3,4 Michael Bryant. What is the Wayback Machine and Why is it Useful? Groovy Post (22 апреля 2021). Дата обращения: 29 мая 2021. Архивировано 18 мая 2021 года.
- ↑ 4,0 4,1 Wayback Machine . Wayback Machine. Дата обращения: 7 июня 2021.
- ↑ Dominic Cummings: how the internet knows when you’ve updated your blog . The Conversation (28 мая 2020). Дата обращения: 3 июня 2021. Архивировано 25 июля 2021 года.
- ↑ 6,0 6,1 6,2 6,3 6,4 Odgen, 2017.
- ↑ In An Old Church, The Internet Archive Stores Our Digital History . Kalw. San Francisco local public radio (11 сентября 2019). Дата обращения: 3 июня 2021. Архивировано 6 мая 2021 года.
- ↑ 8,0 8,1 8,2 8,3 8,4 Price, 2011.
- ↑ Jack Schofield. The Time Machine . The Guardian (19 ноября 2007). Дата обращения: 1 июня 2021. Архивировано 19 апреля 2021 года.
- ↑ 10,0 10,1 Jenni McKinnon. Using the Wayback Machine to Archive (and Backup) WordPress . WPMudev (25 мая 2017). Дата обращения: 29 мая 2021. Архивировано 13 апреля 2021 года.
- ↑ Adrienne LaFrance. Raiders of the Lost Web . The Atlantic (14 октября 2015). Дата обращения: 7 июня 2021. Архивировано 7 мая 2017 года.
- ↑ 12,0 12,1 12,2 Rogers, 2017, с. 160—172.
- ↑ Hartelius, 2020, с. 378.
- ↑ 14,0 14,1 14,2 14,3 14,4 Bowyer, 2021, с. 43—57.
- ↑ Aja Romano. A lawsuit is threatening the Internet Archive — but it’s not as dire as you may have heard . Vox (23 января 2020). Дата обращения: 29 мая 2021. Архивировано 18 августа 2021 года.
- ↑ 16,0 16,1 16,2 16,3 Kalev Leetaru. The Internet Archive Turns 20: A Behind The Scenes Look At Archiving The Web . Forbes (18 января 2016). Дата обращения: 5 июня 2021. Архивировано 15 августа 2021 года.
- ↑ 17,0 17,1 O'Connor, 2008, с. 64.
- ↑ Richard Koman. How the Wayback Machine Works . Xml.com (21 января 2002). Дата обращения: 5 июня 2021. Архивировано 28 мая 2021 года.
- ↑ A. Rossi. Worldwide Web Crawls . Internet Archive (5 октября 2010). Дата обращения: 5 июня 2021.
- ↑ Laura Bohannon. Wayback Machine archives websites for over 20 years . Spartan News Room (7 декабря 2017). Дата обращения: 5 июня 2021. Архивировано 24 июня 2021 года.
- ↑ Maemura, 2018.
- ↑ Notess, 2002.
- ↑ 23,0 23,1 Mark Graham. Tips for Using the Internet Archive’s Wayback Machine in Your Next Investigation . Global Investigative Journalism Network (5 мая 2021). Дата обращения: 29 мая 2021. Архивировано 29 мая 2021 года.
- ↑ Zachary Crockett. Inside Wayback Machine, the internet’s time capsule . The Hustle (28 сентября 2018). Дата обращения: 29 мая 2021. Архивировано 2 октября 2018 года.
- ↑ Евгений Делюкин. Браузер Brave от сооснователя Mozilla стал предлагать копии из «архива интернета» вместо удалённых веб-страниц . VcRu (26 февраля 2020). Дата обращения: 1 июня 2021. Архивировано 24 июня 2021 года.
- ↑ Eltgroth, 2009.
- ↑ Kieren McCarthy. Archive.org's Wayback Machine is legit legal evidence, US appeals court judges rule . The Register (4 сентября 2018). Дата обращения: 4 июня 2021. Архивировано 2 июня 2021 года.
- ↑ Маргарита Сазонова. Электронные доказательства в спорах в сфере интеллектуальной собственности . Гарант (26 октября 2020). Дата обращения: 5 июня 2021. Архивировано 24 июня 2021 года.
- ↑ Pearce, 2009, с. 875.
- ↑ Milligan, 2016.
- ↑ Jeffrey Brainard. Dozens of scientific journals have vanished from the internet, and no one preserved them . Science (8 сентября 2020). Дата обращения: 1 июня 2021. Архивировано 15 октября 2020 года.
- ↑ Diana Kwon. More than 100 scientific journals have disappeared from the Internet . Nature (10 сентября 2020). Дата обращения: 1 июня 2021. Архивировано 3 октября 2020 года.
- ↑ avouner. Десятки научных журналов исчезли из интернета за последние 20 лет и никто их не сохранил . Хабр (10 сентября 2020). Дата обращения: 5 июня 2021. Архивировано 24 июня 2021 года.
- ↑ Camilla Hodgson. How the Internet Archive is waging war on misinformation . Financial Times (17 сентября 2019). Дата обращения: 3 июня 2021. Архивировано 28 июня 2021 года.
- ↑ Mary Kay Magistad. Where to find what's disappeared online, and a whole lot more: the Internet Archive . The World (23 февраля 2017). Дата обращения: 7 июня 2021. Архивировано 28 марта 2017 года.
- ↑ Acker, 2020.
- ↑ Wayback Machine теперь проверяет информацию на достоверность для архивных веб-страниц . Trash Box (2 ноября 2020). Дата обращения: 5 июня 2021. Архивировано 24 июня 2021 года.
- ↑ Журналисты припомнили расистские высказывания пресс-секретаря Минздрава США . Красная весна (24 апреля 2020). Дата обращения: 5 июня 2021. Архивировано 24 июня 2021 года.
- ↑ Did the Wayback Machine Catch Russian-Backed Rebels Claiming Responsibility for Malaysian Airlines Flight MH17? Open Culture (19 июля 2014). Дата обращения: 3 июня 2021. Архивировано 24 июня 2021 года.
- ↑ Jil Lepore. The Cobweb . New Yorker (19 января 2015). Дата обращения: 7 июня 2021. Архивировано 25 января 2015 года.
- ↑ Дамир Камалетдинов. В сеть попали секретные данные об американском ядерном оружии — военные записывали их в школьных приложениях . T Journal (30 мая 2021). Дата обращения: 5 июня 2021. Архивировано 24 июня 2021 года.
- ↑ Carolyn Wimbly Martin. Internet Archive’s Open Library and Copyright Law . Lutzker (15 мая 2020). Дата обращения: 4 июня 2021. Архивировано 24 июня 2021 года.
- ↑ Nate Anderson. Copy some webpages, owe more than the national debt . Ars Technica (1 мая 2011). Дата обращения: 5 июня 2021. Архивировано 24 июня 2021 года.
- ↑ Eric Bangeman. Internet Archive settles suit over Wayback Machine . Ars Technica (31 августа 2006). Дата обращения: 7 июня 2021. Архивировано 5 ноября 2007 года.
- ↑ Lisa M. Bowman. Net archive silences Scientology critic . C Net (24 сентября 2002). Дата обращения: 10 июня 2021.
- ↑ Ernest Miller. Features: Sherman, Set the Wayback Machine for Scientology . LawMeme (24 сентября 2002). Дата обращения: 10 июня 2021.
- ↑ Nora Caplan-Bricker. Preservation Acts . Harper's Magazine (декабрь 2018). Дата обращения: 2 июня 2021. Архивировано 5 мая 2021 года.
- ↑ Crudo, 2014.
- ↑ Mike Masnick. Russia Blocks The Internet Archive's Wayback Machine Over A Single Page . Tech dirt (26 июня 2015). Дата обращения: 3 июня 2021. Архивировано 4 июня 2021 года.
- ↑ Роскомнадзор заблокировал архив интернета из-за "Одиночного джихада" . Московский комсомолец (25 июня 2015). Дата обращения: 5 июня 2021. Архивировано 24 июня 2021 года.
- ↑ Роскомнадзор заблокировал страницу «архива интернета» за экстремизм . Lenta (25 июня 2015). Дата обращения: 5 июня 2021. Архивировано 22 сентября 2021 года.
- ↑ АЗАПИ хочет навечно заблокировать «Архив интернета» . Роскомсвобода (22 августа 2019). Дата обращения: 5 июня 2021. Архивировано 4 июня 2021 года.
- ↑ «Архив интернета» могут навечно заблокировать в России . C News (23 августа 2019). Дата обращения: 7 июня 2021. Архивировано 24 июня 2021 года.
- ↑ Россияне потребовали запретить в Европе Telegram, YouTube и Mail.ru . C News (19 августа 2020). Дата обращения: 7 июня 2021. Архивировано 24 июня 2021 года.
- ↑ Американские издатели книг подали в суд на Internet Archive . Ведомости (2 июня 2020). Дата обращения: 5 июня 2021. Архивировано 24 июня 2021 года.
- ↑ Access to Internet Archive’s Wayback Machine Blocked in India . The Wire (8 августа 2017). Дата обращения: 3 июня 2021. Архивировано 24 июня 2021 года.
- ↑ Wayback Machine has been blocked in India . The Verge (9 августа 2017). Дата обращения: 5 июня 2021. Архивировано 24 июня 2021 года.
- ↑ Kyrgyzstan Blocks Archive.org on ‘Extremism’ Grounds . Global Voices. Дата обращения: 5 июня 2021. Архивировано 18 мая 2021 года.
- ↑ Anna Kramer. The internet is splitting apart. The Internet Archive wants to save it all forever . Protocol (10 марта 2021). Дата обращения: 9 июня 2021. Архивировано 1 июня 2021 года.
Литература
- Acker, A., & Chaiet, M. The weaponization of web archives: Data craft and COVID-19 publics. // Harvard Kennedy School (HKS) Misinformation Review. — 2020. — doi:10.37016/mr-2020-41.
- Anat Ben-David, Adam Amram. The Internet Archive and the socio-technical construction of historical facts // Internet Histories. — 2018. — doi:10.1080/24701475.2018.1455412.
- Arora S., Li Y., Youtie J., Shapira P. Using the wayback machine to mine websites in the social sciences: A methodological resource. — 2015. — Т. 67, вып. 8. — С. 1904—1915. — doi:10.1002/asi.23503.
- Bowyer S. The Wayback Machine: notes on a re‑enchantment // Archival Science. — 2021. — Т. 21. — С. 43—57.
- Deborah R. Eltgroth. Best Evidence and the Wayback Machine: Toward a Workable Authentication Standard for Archived Internet Evidence // Fordham L. Rev.. — 2009. — Т. 78, вып. 181.
- Greg R. Notess. The Wayback Machine: The Web's Archive // Online. — 2002. — Т. 26, вып. 2.
- Hartelius J. The anxious flâneur: Digital archiving and the Wayback Machine // Quarterly Journal of Speech. — 2020. — Т. 106, вып. 4. — С. 377—398.
- James L. Quarles III and Richard A. Crudo. [Way]Back to the Future: Using the Wayback Machine in Patent Litigation // Landslide. — 2014. — Т. 6, вып. 3.
- Lerner A., Kohno T., Roesner F. Rewriting History: Changing the Archived Web from the Present // Association for Computing Machinery. — 2017. — doi:10.1145/3133956.3134042.
- Maemura E., Worby N., Milligan I., Becker C. If These Crawls Could Talk: Studying and Documenting Web Archives Provenance // Journal of the association for information science and technology. — 2018. — Т. 69, вып. 10. — С. 1223—1233.
- Milligan I. Lost in the Infinite Archive: The Promise and Pitfalls of Web Archives // International Journal of Humanities and Arts Computing. — 2016.
- Murphy J., Hashim N., O’Connor P. Take Me Back: Validating the Wayback Machine // Journal of Computer-Mediated Communication. — 2008. — Вып. 13. — С. 60—75.
- Odgen J., Halford S., Carr L. Observing Web Archives // WebSci. — 2017. — С. 299—308.
- Pearce D., Charlton B. Plagiarism of online material may be proven using the Internet Archive Wayback Machine (archive.org) // Medical Hypothesis. — 2009. — С. 875.
- Price. Internet Archiving – The Wayback machine // MLA Commons. — 2011.
- Phyllis Holman Weisbard. Oldies but Goodies: Archiving WebBased Information // Feminist Collections. — 2011. — Т. 32, вып. 2.
- Rogers R. Doing Web history with the Internet Archive: screencast documentaries // Internet Histories. — 2017. — Т. 1, вып. 1—2. — С. 160—172. — doi:10.1080/24701475.2017.1307542.
Шаблон:Кандидат в хорошие статьи