Wayback Machine: различия между версиями

Материал из in.wiki
Перейти к навигации Перейти к поиску
w>WikisaurusBot
м (добавление ш:wikidata-redirect согласно итогу)
w>Folcvine
(Удалено перенаправление на Архив Интернета#Проекты)
Строка 1: Строка 1:
#REDIRECT [[Архив Интернета#Проекты]]
+
{{редактирую | user=[[Служебная:Contributions/Folcvine|Folcvine]] | date=17 июня 2021  }}
{{wikidata-redirect}}
+
{{Сайт
 +
| название              = Wayback Machine
 +
| оригинальное название = Wayback Machine
 +
| логотип              = Wayback Machine logo 2010.svg
 +
| подпись              = Стартовая страница портала
 +
| url                  =
 +
| язык программирования = [[Java]], [[Python]]
 +
| расположение          =
 +
| владелец              = [[Архив Интернета]]
 +
| открыт                = 24 октября 2001
 +
}}
 +
 
 +
'''Wayback Machine''' ({{tr-en|Машина времени}}) — бесплатный онлайн-архив [[Некоммерческая организация|некоммерческой библиотеки]] [[Архив Интернета]]. С помощью [[Поисковый робот|поисковых роботов]] или ''веб-краулеров'' Wayback Machine архивирует и делает общедоступной бо́льшую часть «открытого» интернета{{sfn|Arora|2015}}. Сервис был запущен в 1996 году, однако стал доступен для общественности только в 2001-м. За первые 20 лет существования Wayback Machine каталогизировал и сохранил коллекцию из более чем 286 млрд веб-сайтов. Архивные снимки отображаются в формате [[HTML]], [[JavaScript]] и [[CSS]]{{sfn|Lerner|2017|с=1741—1755}}. Благодаря сохранённым в Wayback Machine документам пользователи могут отслеживать происходящие на сайтах изменения и сравнивать разные версии правок<ref name=Bryant>{{cite web
 +
|url=https://www.groovypost.com/explaier/what-is-the-wayback-machine-and-why-is-it-useful/
 +
|title=What is the Wayback Machine and Why is it Useful?
 +
|author=Michael Bryant
 +
|date=2021-04-22
 +
|publisher=Groovy Post
 +
|accessdate=2021-05-29}}
 +
</ref>.  На июнь 2021 года Wayback Machine предоставлял доступ к более чем 581 млрд сохранённым веб-страницам<ref name=web>{{cite web
 +
|url=https://archive.org/web/
 +
|title=Wayback Machine
 +
|publisher=Wayback Machine
 +
|accessdate=2021-06-07}}
 +
</ref>.
 +
 
 +
== Создание ==
 +
В 1989 году английский учёный [[Бернерс-Ли, Тим|Тим Бернерс-Ли]] создал [[всемирная паутина|всемирную паутину]] — систему, позволяющую передавать данные через подключённые к интернету компьютеры. Однако с распространением всемирной паутины были выявлены две основные проблемы. Первая состояла в нехватке мест для хранения всех данных, из-за чего многие документы и веб-страницы удалялись. Другая проблема заключалась в том, что после редактирования веб-страницы (например, по юридическим причинам), пользователи не могли посмотреть её изначальную версию. Решить эти недостатки стремилась американская цифровая библиотека  [[Архив Интернета]], — некоммерческая организация, созданная программистами [[Кейл, Брюстер|Брюстером Кейлом]] и {{iw|Галлиат, Брюс|Брюсом Галлиатом|en|Bruce Gilliat}} в 1996 году. При сотрудничестве с [[Alexa Internet]] ([[Дочернее общество|дочерней компанией]] [[Amazon]], занимающейся веб-индексированием) Архив инициировал создание и хранение копий существующих сайтов для развития «универсального доступа к знанию». Организация предоставляла [[открытый доступ|бесплатный публичный доступ]] к оцифрованным материалам, таким как веб-страницы, книги, аудиозаписи, включая живые концерты, видео, изображения и программное обеспечение. На 2021 год штаб-квартира Архива Интернета находится в [[Сан-Франциско]], в здании бывшей христианской церкви, расположенной в районе [[Ричмонд (район Сан-Франциско)|Ричмонд]]. Журналист местной радиостанции {{iw|Kawl|||}} в 2019 году сравнивал офис Архива с римским храмом<ref>{{cite web
 +
|url=https://theconversation.com/dominic-cummings-how-the-internet-knows-when-youve-updated-your-blog-139517
 +
|title=Dominic Cummings: how the internet knows when you’ve updated your blog
 +
|date=2020-05-28
 +
|publisher=The Conversation
 +
|accessdate=2021-06-03}}
 +
</ref>{{sfn|Odgen|2017}}<ref>{{cite web
 +
|url=https://www.kalw.org/show/crosscurrents/2019-09-11/in-an-old-church-the-internet-archive-stores-our-digital-history
 +
|title=In An Old Church, The Internet Archive Stores Our Digital History
 +
|date=2019-09-11
 +
|publisher=Kalw. San Francisco local public radio
 +
|accessdate=2021-06-03}}
 +
</ref>. Организация ставит перед собой цель спасти интернет от исчезновения{{sfn|Price|2011}}.
 +
 
 +
Wayback Machine стал самым известным проектом Архива. Онлайн-сервис был назван в честь машины времени из мультсериала 1960-х годов «[[Шоу Рокки и Буллвинкля]]». Он предоставляет доступ к цифровой коллекции из примерно 562 млрд веб-страниц<ref name=Bryant/><ref>{{cite web
 +
|url=https://www.theguardian.com/technology/2007/nov/19/archive.internet
 +
|title=The Time Machine
 +
|author=Jack Schofield
 +
|date=2007-11-19
 +
|publisher=The Guardian
 +
|accessdate=2021-06-01}}
 +
</ref><ref name=McKinnon>{{cite web
 +
|url=https://wpmudev.com/blog/archiving-with-wayback-machine/
 +
|title=Using the Wayback Machine to Archive (and Backup) WordPress
 +
|author=Jenni McKinnon
 +
|date=2017-05-25
 +
|publisher=WPMudev
 +
|accessdate=2021-05-29}}
 +
</ref>. Проект Wayback Machine был задуман как решение проблемы [[Ошибка 404|ошибки 404]], означающей, что сервер не может найти данные по запрошенному адресу. Это связано с так называемым [[вымирание ссылок|вымиранием ссылок]] — нарастающей недоступностью некогда опубликованных данных. Так, в 1997 году средняя продолжительность жизни веб-страницы составляла 44 дня. В 2003 году этот показатель составил 100 дней. Проведённый в 2008 году анализ ссылок на 2700 цифровых ресурсов, большинство из которых не имеют печатных аналогов, показал, что около 8 процентов ссылок переставали работать через год. К 2011 году, по прошествии трёх лет, 30 процентов ссылок в коллекции были мертвы<ref>{{cite web
 +
|url=https://www.theatlantic.com/technology/archive/2015/10/raiders-of-the-lost-web/409210/
 +
|title=Raiders of the Lost Web
 +
|author=Adrienne LaFrance
 +
|date=2015-10-14
 +
|publisher=The Atlantic
 +
|accessdate=2021-06-07}}
 +
</ref>. Благодаря интеграции с Alexa, столкнувшийся с сообщением об ошибке пользователь мог получить доступ к заархивированной версии страницы через внедрённую в браузер панель инструментов. Если копия недоступной страницы присутствовала в базе данных Wayback Machine, то загоралась специальная кнопка. При этом пользователи могли предоставить браузеру разрешение на просмотр и регистрацию активности — в таком случае все посещаемые сайты архивировались на портале{{sfn|Rogers|2017|с=160—172}}.
 +
 
 +
Wayback Machine был запущен в мае 1996 года, однако стал доступным для общественности только в 2001-м — до этого вся записанная на цифровых магнитных лентах информация была открыта только для ограниченного числа учёных и исследователей{{sfn|Hartelius|2020|c=378}}. К моменту «открытия» архив содержал более 10 млрд заархивированных страниц<ref name=Bryant/>. К декабрю 2014 года руководство Wayback Machine сообщило, что сохранило 435 млрд веб-страниц по всему миру{{sfn|Arora|2015}}. С технической точки зрения программное обеспечение Wayback Machine не является архивом, а скорее общедоступным интерфейсом к ограниченному подмножеству всех хранилищ{{sfn|Bowyer|2021|с=43—57}}. Так, Wayback Machine нельзя считать поисковой системой коллекции организации, так как она не осуществляет поиск по базе данных другой крупной виртуальной библиотеки — [[Open Library]], позволяющей пользователям бесплатно получать доступ к цифровым копиям книг, которые загружаются и архивируются в рамках проекта<ref name=Vox>{{cite web
 +
|url=https://www.vox.com/2020/6/23/21293875/internet-archive-website-lawsuit-open-library-wayback-machine-controversy-copyright
 +
|title=A lawsuit is threatening the Internet Archive — but it’s not as dire as you may have heard
 +
|author=Aja Romano
 +
|date=2020-01-23
 +
|publisher=Vox
 +
|accessdate=2021-05-29}}
 +
</ref><ref name=Forbes>{{cite web
 +
|url=https://www.forbes.com/sites/kalevleetaru/2016/01/18/the-internet-archive-turns-20-a-behind-the-scenes-look-at-archiving-the-web/?sh=533ba6e282e0
 +
|title=The Internet Archive Turns 20: A Behind The Scenes Look At Archiving The Web
 +
|author=Kalev Leetaru
 +
|date=2016-01-18
 +
|publisher=Forbes
 +
|accessdate=2021-06-05}}
 +
</ref>.
 +
 
 +
== Примечания ==
 +
{{Примечания|}}
 +
 
 +
== Литература ==
 +
{{refbegin|2}}
 +
* {{статья
 +
|автор=Acker, A., & Chaiet, M.
 +
|заглавие=The weaponization of web archives: Data craft and COVID-19 publics.
 +
|издание=Harvard Kennedy School (HKS) Misinformation Review
 +
|doi=10.37016/mr-2020-41
 +
|ref=Acker
 +
|ссылка=https://misinforeview.hks.harvard.edu/article/the-weaponization-of-web-archives-data-craft-and-covid-19-publics/}}
 +
* {{статья
 +
|автор=Anat Ben-David, Adam Amram
 +
|заглавие=The Internet Archive and the socio-technical construction of historical facts
 +
|издание=Internet Histories
 +
|год=2018
 +
|doi=10.1080/24701475.2018.1455412
 +
|ref=Ben-David}}
 +
* {{статья
 +
|автор=Arora S., Li Y., Youtie J., Shapira P.
 +
|заглавие=Using the wayback machine to mine websites in the social sciences: A methodological resource
 +
|год=2015
 +
|doi=10.1002/asi.23503
 +
|том=67
 +
|выпуск=8
 +
|страницы=1904—1915
 +
|ref=Arora}}
 +
* {{статья
 +
|автор=Bowyer S.
 +
|заглавие=The Wayback Machine: notes on a re‑enchantment
 +
|издание=Archival Science
 +
|год=2021
 +
|том=21
 +
|страницы=43—57
 +
|ref=Bowyer}}
 +
* {{статья
 +
|автор=Deborah R. Eltgroth
 +
|заглавие=Best Evidence and the Wayback Machine: Toward a Workable Authentication Standard for Archived Internet Evidence
 +
|том=78
 +
|издание=Fordham L. Rev.
 +
|выпуск=181
 +
|год=2009
 +
|ссылка=https://ir.lawnet.fordham.edu/flr/vol78/iss1/5
 +
|ref=Eltgroth}}
 +
* {{статья
 +
|автор=Greg R. Notess
 +
|заглавие=The Wayback Machine: The Web's Archive
 +
|издание=Online
 +
|год=2002
 +
|том=26
 +
|выпуск=2
 +
|ссылка=https://www.infotoday.com/online/mar02/OnTheNet.htm
 +
|ref=Notess}}
 +
* {{статья
 +
|автор= Hartelius  J.
 +
|заглавие=The anxious flâneur: Digital archiving and the Wayback Machine
 +
|издание=Quarterly Journal of Speech
 +
|том=106
 +
|год=2020
 +
|выпуск=4
 +
|страницы=377—398
 +
|ref=Hartelius}}
 +
* {{статья
 +
|автор=James L. Quarles III and Richard A. Crudo
 +
|заглавие=[Way]Back to the Future: Using the Wayback Machine in Patent Litigation
 +
|издание= Landslide
 +
|том=6
 +
|выпуск=3
 +
|год=2014
 +
|ref=Crudo}}
 +
* {{статья
 +
|автор=Lerner A., Kohno T., Roesner F.
 +
|заглавие=Rewriting History: Changing the Archived Web from the Present
 +
|издание=Association for Computing Machinery
 +
|год=2017
 +
|doi=10.1145/3133956.3134042
 +
|ref=Lerner
 +
|ссылка=https://acmccs.github.io/papers/p1741-lernerAT3.pdf}}
 +
* {{статья
 +
|автор=Maemura E., Worby N., Milligan I., Becker C.
 +
|заглавие=If These Crawls Could Talk: Studying and Documenting Web Archives Provenance
 +
|издание=Journal of the association for information science and technology
 +
|год=2018
 +
|том=69
 +
|выпуск=10
 +
|страницы=1223—1233
 +
|ref=Maemura}}
 +
* {{статья
 +
|автор=Milligan I.
 +
|заглавие=Lost in the Infinite Archive: The Promise and Pitfalls of Web Archives
 +
|издание=International Journal of Humanities and Arts Computing
 +
|год=2016
 +
|ref=Milligan}}
 +
* {{статья
 +
|автор= Murphy J., Hashim N.,  O’Connor P.
 +
|заглавие=Take Me Back: Validating the Wayback Machine
 +
|издание=Journal of Computer-Mediated Communication
 +
|выпуск=13
 +
|год=2008
 +
|страницы=60—75
 +
|ref=O’Connor}}
 +
* {{статья
 +
|автор=Odgen J., Halford S., Carr L.
 +
|заглавие=Observing Web Archives
 +
|издание=WebSci
 +
|год=2017
 +
|страницы=299—308
 +
|ref=Odgen}}
 +
* {{статья
 +
|автор= Pearce D.,  Charlton B.
 +
|заглавие=Plagiarism of online material may be proven using the Internet Archive Wayback Machine (archive.org)
 +
|издание=Medical Hypothesis
 +
|год=2009
 +
|страницы=875
 +
|ref=Pearce}}
 +
* {{статья
 +
|автор=Price
 +
|заглавие=Internet Archiving – The Wayback machine
 +
|издание=MLA Commons
 +
|ссылка=https://mla.hcommons.org/deposits/item/hc:16755/
 +
|год=2011
 +
|ref=Price}}
 +
* {{статья
 +
|автор=Phyllis Holman Weisbard
 +
|заглавие=Oldies but Goodies: Archiving WebBased Information
 +
|издание= Feminist Collections
 +
|том=32
 +
|выпуск=2
 +
|год=2011
 +
|ref=Weisbard}}
 +
* {{статья
 +
|автор=Rogers R.
 +
|заглавие=Doing Web history with the Internet Archive: screencast documentaries
 +
|издание=Internet Histories
 +
|год=2017
 +
|страницы=160—172
 +
|том=1
 +
|выпуск=1—2
 +
|doi=10.1080/24701475.2017.1307542
 +
|ref=Rogers}}
 +
{{refend}}
 +
 
 +
[[Категория:История Интернета]]
 +
[[Категория:Сайты, появившиеся в 1996 году]]
 +
[[Категория:Открытый доступ]]

Версия от 12:56, 17 июня 2021

Шаблон:Редактирую

Wayback Machine
Wayback Machine logo 2010.svg
Владелец::
Архив Интернета
Начало работы::
24 октября 2001

Wayback Machine (с англ. — «Машина времени») — бесплатный онлайн-архив некоммерческой библиотеки Архив Интернета. С помощью поисковых роботов или веб-краулеров Wayback Machine архивирует и делает общедоступной бо́льшую часть «открытого» интернета[1]. Сервис был запущен в 1996 году, однако стал доступен для общественности только в 2001-м. За первые 20 лет существования Wayback Machine каталогизировал и сохранил коллекцию из более чем 286 млрд веб-сайтов. Архивные снимки отображаются в формате HTML, JavaScript и CSS[2]. Благодаря сохранённым в Wayback Machine документам пользователи могут отслеживать происходящие на сайтах изменения и сравнивать разные версии правок[3]. На июнь 2021 года Wayback Machine предоставлял доступ к более чем 581 млрд сохранённым веб-страницам[4].

Создание

В 1989 году английский учёный Тим Бернерс-Ли создал всемирную паутину — систему, позволяющую передавать данные через подключённые к интернету компьютеры. Однако с распространением всемирной паутины были выявлены две основные проблемы. Первая состояла в нехватке мест для хранения всех данных, из-за чего многие документы и веб-страницы удалялись. Другая проблема заключалась в том, что после редактирования веб-страницы (например, по юридическим причинам), пользователи не могли посмотреть её изначальную версию. Решить эти недостатки стремилась американская цифровая библиотека Архив Интернета, — некоммерческая организация, созданная программистами Брюстером Кейлом и Брюсом Галлиатом[англ.] в 1996 году. При сотрудничестве с Alexa Internet (дочерней компанией Amazon, занимающейся веб-индексированием) Архив инициировал создание и хранение копий существующих сайтов для развития «универсального доступа к знанию». Организация предоставляла бесплатный публичный доступ к оцифрованным материалам, таким как веб-страницы, книги, аудиозаписи, включая живые концерты, видео, изображения и программное обеспечение. На 2021 год штаб-квартира Архива Интернета находится в Сан-Франциско, в здании бывшей христианской церкви, расположенной в районе Ричмонд. Журналист местной радиостанции Kawl[англ.] в 2019 году сравнивал офис Архива с римским храмом[5][6][7]. Организация ставит перед собой цель спасти интернет от исчезновения[8].

Wayback Machine стал самым известным проектом Архива. Онлайн-сервис был назван в честь машины времени из мультсериала 1960-х годов «Шоу Рокки и Буллвинкля». Он предоставляет доступ к цифровой коллекции из примерно 562 млрд веб-страниц[3][9][10]. Проект Wayback Machine был задуман как решение проблемы ошибки 404, означающей, что сервер не может найти данные по запрошенному адресу. Это связано с так называемым вымиранием ссылок — нарастающей недоступностью некогда опубликованных данных. Так, в 1997 году средняя продолжительность жизни веб-страницы составляла 44 дня. В 2003 году этот показатель составил 100 дней. Проведённый в 2008 году анализ ссылок на 2700 цифровых ресурсов, большинство из которых не имеют печатных аналогов, показал, что около 8 процентов ссылок переставали работать через год. К 2011 году, по прошествии трёх лет, 30 процентов ссылок в коллекции были мертвы[11]. Благодаря интеграции с Alexa, столкнувшийся с сообщением об ошибке пользователь мог получить доступ к заархивированной версии страницы через внедрённую в браузер панель инструментов. Если копия недоступной страницы присутствовала в базе данных Wayback Machine, то загоралась специальная кнопка. При этом пользователи могли предоставить браузеру разрешение на просмотр и регистрацию активности — в таком случае все посещаемые сайты архивировались на портале[12].

Wayback Machine был запущен в мае 1996 года, однако стал доступным для общественности только в 2001-м — до этого вся записанная на цифровых магнитных лентах информация была открыта только для ограниченного числа учёных и исследователей[13]. К моменту «открытия» архив содержал более 10 млрд заархивированных страниц[3]. К декабрю 2014 года руководство Wayback Machine сообщило, что сохранило 435 млрд веб-страниц по всему миру[1]. С технической точки зрения программное обеспечение Wayback Machine не является архивом, а скорее общедоступным интерфейсом к ограниченному подмножеству всех хранилищ[14]. Так, Wayback Machine нельзя считать поисковой системой коллекции организации, так как она не осуществляет поиск по базе данных другой крупной виртуальной библиотеки — Open Library, позволяющей пользователям бесплатно получать доступ к цифровым копиям книг, которые загружаются и архивируются в рамках проекта[15][16].

Примечания

  1. 1,0 1,1 Arora, 2015.
  2. Lerner, 2017, с. 1741—1755.
  3. 3,0 3,1 3,2 Michael Bryant. What is the Wayback Machine and Why is it Useful? Groovy Post (22 апреля 2021). Дата обращения: 29 мая 2021.
  4. Wayback Machine. Wayback Machine. Дата обращения: 7 июня 2021.
  5. Dominic Cummings: how the internet knows when you’ve updated your blog. The Conversation (28 мая 2020). Дата обращения: 3 июня 2021.
  6. Odgen, 2017.
  7. In An Old Church, The Internet Archive Stores Our Digital History. Kalw. San Francisco local public radio (11 сентября 2019). Дата обращения: 3 июня 2021.
  8. Price, 2011.
  9. Jack Schofield. The Time Machine. The Guardian (19 ноября 2007). Дата обращения: 1 июня 2021.
  10. Jenni McKinnon. Using the Wayback Machine to Archive (and Backup) WordPress. WPMudev (25 мая 2017). Дата обращения: 29 мая 2021.
  11. Adrienne LaFrance. Raiders of the Lost Web. The Atlantic (14 октября 2015). Дата обращения: 7 июня 2021.
  12. Rogers, 2017, с. 160—172.
  13. Hartelius, 2020, с. 378.
  14. Bowyer, 2021, с. 43—57.
  15. Aja Romano. A lawsuit is threatening the Internet Archive — but it’s not as dire as you may have heard. Vox (23 января 2020). Дата обращения: 29 мая 2021.
  16. Kalev Leetaru. The Internet Archive Turns 20: A Behind The Scenes Look At Archiving The Web. Forbes (18 января 2016). Дата обращения: 5 июня 2021.

Литература

  • Acker, A., & Chaiet, M. The weaponization of web archives: Data craft and COVID-19 publics. // Harvard Kennedy School (HKS) Misinformation Review. — doi:10.37016/mr-2020-41.
  • Anat Ben-David, Adam Amram. The Internet Archive and the socio-technical construction of historical facts // Internet Histories. — 2018. — doi:10.1080/24701475.2018.1455412.
  • Arora S., Li Y., Youtie J., Shapira P. Using the wayback machine to mine websites in the social sciences: A methodological resource. — 2015. — Т. 67, вып. 8. — С. 1904—1915. — doi:10.1002/asi.23503.
  • Bowyer S. The Wayback Machine: notes on a re‑enchantment // Archival Science. — 2021. — Т. 21. — С. 43—57.
  • Deborah R. Eltgroth. Best Evidence and the Wayback Machine: Toward a Workable Authentication Standard for Archived Internet Evidence // Fordham L. Rev.. — 2009. — Т. 78, вып. 181.
  • Greg R. Notess. The Wayback Machine: The Web's Archive // Online. — 2002. — Т. 26, вып. 2.
  • Hartelius J. The anxious flâneur: Digital archiving and the Wayback Machine // Quarterly Journal of Speech. — 2020. — Т. 106, вып. 4. — С. 377—398.
  • James L. Quarles III and Richard A. Crudo. [Way]Back to the Future: Using the Wayback Machine in Patent Litigation // Landslide. — 2014. — Т. 6, вып. 3.
  • Lerner A., Kohno T., Roesner F. Rewriting History: Changing the Archived Web from the Present // Association for Computing Machinery. — 2017. — doi:10.1145/3133956.3134042.
  • Maemura E., Worby N., Milligan I., Becker C. If These Crawls Could Talk: Studying and Documenting Web Archives Provenance // Journal of the association for information science and technology. — 2018. — Т. 69, вып. 10. — С. 1223—1233.
  • Milligan I. Lost in the Infinite Archive: The Promise and Pitfalls of Web Archives // International Journal of Humanities and Arts Computing. — 2016.
  • Murphy J., Hashim N., O’Connor P. Take Me Back: Validating the Wayback Machine // Journal of Computer-Mediated Communication. — 2008. — Вып. 13. — С. 60—75.
  • Odgen J., Halford S., Carr L. Observing Web Archives // WebSci. — 2017. — С. 299—308.
  • Pearce D., Charlton B. Plagiarism of online material may be proven using the Internet Archive Wayback Machine (archive.org) // Medical Hypothesis. — 2009. — С. 875.
  • Price. Internet Archiving – The Wayback machine // MLA Commons. — 2011.
  • Phyllis Holman Weisbard. Oldies but Goodies: Archiving WebBased Information // Feminist Collections. — 2011. — Т. 32, вып. 2.
  • Rogers R. Doing Web history with the Internet Archive: screencast documentaries // Internet Histories. — 2017. — Т. 1, вып. 1—2. — С. 160—172. — doi:10.1080/24701475.2017.1307542.