Изменения
Перейти к навигации
Перейти к поиску
Строка 31:
Строка 31:
− +
− [[Файл:Internet Archive mirror servers - Bibliotheca Alexandrina.jpg|thumb|250px|right|Серверы «Архива Интернета», 2008 год]]+
− [[Файл:Brewster Kahle 2009.jpg|thumb|250px|right|[[Кейл, Брюстер|Брюстер Кейл]] в 2009 году]]
− В [[1989 год]]у английский учёный [[Бернерс-Ли, Тим|Тим Бернерс-Ли]] создал [[всемирная паутина|всемирную паутину]] — систему, позволяющую передавать данные через подключённые к интернету компьютеры. Однако с распространением всемирной паутины были выявлены две основные проблемы. Первая состояла в нехватке мест для хранения всех данных, из-за чего многие документы и веб-страницы удалялись. Другая проблема заключалась в том, что после редактирования веб-страницы (например, по юридическим причинам) пользователи не могли посмотреть её изначальную версию. Решить эти недостатки стремилась американская цифровая библиотека «[[Архив Интернета]]» — некоммерческая организация, созданная программистами [[Кейл, Брюстер|Брюстером Кейлом]] и {{iw|Галлиат, Брюс|Брюсом Галлиатом|en|Bruce Gilliat}} в 1996 году. При сотрудничестве с [[Alexa Internet]] ([[Дочернее общество|дочерней компанией]] [[Amazon]], занимающейся веб-индексированием) «Архив» инициировал создание и хранение копий существующих сайтов для развития «универсального доступа к знанию». Организация предоставляла [[открытый доступ|бесплатный публичный доступ]] к оцифрованным материалам, таким как веб-страницы, книги, аудиозаписи, включая живые концерты, видео, изображения и программное обеспечение. На 2021 год штаб-квартира «[[Архив Интернета|Архива Интернета]]» находится в [[Сан-Франциско]], в здании бывшей христианской церкви, расположенной в районе [[Ричмонд (район Сан-Франциско)|Ричмонд]]. Журналист местной радиостанции {{iw|Kawl|||}} в 2019 году сравнивал офис «Архива» с римским храмом<ref>{{cite web+
− |url=https://theconversation.com/dominic-cummings-how-the-internet-knows-when-youve-updated-your-blog-139517
− |title=Dominic Cummings: how the internet knows when you’ve updated your blog
− |date=2020-05-28
− |publisher=The Conversation
− |accessdate=2021-06-03
− |lang=en
− |archive-date=2021-07-25
− |archive-url=https://web.archive.org/web/20210725222234/https://theconversation.com/dominic-cummings-how-the-internet-knows-when-youve-updated-your-blog-139517
− |deadlink=no
− }}</ref>{{sfn|Odgen|2017}}<ref>{{cite web
− |url=https://www.kalw.org/show/crosscurrents/2019-09-11/in-an-old-church-the-internet-archive-stores-our-digital-history
− |title=In An Old Church, The Internet Archive Stores Our Digital History
− |date=2019-09-11
− |publisher=Kalw. San Francisco local public radio
− |accessdate=2021-06-03
− |lang=en
− |archive-date=2021-05-06
− |archive-url=https://web.archive.org/web/20210506120243/https://www.kalw.org/show/crosscurrents/2019-09-11/in-an-old-church-the-internet-archive-stores-our-digital-history
− |deadlink=no
− }}</ref>. Организация ставит перед собой цель спасти интернет от исчезновения{{sfn|Price|2011}}.
− Wayback Machine стал самым известным проектом «Архива». Онлайн-сервис был назван в честь машины времени из мультсериала 1960-х годов «[[Шоу Рокки и Буллвинкля]]». Он предоставляет доступ к цифровой коллекции из более чем 550 млрд веб-страниц<ref name=Bryant/><ref>{{cite web+
− |url=https://www.theguardian.com/technology/2007/nov/19/archive.internet
− |title=The Time Machine
− |author=Jack Schofield
− |date=2007-11-19
− |publisher=The Guardian
− |accessdate=2021-06-01
− |lang=en
− |archive-date=2021-04-19
− |archive-url=https://web.archive.org/web/20210419133845/https://www.theguardian.com/technology/2007/nov/19/archive.internet
− |deadlink=no
− }}</ref><ref name=McKinnon>{{cite web
− |url=https://wpmudev.com/blog/archiving-with-wayback-machine/
− |title=Using the Wayback Machine to Archive (and Backup) WordPress
− |author=Jenni McKinnon
− |date=2017-05-25
− |publisher=WPMudev
− |accessdate=2021-05-29
− |lang=en
− |archive-date=2021-04-13
− |archive-url=https://web.archive.org/web/20210413234350/https://wpmudev.com/blog/archiving-with-wayback-machine/
− |deadlink=no
− }}</ref>. Проект Wayback Machine был задуман как решение проблемы [[Ошибка 404|ошибки 404]], означающей, что сервер не может найти данные по запрошенному адресу. Это связано с так называемым [[вымирание ссылок|вымиранием ссылок]] — нарастающей недоступностью некогда опубликованных данных. Так, в 1997 году средняя продолжительность жизни веб-страницы составляла 44 дня. В 2003 году этот показатель составил 100 дней. Проведённый в 2008 году анализ ссылок на 2700 цифровых ресурсов, большинство из которых не имеет печатных аналогов, показал, что около 8 процентов ссылок переставали работать через год. К 2011 году, по прошествии трёх лет, 30 процентов ссылок в коллекции были неработающими<ref>{{cite web
− |url=https://www.theatlantic.com/technology/archive/2015/10/raiders-of-the-lost-web/409210/
− |title=Raiders of the Lost Web
− |author=Adrienne LaFrance
− |date=2015-10-14
− |publisher=The Atlantic
− |accessdate=2021-06-07
− |lang=en
− |archive-date=2017-05-07
− |archive-url=https://web.archive.org/web/20170507173716/https://www.theatlantic.com/technology/archive/2015/10/raiders-of-the-lost-web/409210/
− |deadlink=no
− }}</ref>. Благодаря интеграции с Alexa, столкнувшийся с сообщением об ошибке пользователь мог получить доступ к заархивированной версии страницы через внедрённую в браузер панель инструментов. Если копия недоступной страницы присутствовала в базе данных Wayback Machine, то загоралась специальная кнопка. При этом пользователи могли предоставить браузеру разрешение на просмотр и регистрацию активности — в таком случае все посещаемые сайты архивировались на портале{{sfn|Rogers|2017|pp=160—172}}.
−
−
− |url=https://www.vox.com/2020/6/23/21293875/internet-archive-website-lawsuit-open-library-wayback-machine-controversy-copyright
− |title=A lawsuit is threatening the Internet Archive — but it’s not as dire as you may have heard
− |author=Aja Romano
− |date=2020-01-23
− |publisher=Vox
− |accessdate=2021-05-29
− |lang=en
− |archive-date=2021-08-18
− |archive-url=https://web.archive.org/web/20210818211013/https://www.vox.com/2020/6/23/21293875/internet-archive-website-lawsuit-open-library-wayback-machine-controversy-copyright
− |deadlink=no
− }}</ref><ref name=Forbes>{{cite web
− |url=https://www.forbes.com/sites/kalevleetaru/2016/01/18/the-internet-archive-turns-20-a-behind-the-scenes-look-at-archiving-the-web/?sh=533ba6e282e0
− |title=The Internet Archive Turns 20: A Behind The Scenes Look At Archiving The Web
− |author=Kalev Leetaru
− |date=2016-01-18
− |publisher=Forbes
− |accessdate=2021-06-05
− |lang=en
− |archive-date=2021-08-15
− |archive-url=https://web.archive.org/web/20210815171017/https://www.forbes.com/sites/kalevleetaru/2016/01/18/the-internet-archive-turns-20-a-behind-the-scenes-look-at-archiving-the-web/?sh=533ba6e282e0
− |deadlink=no
− }}</ref>.
− +
Строка 182:
Строка 104:
− +
нет описания правки
</ref>.
</ref>.
== Создание ==
== Создани ==
В английский учёный создал — систему, позволяющую передавать данные через подключённые к интернету компьютеры. Однако с распространением всемирной паутины были выявлены две основные проблемы. Первая состояла в нехватке мест для хранения всех данных, из-за чего многие документы и веб-страницы удалялись. Другая проблема заключалась в том, что после редактирования веб-страницы (например, по юридическим причинам) пользователи не могли посмотреть её изначальную версию. Решить эти недостатки стремилась американская цифровая библиотека «» — некоммерческая организация, созданная программистами и в 1996 году. При сотрудничестве с ( , занимающейся веб-индексированием) «Архив» инициировал создание и хранение копий существующих сайтов для развития «универсального доступа к знанию». Организация предоставляла к оцифрованным материалам, таким как веб-страницы, книги, аудиозаписи, включая живые концерты, видео, изображения и программное обеспечение. На 2021 год штаб-квартира «» находится в , в здании бывшей христианской церкви, расположенной в районе . Журналист местной радиостанции в 2019 году сравнивал офис «Архива» с римским храмо. Организация ставит перед собой цель спасти интернет от исчезновени.
Wayback Machine стал самым известным проектом «Архива». Онлайн-сервис был назван в честь машины времени из мультсериала 1960-х годов «». Он предоставляет доступ к цифровой коллекции из более чем 550 млрд веб-страни. Проект Wayback Machine был задуман как решение проблемы , означающей, что сервер не может найти данные по запрошенному адресу. Это связано с так называемым — нарастающей недоступностью некогда опубликованных данных. Так, в 1997 году средняя продолжительность жизни веб-страницы составляла 44 дня. В 2003 году этот показатель составил 100 дней. Проведённый в 2008 году анализ ссылок на 2700 цифровых ресурсов, большинство из которых не имеет печатных аналогов, показал, что около 8 процентов ссылок переставали работать через год. К 2011 году, по прошествии трёх лет, 30 процентов ссылок в коллекции были неработающим. Благодаря интеграции с Alexa, столкнувшийся с сообщением об ошибке пользователь мог получить доступ к заархивированной версии страницы через внедрённую в браузер панель инструментов. Если копия недоступной страницы присутствовала в базе данных Wayback Machine, то загоралась специальная кнопка. При этом пользователи могли предоставить браузеру разрешение на просмотр и регистрацию активности — в таком случае все посещаемые сайты архивировались на портал.
Wayback Machine был запущен в мае 1996 года, однако стал доступным для общественности только в 2001-м — до этого вся записанная на цифровых магнитных лентах информация была открыта только для ограниченного числа учёных и исследователе. К моменту «открытия» архив содержал более 10 млрд заархивированных страни. К декабрю 2014 года руководство Wayback Machine сообщило, что сохранило 435 млрд веб-страниц по всему мир. С технической точки зрения программное обеспечение Wayback Machine не является архивом, а скорее общедоступным интерфейсом к ограниченному подмножеству всех хранили. Так, Wayback Machine нельзя считать поисковой системой коллекции организации, так как она не осуществляет поиск по базе данных другой крупной виртуальной библиотеки — , позволяющей пользователям бесплатно получать доступ к цифровым копиям книг, которые загружаются и архивируются в рамках проект.
Wayback Machine был запущен в мае 1996 года, однако стал доступным для общественности только в 2001-м — до этого вся записанная на цифровых магнитных лентах информация была открыта только для ограниченного числа учёных и исследователей{{sfn|Hartelius|2020|p=378}}. К моменту «открытия» архив содержал более 10 млрд заархивированных страниц<ref name=Bryant/>. К декабрю 2014 года руководство Wayback Machine сообщило, что сохранило 435 млрд веб-страниц по всему миру{{sfn|Arora|2015}}. С технической точки зрения программное обеспечение Wayback Machine не является архивом, а скорее общедоступным интерфейсом к ограниченному подмножеству всех хранилищ{{sfn|Bowyer|2021|pp=43—57}}. Так, Wayback Machine нельзя считать поисковой системой коллекции организации, так как она не осуществляет поиск по базе данных другой крупной виртуальной библиотеки — [[Open Library]], позволяющей пользователям бесплатно получать доступ к цифровым копиям книг, которые загружаются и архивируются в рамках проекта<ref name=Vox>{{cite web
== Характеристика ==
== Характеристика ==
С запуском Wayback Machine «Архив Интернета» стал одним из самых популярных и узнаваемых онлайн-порталов и главным сервисом [[Архивирование веб-сайтов|веб-архивирования]]<ref name=Bryant/>{{sfn|Price|2011}}. В 1999 году «Архив» начал расширять коллекцию за пределы архивного веб-контента, чтобы обеспечить статус как к оцифрованным, так и изначально цифровым ресурсам, в том числе книгам, аудио, фильмам, изображениям, документам, программному обеспечению и видеоиграм{{sfn|Odgen|2017}}. Некоторые сканирования выполняются поисковыми роботами самого архива, а другие — партнёрскими организациями. Отдельные базы данных могут приобретаться за счёт пожертвований пользователей и целевых приобретений<ref name=Forbes/>. Сами создатели организации сравнивали свою коллекцию с [[Александрийская библиотека|Александрийской библиотекой]]{{sfn|Odgen|2017}}. На 2021 год Wayback Machine содержал более 424 млрд веб-страниц{{sfn|Bowyer|2021|pp=43—57}} — больше, чем документов в [[Библиотека Конгресса|Библиотеке Конгресса]]{{sfn|O'Connor|2008|p=64}}{{sfn|Odgen|2017}}<ref name=Forbes />.
С запуском Wayback Machine «Архив Интернета» стал одним из самых популярных и узнаваемых онлайн-порталов и главным сервисом [[Архивирование веб-сайтов|веб-архивирования]]<ref name=Bryant/>{{sfn|Price|2011}}. В 1999 году «Архив» начал расширять коллекцию за пределы архивного веб-контента, чтобы обеспечить статус как к оцифрованным, так и изначально цифровым ресурсам, в том числе книгам, аудио, фильмам, изображениям, документам, программному обеспечению и видеоиграм{{sfn|Odgen|2017}}. Некоторые сканирования выполняются поисковыми роботами самого архива, а другие — партнёрскими организациями. Отдельные базы данных могут приобретаться за счёт пожертвований пользователей и целевых приобретений<ref name="Forbes">{{cite web|lang=en|url=https://www.forbes.com/sites/kalevleetaru/2016/01/18/the-internet-archive-turns-20-a-behind-the-scenes-look-at-archiving-the-web/?sh=533ba6e282e0|title=The Internet Archive Turns 20: A Behind The Scenes Look At Archiving The Web|author=Kalev Leetaru|date=2016-01-18|publisher=Forbes|archive-url=https://web.archive.org/web/20210815171017/https://www.forbes.com/sites/kalevleetaru/2016/01/18/the-internet-archive-turns-20-a-behind-the-scenes-look-at-archiving-the-web/?sh=533ba6e282e0|archive-date=2021-08-15|accessdate=2021-06-05|deadlink=no}}</ref>. Сами создатели организации сравнивали свою коллекцию с [[Александрийская библиотека|Александрийской библиотекой]]{{sfn|Odgen|2017}}. На 2021 год Wayback Machine содержал более 424 млрд веб-страниц{{sfn|Bowyer|2021|pp=43—57}} — больше, чем документов в [[Библиотека Конгресса|Библиотеке Конгресса]]{{sfn|O'Connor|2008|p=64}}{{sfn|Odgen|2017}}<ref name=Forbes />.
== Принцип работы ==
== Принцип работы ==
|accessdate=2021-06-05
|accessdate=2021-06-05
|lang=en}}
|lang=en}}
</ref>. Помимо этого, каждый пользователь может использовать специальную форму на портале и вызвать краулер, который сохранит страницу в текущем состоянии{{sfn|Lerner|2017|pp=1741—1755}}. Wayback Machine сканирует только общедоступные веб-страницы и не может получить доступ к контенту, защищённому паролем или расположенному на частном сервере<ref name=McKinnon/>{{sfn|Bowyer|2021|pp=43—57}}<ref name=Bryant/>.
</ref>. Помимо этого, каждый пользователь может использовать специальную форму на портале и вызвать краулер, который сохранит страницу в текущем состоянии{{sfn|Lerner|2017|pp=1741—1755}}. Wayback Machine сканирует только общедоступные веб-страницы и не может получить доступ к контенту, защищённому паролем или расположенному на частном сервере<ref name="McKinnon">{{cite web|lang=en|url=https://wpmudev.com/blog/archiving-with-wayback-machine/|title=Using the Wayback Machine to Archive (and Backup) WordPress|author=Jenni McKinnon|date=2017-05-25|publisher=WPMudev|archive-url=https://web.archive.org/web/20210413234350/https://wpmudev.com/blog/archiving-with-wayback-machine/|archive-date=2021-04-13|accessdate=2021-05-29|deadlink=no}}</ref>{{sfn|Bowyer|2021|pp=43—57}}<ref name=Bryant/>.
=== Интерфейс ===
=== Интерфейс ===