Британская библиотека создаст архив всех местных сайтов
Изображение с сайта UK Web Archive
Британская библиотека объявила о запуске проекта по архивированию всех сайтов страны, сообщает 4 апреля портал The Verge. Проект будет запущен 5 апреля.
Архивированию будут подвергнуты все сайты, относящиеся к доменной зоне .uk. На сегодняшний день в этой доменной зоне зарегистрировано 4,8 миллиона сайтов, содержащих около миллиарда веб-страниц. Архив, по словам директора библиотеки Люси Берджесс (Lucie Burgess), будет доступен уже к концу 2013 года.
Как сообщает Associated Press, в будущем большинство сайтов будут архивироваться ежегодно, а самые часто обновляющиеся страницы — газеты, популярные блоги и новостные издания — будут архивироваться каждый день.
Целью проекта является, по словам Люси Берждесс, «создание картины 21 века». «Если мы не сохраним этот материал, очень важная часть нашего видения 21 века будет утрачена», — заявила директор библиотеки.
Как пишет The Verge, Британская библиотека начала проект UK Web Archive, посвященный архивированию сайтов, еще в 2004 году. Однако до настоящего времени его развитие шло очень медленно, поскольку библиотека, как правило, запрашивала у владельцев сайта разрешение на включение контента в архив. Теперь для ускорения работы авторы проекта отказались от идеи запросов, что позволит опубликовать архив к концу 2013 года.
В настоящее время существует еще один подобный проект, Internet Archive, созданный в 1996 году в Сан-Франциско Брюстером Кейлом (Brewster Kahle). Входящая в состав архива коллекция веб-страниц Wayback Machine по данным на март 2013 года содержит более 150 миллиардов веб-страниц и занимает более 2 петабайт данных. Помимо этого, проект Internet Archive хранит также программное обеспечение, графические материалы, видео- и аудиозаписи и книги.