Форум Рідного Міста

Архів WWW

Андрій Пелещишин - 27-10-2004 у 21:13

Може комусь це видасться банальним, але напишу пару слів про архів WWW.
Кілька раз за останній час стикався з тим, що навіть користувачі Інтернету зі стажем не знають про такий цікавий та корисний ресурс як http://www.archive.org - архів WWW.
На цьому сервері можна знайти старі копії сайтів. Сайти там представлені досить добре, в архів заносяться копії з інтервалом в кілька місяців.

Особливо корисним архів може бути в таких випадках
1. Підтвердження авторства матеріалів (точніше першості публікування в Інтернет)
2. Доступ до вже не існуючих сайтів чи сторінок.
Так, наприклад, за допомогою Веб-архіва можна доступитися до матеріалів уже неіснуючої україномовної бібліотеки "Чарівний жираф"

http://web.archive.org/web/20031224030926/http://tech77.hypermart.n...

У структурі посилання можна виділити оригінальну адресу сторінки. Правда по цій адресі сторінки може вже і не існувати (як це має місце у випадку зі "Жирафом" )

На частоту поповнення архіву сайту по моїх спостереженнях позитивно впливає його наявність в ODP (http://dmoz.org ).

Якщо ви не хочете бачити свій сайт у архіві, вам потрібно обмежити доступ до сайта роботу ia_archiver з сітки alexa.com . До речі, цей робот є одним з найактивніших інтернетівських роботів.
Про процедуру вилучення з архіву сайтів, які уже туди потрапили, мені не відомо нічого. Припускаю, що її не існує.

Громов Сергій - 1-11-2004 у 14:53

То певно цей робот за попередній місяць мені трафіка наганяв більше як 10 ГІГ !!!!! :(

Андрій Пелещишин - 1-11-2004 у 15:20

Сумніваюся. Йому по активності далеко до googlebot Потрібно аналізувати журнали доступу до сайту

Громов Сергій - 1-11-2004 у 16:32

Цитата:
Першим відправив користувач Андрій Пелещишин
Сумніваюся. Йому по активності далеко до googlebot Потрібно аналізувати журнали доступу до сайту


Якщо існує така інфа, прошу дати списочок ІР-адрес цього чудового сайту, я звірю зі своїм списочком :cool:

Captivitas - 1-11-2004 у 18:59

Цитата:
Першим відправив користувач Громов Сергій
То певно цей робот за попередній місяць мені трафіка наганяв більше як 10 ГІГ !!!!! :(


Мій сайт за 2003 рік присутній 6 разів, а за 2004 - жодного.

MartinkaDP - 2-11-2004 у 23:28

Мій там лежить з перших днів - раз була відкрила, аж сама здивувалася!

Андрій Пелещишин - 29-3-2005 у 17:55

Цитата:
Мій там лежить з перших днів - раз була відкрила, аж сама здивувалася!


До речі, важливий момент - якщо ви не хочете, щоби сайт архівувався в archive.org, забороніть доступ роботу ia_archiver зразу після запуску сайту (ще краще - до публічного його представлення). Інакше будете мати небажаний публічний архів.