Як стягнути весь сайт з webarchive?
з.и. сам форум не критично, там повідомлень до 50. Цікавить загальна концепція на майбутнє.
_________________
Завжди свіжі списки доменів ./ Міняй вигідно! Тільки на bestchange!
Мій блог вебмастера. Софт по .арк - 49.99 доларів / міс.
Цікавить загальна концепція
На форумі є мій парсер, який працював. Я давно ним не користувався, так що не дам гарантій про працездатність зараз.
якщо конкретну країну в вебархіве не відчиняє, то її не стягне?
Ну звичайно, якщо сторінки немає - звідки її тягти? З астралу что-ли?
Мій парсер становить карти сторінок, які вдалося відкрити в веб-архіві (морда + другий УВ + третій УВ). Якщо вкладеність була більше - то глибокі сторінки він не збирає. А потім по карті можна хоч Wget'ом або Teleport'ом скачати самі сторінки.
_________________
HyperHost.UA - надійний і недорогий хостинг!
k0ttee писал (а): якщо сторінки немає - звідки її тягти
Це зрозуміло, просто спочатку слини потекла, побачивши свою старі статті, за які сплачені гроші.
А потім поліз по сайту - а там доступні тільки іконки і robots
_________________
Завжди свіжі списки доменів ./ Міняй вигідно! Тільки на bestchange!
Мій блог вебмастера. Софт по .арк - 49.99 доларів / міс.
Зате швидше і прибутковіше, ніж писати свій. Який же я поганий, треба мене відлупцювати.
land писал (а): Красти чужий контент для продажу в біржах, дуже погано.
Якщо статті висять в архіві кілька років і ніхто не користується їх унікальністю - то чому б і не заробити?
_________________
Завжди свіжі списки доменів ./ Міняй вигідно! Тільки на bestchange!
Мій блог вебмастера. Софт по .арк - 49.99 доларів / міс.