Як правильно Напарс базу гест - форум про інтернет-маркетингу

Як правильно Напарс базу гест

Тільки вчуся парсити гугл на гести, юзаю AGRESS Parser і Hkey Free. Поки юзаю для парсинга запити однотипних гест: inurl: "gbook.php? A = sign", inurl: "guestbook.php? A = sign", для поліпшення якості видачі використовую - "error", "error 404", - "warning " і т.п. Зараз ось прочитав про пошук нових гест:

Де шукати нові типи гестов? Зазвичай я використовував два методи:
1) В інтернеті часто поширюються готові гостьові книги, а раз вони поширюються значить вони масові, тобто для всіх, тобто багато їх собі встановлюють на різні сайти і т.д. Просто качаешь ці гести заливаєш на фрішників і дивишся на що вони закінчуються, а потім це закінчення дивишся в гуглі, якщо велика видача значить має місце її збирати, невелика - значить ці книги не користуються популярністю і збирати їх немає особливого сенсу.
2) Можна шукати нові типи гестов в беках у конкурентів, все може і говорять нібито некрасиво і т.д. але дуже і дуже багато так роблять, хоча імхо краще комбінувати перший і другий способи.

Чи варто шукати нові типи гест для парсинга або можна обмежитися стандартними. Як часто потрібно оновлювати базу. Чи варто парсити яху, мсн, альтавист і т.п. або можна обмежитися гуглом?
Далі, за якістю самої бази. Як її потрібно фільтрувати, крім чека на дублі. Масовий чек на ПР і вибирати піаристів, або є ще якісь варіанти фільтра. Якого обсягу бази варто домагатися для нормального виведення доров в топ. Якщо знайдеться хтось, кого не утруднить скласти невелику табличку співвідношення кількості гест в базі і їх PR, щоб вивести приблизно однакову ефективність більшого кол-ва гест з меншим PR і меншого кількості гест з великим PR, наприклад, так:
200к гест PR 1-2
100к гест PR 3-4
30к гест PR 5-6
ну і т.д. сподіваюся, думка виклав ясно. Заздалегідь дякую за відповіді

Схожі статті