Всім привіт! У цій статті на Tipsite.ru ми розберемося з тим, що таке дублі сторінок і як знайти дублі сторінок.
Тема ця дуже і дуже важлива, оскільки дублі негативно позначаються на просуванні сайту і ... Хоча не буду забігати наперед, оскільки про це докладніше поговоримо по ходу цієї статті. І щоб не ходити коло та навколо, відразу перейдемо до першого питання.
Що таке дублі сторінок?
Згідно словникам, дубль означає «повторення» або «подвійний».
Хочу зауважити, що дублі сторінок бувають повними і неповними (частковими). Якщо, наприклад, вміст двох сторінок повністю збігається, то це повний дубль. Ну і, відповідно, коли збіг сторінок часткове, то і дубль називається неповним.
Ну ось, з термінологією розібралися, тепер можна переходить до наступного питання.
Чим небезпечні дублі сторінок?
Головна небезпека дублів сторінок полягає в тому, що вони дуже вже «дратують» пошукові системи. І якщо Яндекс поводиться ще більш-менш стерпно, то Гугл просто рве і метає. Наявність великої кількості дублів на сайті може привести до серйозних проблем в його просуванні.
2) Дублі «розмивають» вага сторінки. Кожна сторінка має свій статичний вага. При наявності дублів цю вагу розмивається. А навіщо воно нам треба? Правильно, не навіщо!
3) Посилання, які ви проставляєте при внутрішньої перелинковке. можуть вести нема на основну сторінку, а на її дублікат, що не є добре.
4) В особливо важких випадках пошукові роботи можуть порахувати дубль сторінки більш релевантним (актуальним, точним) запитам користувачів, ніж оригінал.
Як бачите, дублі сторінок - це зло, з яким потрібно боротися. Вони заважають просуванню сайту, а в деяких випадках роблять його неможливим.
Відомі випадки, коли популярні сайти починали втрачати свої позиції і трафік, а вебмастера рвали собі волосся на голові і не могли зрозуміти, в чому справа. Надалі з'ясовувалося, що проблема була в сотнях і тисячах (!) Дублів. Як я вже говорив, Google дуже жорстко бореться з дублями і відсуває сайти з ними куди-небудь подалі. Яндекс, звичайно, більш лояльний в цьому питанні - зазвичай він просто склеює дублі, але в будь-якому випадку, просуванню сайту це не сприяє.
Звідки беруться дублі сторінок?
Питання логічне і цікавий. Як з'являються ці самі дублі? А причин для цього може бути декілька.
Це основні причини появи дублів сторінок на сайті. Можливо, є й інші специфічні варіанти, але зустрічаються вони набагато рідше. Ну а тепер переходимо до найцікавішого питання.
Як знайти дублі сторінок?
Для початку можна подивитися загальну картину з кількістю проіндексованих сторінок в пошукових системах. У цьому нам допоможе дуже корисне розширення для браузера - RDS Bar. Перш за все потрібно підрахувати приблизну кількість сторінок на сайті. У мене на Tipsite.ru на даний момент має індексуватися приблизно 80 сторінок. Тепер дивимося, що показує RDS Bar.
В індексі Яндекса присутній 83 сторінки. що в межах норми, а ось Google проіндексував 144 сторінки. З них 60% (приблизно 86 сторінок) знаходиться в основному індексі, а ось інші 40% (58 сторінок) - це, так звані «соплі». Таке прикольна назва виникло через те, що крім основного індексу у Google є ще один - Supplemental Index. який переводиться, як «додатковий». Ну а при спробі прочитати це закордонне слово буквально, виходить дуже веселе назву.
Тепер пишемо трохи інший запит: site: tipsite.ru. У результатах будуть показані всі проіндексовані сторінки разом з «соплями».
Переходимо на останню сторінку і натискаємо на непримітну посилання «Показати приховані результати».
Знову рухаємося ближче до кінця видачі і бачимо, що за «соплі» потрапили в індекс.
У моєму випадку це стрічка RSS. Що найцікавіше, ці файли у мене закриті від індексації в robots.txt. Сам Google цього теж не заперечує і замість сниппета пише про обмеження в robots.txt, але незважаючи на це в індекс, чому то, додав.
У моєму випадку дублі не були знайдені.
Ну і наостанок хочу розповісти про автоматичний спосіб пошуку дублів. У цій справі нам допоможе програма Xenu. яка також непогано шукає биті посилання. або ж Google Webmaster. У пункті «Оптимізація HTML» можна побачити повторювані метаописания і заголовки, які можуть виявитися дублями сторінок.