Все про переадресації htaccess для seo в одній статті

У порівнянні з розширеннями для CMS-систем (наприклад, плагіни для WordPress), використання прямих вказівок в htaccess має ряд незаперечних переваг. Перелічимо основні з них:
1. Зменшення навантаження на MySQL. SEO-доповнення регулярно звертаються до бази даних, так як саме там зберігається інформація про поточну конфігурацію. У той же час, редіректи через htaccess функціонують на рівні сервера - їх використання відчутно підвищує загальну продуктивність проекту.
2. Робота в умовах обмеженого доступу. Файл додаткової конфігурації дозволяє задавати параметри для окремих каталогів. Завдяки йому можна здійснювати тонке налаштування навіть в тому випадку, якщо ресурс розміщений на шаред-хостингу і безпосередня робота з httpd.conf неможлива.
3. Додатковий захист. На відміну від robots.txt, директиви, прописані в htaccess є обов'язковими до виконання Apache. Це забезпечує ефективне управління індексацією, а також захист системи від різних спамерських пошукових роботів і сканерів.

Все про переадресації htaccess для seo в одній статті

Тепер давайте перейдемо від теорії до практики і почнемо з найбільш відомих прийомів внутрішньої оптимізації, знайомих багатьом веб-майстрам.
Важливе зауваження: перш, ніж вдаватися до описаних нижче методикам, обов'язково зробіть резервну копію, особливо якщо раніше ніколи не працювали з Апачем безпосередньо.

Базові можливості htaccess

Нижче наведені готові вирішення нагальних завдань, з якими стикаються практично всі оптимізатори і веб-майстри. Однак навіть досвідчені фахівці схильні нехтувати перерахованими рецептами, а значить, варто ще раз згадати ази.

1. Сторінки помилок
При виникненні технічних неполадок з хостингом або сайтом, видається один зі стандартних кодів стану HTTP. Скориставшись директивою ErrorDocument, можна задати автоматичне перенаправлення користувачів до відповідних html-документів. При цьому htaccess буде виглядати наступним чином:

ErrorDocument помилка /errors/ошібкі.html

наприклад:
ErrorDocument 404 /errors/404.html

RewriteEngine on RewriteBase / RewriteCond% ^ SpamBot_1 [OR] RewriteCond% ^ SpamBot_2 RewriteRule ^. * $ - [F]

Вище ми заборонили доступ до майданчика умовним спам-ботів 1 і 2. При спробі сканування, буде виводитися стандартна 403 помилка.
Примітка: зазначена вище методика, незважаючи на всі переваги, має один недолік - потрібно знати User-Agent утиліти, яку ви хочете заборонити. Спамери намагаються обійти подібний захист, залишаючи його порожнім, або розміщуючи там випадкову інформацію. Протидіяти шкідливим програмам в цьому випадку можна за допомогою такого коду:

RewriteEngine On RewriteCond% ^ $ [OR] RewriteCond% ^. * (<|>| '|% 0A |% 0D |% 27 |% 3C |% 3E |% 00). * [NC, OR] RewriteCond% ^. * (HTTrack | clshttp | archiver | loader | email | nikto | miner | python) . * [NC, OR] RewriteCond% ^. * (winhttp | libwww \ -perl | curl | wget | harvest | scan | grab | extract). * [NC] RewriteRule ^ (. *) $ - [F, L]

Запис дозволяє фільтрувати порожні і підозрілі User-Agent, а також сканери, що використовують найбільш популярні методи парсинга веб-сайтів.

3. Заборона хотлінк
Термін "хотлінк" позначає підключення до веб-сторінці файлу (найчастіше, зображення), розташованого на сторонніх ресурсах. Мало того, що у вас, фактично, крадуть контент - при цьому створюється ще й додаткове навантаження на проект. Боротися з цим можна, налаштувавши в htaccess перевірку змінної HTTP_REFERER. Якщо її значення не збігається з ім'ям сервера, на якому розміщений оригінал, зображення буде підмінятися "заглушкою" (наприклад, картинкою з вашим копірайтом):

4. Технічні роботи
Якщо плануються глобальні зміни (редизайн, або додавання нового функціоналу), виникає необхідність установки "заглушки". Штатні засоби більшості двигунів закривають сайт для всіх, що дуже незручно. Однак налаштований через htaccess редирект дозволяє залишити проект доступним адміністратору, в той же час демонструючи відвідувачам сторінку з інформацією про технічні роботах:

5. Налаштування кешування
Час відгуку сайту є нехай і другорядним, але все ж фактором ранжирування. До того ж, при високому навантаженні неминуче виникають проблеми з доступністю, а значить, пошуковий бот не зможе адекватно проіндексувати нові сторінки. Розвантажити сервер допоможе правильна настройка кешування в браузерах відвідувачів. Це можна зробити, додавши необхідні параметри в заголовки.

Header set Cache-Control "max-age = 29030400, private"

Тут для файлів з перерахованими розширеннями ми встановили заголовок Cache-Control, задавши термін зберігання в 1 рік через змінну max-age. Ви можете зменшити цей інтервал, однак майте на увазі - час задається в секундах. Private вказує, що кешування необхідно здійснювати тільки на стороні користувача, минаючи проксі.

Правило для скриптів, стилів, xml найкраще прописати окремо, знизивши час до пари днів:

Header set Cache-Control "max-age = 172800, private"

Динамічні сторінки краще виключити з кешу взагалі:

Header unset Cache-Control

Також можна задати період в 30-60 секунд (це практично не створить проблем відвідувачам, однак допоможе знизити навантаження на Апач в прайм-тайм).

6. Управляем індексуванням
Пошуковики схильні чинити свавілля, не озираючись на інструкції robots.txt. Особливо часто цим грішить Google, здатний проіндексувати навіть закриту сторінку, перейшовши на ресурс по зовнішньому лінку. Частково проблема вирішується через мета-тег robots, ось тільки його можна вказати лише для html-документа. Якщо ж від чіпких лап «павука» потрібно приховати файл, варто звернутися до htaccess, благо X-Robots-Tag підтримує всі існуючі директиви індексування:

Header set X-Robots-Tag "index, nofollow, noarchive, nosnippet"

Header append Vary User-Agent

Даний запис повідомляє, що вміст сторінки варіюється в залежності від User-Agent.

Налаштування постійного редиректу

Все про переадресації htaccess для seo в одній статті

Options + FollowSymLinks RewriteEngine On # Розміщуваний код редиректу

2. Склеювання домену з www і без www
Можна сказати, що це - основи технічного SEO, адже саме дані правила допомагають виключити множинні дублі контенту і об'єднати вага вхідних посилань. Існує два різних рішення, одне з яких прив'язане до конкретного домену, інше ж є універсальним. Чим саме скористатися - справа смаку. Синтаксис такий:

Схожі статті