Переводим все URL сайта в нижний регистр с помощью Apache rewrite и PHP
Было когда-то в SEO требование — дубли страниц не плодить. И вроде бы нет их, дублей, а тут оппа и в сети на ваш сайт куча ссылок, да не простых, с разным регистром и ооочень много. Например, your_site.com/pagelink, your_site.com/pageliNk, your_site.com/pagElink, your_site.com/paGelink, your_site.com/paGElink и т.д.
Суть в том, что все эти ссылки ведут на одну и ту же страницу, но поисковиком воспринимаются, как разные, как дубли. Вот против такой херни однажды было найдено решение — RewriteRule через rewrite-strtolower-url.
Итак, какое есть решение для Apache? В .htaccess вносим следующее:
RewriteEngine on
RewriteBase /
# force url to lowercase if upper case is found
RewriteCond %{REQUEST_URI} [A-Z]
# ensure it is not a file on the drive first
RewriteCond %{REQUEST_FILENAME} !-s
RewriteRule (.*) rewrite-strtolower.php?rewrite-strtolower-url=$1 [QSA,L]
Что тут происходит:
- Настраиваем rewrite module
- Проверяем URL на содержание букв в высоком регистре
- Удостоверяемся, что URL не ведет на файл на диске
- Оправляем все совпадающие запросы по правилу в наш скрипт через GET для преобразования в нижний регистр.
Теперь создаем файл rewrite-strtolower.php и кладем его в корень сайта (туда же, где .htaccess):
<?php
if(isset($_GET['rewrite-strtolower-url'])) {
$url = $_GET['rewrite-strtolower-url'];
unset($_GET['rewrite-strtolower-url']);
$params = http_build_query($_GET);
if(strlen($params)) {
$params = '?' . $params;
}
//если нет SSL, замените https:// на http://
header('Location: https://' . $_SERVER['HTTP_HOST'] . '/' . strtolower($url) . $params, true, 301);
exit;
}
header("HTTP/1.0 404 Not Found");
die('Unable to convert the URL to lowercase. You must supply a URL to work upon.');
?>
Вот и всё! Теперь ссылки с символами в верхнем регистре будут меняться на нижний. Пока что я не нашёл лучшего решения для Apache. Если оно есть, дайте мне знать.