Как и нужно ли проставлять редирект для страниц со слешем в конце URL — ответ на вопрос

Автор:
Ольга Сидорова — автор статьи Ольга Сидорова
Редакторы:
Андрей Гук — редактор статьи Андрей Гук
#Советы

Вопрос

Мы ежемесячно проверяем эффективность своего сайта в сервисе Google Search Console (GSC). При поверке обязательно заглядываем во вкладку "Эта страница не проиндексирована: Не найдено (404)", чтобы определить, какие страницы больше недоступны, и проставить редиректы в случае, если у страницы поменялся URL.

Во время последней проверки столкнулись с ситуацией, в которой не совсем понятно, как правильно поступить. Описываем суть.

Наша компания занимается переводами документов и текста с и на английский язык, а на сайте представлены отдельные страницы по документам, которые мы переводим. Когда сайт только создавали, его структура не была сформирована до конца, поэтому изначально URL одного из документов выглядел так — https://englishgeeks.ru/perevod-otcheta-o-provedennyh-rabotah-na-angliyskyy.

Позже структура сайта изменилась, и к существующим урлам для страниц документов добавилось слово document. Новый URL теперь выглядит так — https://englishgeeks.ru/document/perevod-otcheta-o-provedennyh-rabotah-na-angliyskyy. Конечно, мы проставили редиректы на всех страницах документов со старого урла на новый, чтобы ссылки на сайтах, которые вели на страницу этого документа не отдавали ошибку 404.

Но при последней проверке GSC обнаружилось, что страница с урлом https://englishgeeks.ru/perevod-otcheta-o-provedennyh-rabotah-na-angliyskyy/ отдает ошибку 404. То есть это старый урл, но со слешем на конце. Мы проверили, какая страница ссылается на несуществующую страницу — оказалось, что она же и ссылается (скриншот прикрепили). Подскажите, пожалуйста, как такое возможно? Нужно ли ставить редирект в данном случае?

Сразу отмечу, что наш сайт работает на WordPress.

Скриншот из GSC

Ответ

Начнем с решения проблемы. Путь страницы с косой чертой в конце и без нее — это две разные страницы для поисковика. Поэтому важно проверить, как у вас настроен редирект. Если путь без косой черты нормально перенаправляется на новый, а с косой чертой не перенаправляется, то, возможно, вы забыли указать в настройках, что косая черта должна игнорироваться. Давайте проверим.

На вашем сайте за редиректы отвечает плагин Redirection. Это хороший надежный плагин, его используют многие сайты. В его работе проблемы нет точно. Давайте посмотрим, как проставлен редирект.

В плагине удобная строка поиска, легко найти нужный урл, просто набрав его часть.

нужный урл в списке плагина redirection

Сразу видно, что исходный урл указан без косой черты, в параметрах запроса выбрано "точное соответствие". Теперь важно проверить, что указано в параметрах урла (выпадающий список справа от самого урла).

В параметрах урла можно выбрать 3 опции. Сейчас не отмечено ничего.

Если бы у нас было несколько урлов с каким-то одинаковым паттерном (например, все урлы с каким-то определенным словом перенаправь на вот эту страницу), который мы бы могли повторить с помощью языка регулярных выражений, то можно было бы отметить эту опцию. Но у нас довольно простой случай, для которого еще и есть готовая опция "игнорировать косую черту".

опции плагина redirection для исходного урла

Мы проставили галку "игнорировать косую черту", теперь плагин будет перенаправлять все совпавшие пути с косой чертой в конце или без. Для отслеживания редиректов мы используем сервис WhereGoes, но вы можете проверить и другим инструментом (их много).

Теперь все в порядке. Исходный урл с косой чертой тоже перенаправляется на новый, а не отдает 404 ошибку.

скрин сервиса wheregoes с подтверждением редиректа

Что касается ситуации с тем, что в консоли гугла в ссылающейся странице указана сама же страница, то дать однозначный ответ, почему так произошло, не можем. Робот гугла фиксирует страницы, с которых он совершил переход, чтобы была возможность отследить "источник информации". Обычно там дочерняя или родительская страницы. Догадки мы не любим, поэтому запросили мнения других специалистов на справочном форуме гугла. Если кратко, то советуют игнорировать информацию в ссылающихся страницах и считают этот функционал недоработанным, потому что он:

  1. показывает не все ссылающиеся страницы;
  2. часто показывает устаревшую информацию, потому что не так часто обновляется база данных.