Здравствуйте, дамы и господа, если вы удалили плагин для формирования AMP-страниц, то можете обнаружить, что страницы с префиксом AMP остались, в том числе и в индексе поисковых систем. Выглядеть этот префикс может по-разному, например:
?amp
/amp/
Есть и другие варианты. Даже после удаления плагина AMP некоторое время в индексе Google или Яндекс AMP-страницы будут присутствовать. И в этой статье расскажу, как полностью избавиться от AMP-страниц в WordPress.
Пошаговая инструкция по удалению AMP-страниц из WordPress и индекса поисковых систем
Итак, после удаления AMP эти страницы будут ещё доступны в индексе поисковой системы Google, некоторое время ссылки будут вести на страницы AMP, а в Яндекс Вебмастер будет появляться такая ошибка:
Чаще всего такая проблема возникает, когда вы используете AMP с адресом в формате GET-параметра:
?amp
И это может вызывать ряд проблем, так как такие страницы будут считаться за дубли.
На самом деле вы можете добавить практически любой GET-параметр к адресу на сайтах на базе WordPress, но при этом всё равно будет показана целевая страница.
Так что таких дублей можно наплодить вагон и маленькую тележку на ровном месте. И в случае AMP особенно заметна ситуация, когда включён «Обход по счётчикам» в Яндекс Вебмастер. Люди идут с Google на несуществующие страницы AMP, у которых есть GET-параметр, показывается целевая страница без изменений, а Яндекс считает эту страницу дублем.
Первое, что нужно сделать в таком случае, это запретить обход таких страниц через файл robots.txt. Он должен находиться в корне сайта, если такого файла нет, то нужно его создать.
А в нём нужно прописать директивы. Если используете в форме строки запроса ?amp, то необходимо сообщить поисковым системам, что эти страницы индексировать больше не нужно.
Например, для Яндекс:
User-agent: Yandex
Clean-param: amp
Для Google:
User-agent: Googlebot
disallow: /*?*amp
Если используется адрес в формате /amp/, то директивы будут следующими:
User-agent: Yandex
disallow: /amp/
User-agent: Googlebot
disallow: /amp/
Ну или можно запретить сразу всем роботам:
User-agent: *
disallow: /amp/
disallow: /*?*amp
Теперь AMP-страницы запрещены к индексации поисковыми роботами. Но это не гарантирует, что они не попадут в индекс поисковых систем, так что стоит настроить переадресацию. Для этого можно использовать универсальную директиву, которая удалит все типы адресов AMP-страниц, добавить её нужно в файл .htaccess, который должен находить в корневой папке вашего сайта.
Добавляется директива перед строкой # BEGIN WordPress:
RewriteCond %{QUERY_STRING} ^(.*&)?(?:no)?amp(?:=[^&]*)?&?(.*)$ [OR]
RewriteCond %{REQUEST_URI} /amp/?$
RewriteRule ^/?(.*?)(/amp/?)?$ /$1?%1%2 [NE,R=301,L]
Эта директива добавит 301 редирект (постоянное перенаправление) к AMP-страницам, соответственно, спустя некоторое время они попросту исчезнут из поисковой выдачи.
Как видите, убрать AMP-страницы окончательно, в том числе и из поисковой выдачи, довольно просто.
Надеюсь, эта инструкция вам помогла, на этом желаю успехов и всего доброго!