Программирование

Что такое rel = canonical и почему я должен его использовать?

Когда вы запускаете сайт, управляемый данными, или у вас есть другие причины, по которым документ может быть продублирован, важно сообщить поисковым системам, какая копия является главной, или, на жаргоне, «канонической» копией. Когда поисковая система индексирует ваши страницы, она может сказать, когда контент был продублирован. Без дополнительной информации поисковая система решит, какая страница лучше всего соответствует потребностям ее клиентов. Это может быть хорошо, но есть много случаев, когда поисковые системы доставляют старые и устаревшие страницы, потому что они выбрали неправильный документ как канонический.

Как указать каноническую страницу

Поисковым системам очень легко сообщить канонический URL с метаданными в ваших документах. Поместите следующий HTML вблизи верхней части головы элемента на каждой странице, которая не является каноническим.

<link rel = "canonical" href = "http://example.com/">

Если у вас есть доступ к заголовкам HTTP (например, с помощью htaccess или PHP ), вы также можете установить канонический URL для файлов, которые не имеют HTML- заголовка, такого как PDF. Для этого установите заголовки для неканонических страниц следующим образом:

Ссылка: <URL канонической страницы>; отн = «канонической»

Как работает канонический тег, а когда нет

Канонические метаданные используются в качестве подсказки для поисковых систем относительно того, какая страница является главной. Поисковые системы используют это для обновления своего индекса, чтобы ссылаться на главную копию как на основную копию, и когда они предоставляют результаты поиска, они предоставляют страницу, которую они считают канонической.

Но указанная вами каноническая страница не может быть той страницей, которую предоставляют поисковые системы. Есть много причин, почему это может произойти:

  • Если указанный вами адрес 404 не найден, поисковые системы попытаются найти второй наиболее релевантный URL для доставки.
  • Если поисковая система считает, что ваш сайт был взломан для добавления фальшивого канонического URL, он не будет его использовать (конечно, в этом случае у вас будут большие проблемы)

Если вы поместите ссылку в тег, или есть основания полагать, что тег HEAD не был закрыт. Это связано с тем, что многие веб-сайты позволяют пользователям редактировать содержимое страницы (внутри элемента BODY), и поэтому найденная там каноническая ссылка также будет ненадежной.

Чем не является Rel = канонический тег

Каноническая ссылка, в конечном счете, просто подсказка. Поисковые системы не должны соблюдать это. Большинство поисковых систем стараются уважать пожелания владельцев страниц, но в конечном итоге результаты поиска будут такими, какие они есть, и если они не захотят обслуживать вашу каноническую страницу, они не будут.

Когда использовать каноническую ссылку

Как мы уже говорили выше, вы должны использовать ссылку на каждую дублирующую страницу, которая не является канонической. Если у вас есть страницы, которые похожи, но не идентичны, иногда имеет смысл изменить одну из них на другую, чем сделать ее канонической. Можно отметить две страницы, которые не являются абсолютно идентичными каноническим. Они должны быть похожими, но вы никогда не должны просто указывать все страницы на своей домашней странице. Каноническое означает, что страница является основной копией этого документа, а не какой-либо главной ссылкой на вашем сайте.

Мы считаем, что важно повторить этот последний шаг — вы никогда не должны указывать все свои страницы на свою домашнюю страницу как каноническую страницунезависимо от того, насколько вы соблазнены сделать это. Выполнение этого даже случайно может привести к тому, что каждая страница, которая не является канонической (т. Е. Каждая страница, которая не является вашей домашней страницей и на которой имеется ссылка rel = canonical), будет удалена из индексов поисковой системы. Это не Google (или Bing, или Yahoo!, или любая другая поисковая система), которая является вредоносной. Они делают то, о чем вы их просили — считая каждую страницу дубликатом вашей домашней страницы и возвращая все результаты на эту страницу. Тогда, когда клиенты разочаруются в конечном итоге на вашей домашней странице вместо более релевантного документа, эта страница будет менее популярной и будет падать в результатах поиска. Даже если вы решите проблему, вы можете убить результаты поиска на месяц позже, и нет никаких гарантий, что рейтинг вашего сайта восстановится.

Не следует делать страницу канонической, которая по какой-то причине была исключена из поиска (например, с метатегом noindex или исключена из файла robots.txt). Чтобы поисковая система ссылалась на страницу как на каноническую, она должна иметь возможность ссылаться на нее в первую очередь.

Хорошие места для использования ссылки rel = canonical включают в себя:

  • Сайты с динамическими URL-адресами — вы можете использовать его, чтобы определить, какой формат URL вы предпочитаете
  • Сайты электронной коммерции, особенно в списках товаров. Когда ваши клиенты меняют критерии сортировки, этот новый URL не нужно индексировать
  • Синдицированный контент — издатели, использующие контент, который вы написали, должны размещать на своих страницах ссылку rel = canonical, указывающую на ваш оригинальный документ

Когда не следует использовать каноническую ссылку

Ваш первый выбор должен быть редиректом 301. Это не только сообщает поисковой системе, что URL-адрес страницы изменился, но и приводит людей к самой последней (и, смеем сказать, канонической?) Версии страницы.

Не ленись. Если вы изменяете структуру URL-адреса, используйте автоматическую обработку заголовков HTTP (например, .htaccess, PHP или другой скрипт), чтобы автоматически добавлять перенаправления 301. В то время как вы можете использовать ссылку rel = canonical, старые страницы не исчезают. И поэтому каждый может добраться до них в любое время. Фактически, если у клиента есть закладка на страницу, и вы меняете URL, но обновляете только поисковые системы, используя ссылку rel = canonical, этот клиент никогда не увидит новую страницу.

Ссылка rel = canonical — это полезный инструмент для сайтов с большим количеством дублирующегося контента. Поняв, как это работает, вы можете использовать его эффективно. Но в конечном итоге это инструмент, выпущенный поисковыми системами, чтобы помочь им поддерживать свои поисковые индексы в актуальном состоянии. Если вы не будете поддерживать чистоту и актуальность своих серверов, это повлияет на ваших клиентов и может нанести вред вашему сайту. Используйте это ответственно.

Похожие посты
Программирование

Что такое канал RSS? (И где его взять)

Программирование

7 причин, почему изображения не загружаются на ваш сайт

Программирование

Запустите агент SQL Server: настройте SQL Server 2012

Программирование

15 лучших бесплатных обоев дня Святого Патрика