Похоже, что файл карты сайта представляет собой html-страницу, используйте поддерживаемый формат карты сайта

Обновлено: 21.11.2024

Карта сайта – это список информации обо всех страницах, видео, изображениях и других файлах на веб-сайте. Эта информация используется поисковыми роботами и поисковыми системами для понимания структуры веб-сайта и связи между файлами и страницами на нем.

Существует два основных типа файлов Sitemap: файлы Sitemap в формате HTML и файлы Sitemap в формате XML.

XML-карты сайта в первую очередь предназначены для поисковых систем, их ботов и поисковых роботов, чтобы дать им лучшее представление о структуре вашего веб-сайта. Это позволяет поисковым роботам легко получать доступ ко всем страницам вашего веб-сайта, а также ко всей соответствующей информации о нем. Обычно это URL-адрес страницы, дата последнего обновления и любые языковые варианты страницы. Знание структуры вашего веб-сайта позволяет поисковым системам грамотно сканировать ваш веб-сайт и гарантирует, что все страницы вашего веб-сайта находятся в их поисковом индексе.

Карты сайта в формате HTML обычно создаются в удобном для чтения формате и структуре и используются, чтобы помочь пользователям найти то, что они ищут. Карта сайта в формате HTML не обязательно должна включать все ваши URL-адреса/страницы. Она должна быть сделана так, чтобы помочь пользователю найти то, что он ищет, если он потеряется на вашем веб-сайте. Многие создают HTML-шаблон, чтобы помочь пользователю найти самые важные страницы на своем веб-сайте.

Содержание

Что такое XML-карта сайта?

Протокол Sitemaps был представлен Google, но поддерживается большинством основных поисковых систем, таких как Bing, Yahoo и Ask. В XML-карте сайта можно добавить к URL-адресу дополнительную информацию, которая поможет поисковым роботам оптимизировать то, как они просматривают ваш веб-сайт.

Обычно это включает время и дату последнего изменения страницы, но также может включать дополнительную информацию, такую ​​как частота изменений и относительный приоритет страницы по сравнению с другими страницами. Дополнительная информация о частоте и приоритете изменений Google больше не используется. Включить их не помешает, но Google полностью их игнорирует. Вместо этого Google опирается исключительно на дату последнего изменения.

Наличие XML-карты сайта и отправка ее в основные поисковые системы отлично подходит для поисковой оптимизации и является общепринятой практикой среди маркетологов. Наличие карты сайта и отправка ее в Google — это практика, которая может принести пользу вашему сайту, а не то, за что вы будете наказаны (подтверждено Google).

Если вы используете много изображений и видео, вы также можете создать и отправить специальные файлы Sitemap для них. Это может помочь улучшить видимость при поиске изображений и видео, а также открыть возможность отправки дополнительной информации об этих файлах. Карта сайта для видео может включать время показа видео, категорию и рейтинг соответствия возрасту, а карта сайта для изображений может включать тему, тип и лицензию.

Нужен ли мне файл Sitemap в формате XML?

Если все ваши страницы правильно связаны, сканеры поисковых систем обычно смогут обнаружить все ваши страницы без карты сайта. Но, добавляя дополнительную информацию в карту сайта, вы помогаете поисковым роботам повысить эффективность их работы и, таким образом, помогаете им обнаруживать изменения быстрее, чем в противном случае. Сканеры поисковых систем не сканируют каждую страницу вашего сайта каждый раз, когда они посещают ваш сайт. Если вы не предоставите информацию о том, какие страницы наиболее важны для сканирования, для обнаружения изменений часто требуется время.

Несмотря на то, что все веб-сайты должны иметь карту сайта, веб-сайты, соответствующие одному из этих 4 критериев, получат наиболее значительные улучшения:

Очень большие сайты

Каждый веб-сайт имеет ограниченный бюджет на сканирование, а для очень больших веб-сайтов может потребоваться много времени, прежде чем сканер найдет новые обновленные или созданные URL-адреса. Указав дату последнего изменения в карте сайта, вы можете гарантировать, что сканеры не пропустят недавно обновленные страницы. Если ваша карта сайта больше 50 МБ или содержит более 50 000 URL-адресов, Google не примет ее. В этом случае вам придется разделить карту сайта на несколько карт сайта и загрузить их по отдельности. Кроме того, вы можете создать индексный файл карты сайта со ссылками на отдельные карты сайта.

На вашем веб-сайте много страниц, которые изолированы или плохо связаны

Если у вас есть части вашего веб-сайта, на которые нет надлежащих ссылок на вашем веб-сайте, есть вероятность, что поисковые системы пропустят эти страницы и не поместят их в свой индекс. Это может быть в том случае, если на вашем веб-сайте есть старые архивы контента или страницы-сироты.

Ваш веб-сайт новый и/или имеет мало внешних обратных ссылок

Сканеры поисковых систем обнаруживают контент в Интернете, переходя по ссылкам с одной страницы на другую.Если на вашем веб-сайте мало внешних обратных ссылок с других веб-сайтов, поисковые системы могут вообще не обнаружить ваш веб-сайт.

Ваш веб-сайт использует мультимедийный контент в поисковых системах

Если на вашем веб-сайте используются новости Google или другой мультимедийный контент в поисковых системах, дополнительная информация в карте сайта может быть использована для улучшения содержания.

Как должна выглядеть карта сайта?

Карта сайта должна иметь строгую структуру, если вы хотите, чтобы поисковые системы, такие как Google, использовали ее. Если они не соблюдают правила, они не будут использоваться и не принесут никакой пользы вашему веб-сайту.

Существует 3 формата, которые вы можете использовать для создания карты сайта, и все они поддерживаются Google:

  1. XML
  2. RSS, mRSS и Atom 1.0
  3. Текст

Ниже приведено описание различных тегов XML-карты сайта и того, как она выглядит.

Это пример структуры XML-файла карты сайта. Если вы хотите увидеть, как выглядит реальная карта сайта, взгляните на карту сайта Umbraco.

Этот тег является необязательным.

Он сообщает поисковым системам, какая версия XML используется и какая кодировка используется.

Этот тег является обязательным.

Он отмечает начало и конец файла и ссылается на стандарт протокола, которому следует. Это всегда будет одинаковым для всех веб-сайтов и файлов Sitemap.

Этот тег является обязательным.

Это родительский тег каждой записи URL, и все теги, расположенные под ним, являются его дочерними элементами.

Этот тег является обязательным.

Это URL-адрес страницы, и он должен быть записан точно так же, как сервер возвращает URL-адрес. Есть несколько элементов, о которых следует знать, и вы должны убедиться, что они правильно реализованы:

Этот тег необязателен (но настоятельно рекомендуется).

Этот тег используется для обозначения времени последнего изменения/обновления. Дата должна быть в формате W3C Datetime. Включив его в свою карту сайта, Google и другим поисковым системам будет проще определить, не устарела ли версия, которая находится в их индексе. Google хранит метку времени последнего сканирования URL-адреса, и если она старше даты последнего изменения, указанной в карте сайта, это повысит вероятность того, что Google просканирует эту страницу, чтобы получить последние изменения и добавить их в свой индекс. .

Ранее на это можно было повлиять, используя два следующих тега, но Google игнорирует их оба (согласно их рекомендациям).

Этот тег является необязательным.

Как уже упоминалось, Google больше не использует этот тег, так как полностью игнорирует его. Это может варьироваться, но если вы планируете только отправить карту сайта в Google, вам не следует тратить время на этот тег.

Этот тег является необязательным.

Этот тег используется для предоставления относительного приоритета по сравнению с другими URL-адресами на вашем веб-сайте. Допустимые значения варьируются от 0,0 (самый низкий) до 1,0 (самый высокий). Приоритет по умолчанию – 0,5.

Опять же важно подчеркнуть, что Google больше не использует это.

А как насчет многоязычных веб-сайтов?

Если ваш контент существует на нескольких языках, вы также можете добавить тег с соответствующей информацией в карту сайта для каждого из ваших URL-адресов. Это альтернативный способ сделать это вместо включения HTML-тегов на самих страницах.

Где разместить карту сайта?

Нет никаких требований к имени файла или расширению файла (.xml), поэтому не стесняйтесь называть его как хотите, если он доступен и может быть отправлен поисковым системам.

Зачем мне отправлять карту сайта в формате XML в Google?

Отправка карты сайта в Google не является строго обязательной для того, чтобы ваш веб-сайт можно было найти, поскольку поисковые роботы Google обычно довольно хорошо находят новые страницы, изображения и видео. Но зачем оставлять это в руках Google и надеяться, что они найдут ваш новый контент, если вместо этого вы можете помочь?

Как отправить XML-карту сайта в Google?

Если вы хотите отправить карту сайта в формате XML в Google, это можно сделать тремя различными способами. Рекомендуемым методом является первый — отправка через консоль поиска Google, но если он вам не подходит, вы можете выбрать один из двух других.

Отправить карту сайта через Google Search Console

Если вы уже подтвердили свой веб-сайт с помощью Google Search Console, отправить свой веб-сайт несложно. После того, как вы вошли в свою учетную запись Search Console и выбрали свой веб-сайт, вам нужно будет перейти к «Картам сайта», который находится в меню слева в разделе «Индекс».

Оказавшись на странице, вам нужно ввести URL-адрес карты сайта и нажать «Отправить». Вот и все, теперь ваша карта сайта будет проверена, и, если формат правильный, она получит статус «Успешно».

Отправить карту сайта с помощью файла robots.txt

Если вы не хотите использовать Google Search Console, вы также можете отправить карту сайта, добавив ее в файл robots.txt. Для этого вам нужно указать путь к вашей карте сайта, добавив следующую строку в любом месте файла robots.txt:

Как найти карту сайта любого веб-сайта?

Вы только что устроились на новую работу и хотите проверить, нормально ли выглядит ваша карта сайта? Или, может быть, вы работаете в агентстве, и у вас только что появился новый клиент?

Какой бы ни была причина, есть разные способы найти карту сайта, если вы не можете ее найти. Поскольку карта сайта не имеет фиксированного положения, как файл robots.txt, нет никаких гарантий, что вы сможете найти ее, воспользовавшись приведенными ниже советами.

Тем не менее, файлы Sitemap довольно стандартизированы, поэтому обычно их можно найти одним из 6 способов, показанных ниже. Некоторые веб-сайты могут скрывать их, чтобы конкуренты не могли просматривать их карту сайта, но, поскольку в карте сайта нет неотъемлемых угроз безопасности, владельцы веб-сайтов редко тратят на это время и ресурсы.

Давайте рассмотрим 6 способов найти карту сайта. Первые 2 способа требуют наличия доступа к веб-сайту, а последние 4 – более общие способы поиска карты сайта любого веб-сайта.

Проверьте, было ли оно отправлено в Google Search Console

Если у вас есть доступ к веб-сайту, первым способом найти карту сайта будет проверка того, была ли она уже отправлена ​​в Google Search Console.

Обратите внимание, что у вас должен быть доступ к свойству Google Search Console, для чего может потребоваться его предварительная проверка. Это можно сделать несколькими способами, но если у вас есть доступ к веб-сайту, это обычно довольно просто (вы можете прочитать о вариантах здесь).

Получив доступ, вы можете перейти в раздел "Карты сайта", который находится в разделе "Указатель" в меню слева. Если вы видите что-либо в «Отправленных картах сайта», вы можете щелкнуть по нему, после чего в правом верхнем углу появится ссылка «Открыть карту сайта». Это приведет вас к URL-адресу карты сайта.

Проверьте серверную часть CMS

Если карта сайта не была отправлена ​​в Google Search Console, следующим шагом будет проверка серверной части системы управления контентом веб-сайта.

Где именно его найти, во многом зависит от вашей CMS и ее структуры. На снимке экрана вы видите пример того, как это выглядит при поиске в установке Umbraco.

Если вы не можете найти его, взгляните на различные настройки и плагины/расширения, которые вы используете. Поскольку он обычно используется для улучшения SEO, вы обычно найдете его среди других настроек, связанных с SEO.

Проверьте наиболее распространенные местоположения файлов Sitemap

Хотя для первых двух способов требуется доступ к веб-сайту, для следующих нескольких советов этого не требуется.

Поскольку карты сайта обычно стандартизированы, этот способ найти их — просто попробовать некоторые из наиболее распространенных местоположений. Хотя нет никакой гарантии, что карта сайта будет там найдена, это быстрый способ проверить, находится ли она в наиболее часто используемых местах.

В Google несколько языков файлов Sitemap.

Во всех форматах следует использовать стандартный протокол. В настоящее время Google не ходит в файлы Карта сайта атрибуты

Вот пример XML-файла Sitemap с одним URL:

RSS, mRSS и Atom 1.0

Текст

Правила создания текстовых файлов Карта сайта

  • Необходимо использовать кодировку UTF-8.
  • В файл Sitemap можно добавить только URL.
  • Этому текстовому файлу можно дать любое имя, но необходимо использовать расширение .txt (например, sitemap.txt).

Файлы Sitemap с расширенным синтаксисом

Google поддерживает расширенный синтаксис файлов Карта сайта для описания ниже MIME-типов. С помощью дополнительных элементов можно описывать видео, изображения и плохо поддающийся анализу контент, чтобы они лучше индексировались.

Общие рекомендации в отношении файлов Карта сайта

Кроме того, все URL-адреса (включая адрес файла Sitemap) должны быть правильно экранированы и закодированы, чтобы их мог обработать веб-сервер. Обычно это происходит автоматически, если для создания URL-адреса вы запрашиваете какой-либо шаблон, инструмент или файл журнала, то есть не вводите адрес вручную.Если при отправке файла Sitemap вы эффективно оживите, что Google не удалось найти ваши URL, убедитесь, что они соответствуют стандарту RFC-3986 для URI, стандарту RFC-3987 для IRI и стандарту XML.

Пример URL, где есть символ, не отображающийся к кодировке ASCII ( ü ), а также символ, который требует экранирования ( & ):

Этот же URL в кодировке ISO 8859 и с применением экранирования:

Этот же URL в кодировке UTF-8 и с применением экранирования:

Как создать файл Sitemap

Создайте файл Карта сайта, вы сообщаете поисковым системам, какие из ваших URL следует выбрать для показа в офисе. Такие URL являются каноническими. Если вы нашли соответствующий контент по показателю URL, выберите основной вариант страницы и добавьте его в файл Sitemap, только его.

Выберите URL-адрес, добавьте его в файл Sitemap, создайте его из контекста ниже. Оптимальный вариант будет зависеть от архитектуры и размеров сайта.

  • Файл Sitemap можно сгенерировать с помощью системы управления контентом.
  • Если в файле уже используется URL-адрес или меньше, попробуйте создать его вручную.
  • Если ожидается, что файл Sitemap будет очень большим, создадим его автоматически.

Как создать файл Sitemap с помощью системы управления контентом

Если вы работаете с системой управления контентом, такой как WordPress, Wix или Blogger, то возможно, что она уже сгенерировала файл Sitemap, доступный поисковым системам. Попробуйте найти сведения о том, как ваша система управления контентом создает файлы Sitemap, или о том, как подготовить такой файл, если она не сделала это автоматически. Например, если вы работаете с Wix, введите в поиске Google запрос «wix sitemap».

В остальных случаях вам может понадобиться создать файл Sitemap самостоятельно.

Как создать файл Sitemap вручную

Если вы планируете добавить в файл Sitemap, его существующий URL-адрес может быть создан вручную. Для этой библиотеки текстовый редактор, такой как Блокнот (Windows) или nano (Linux, macOS), и начните вносить в новый файл данные в соответствии с синтаксисом, который описан в разделе Форматы файлов Карта сайта выше.

Вручную можно создавать и увеличивать файлы Sitemap, но это очень трудоемкий процесс.

Как создать файл Sitemap автоматически

Если вам нужно включить в файл Sitemap его URL-адрес, то желательно будет создать автоматически. Сгенерировать файл Sitemap можно с помощью различных инструментов, но лучше всего использовать ресурсы вашего сайта. Например, вы можете выбрать URL-адрес, найти сайт, из его базы данных и экспортировать этот адрес на экран или в файл на следующем веб-сервере. При необходимости обратитесь к разработчикам или серверам. сбор с нашей подборкой внешних генераторов файлов Карта сайта: вы можете создать их на основе аналогового инструмента.

Как сделать файл Sitemap более ранним для Google

Файл Sitemap анализируется только при первом его обнаружении, а не при каждом сканировании сайта. Чтобы файл был восстановлен, перенос нам, что данные в нем изменились. Это делается с помощью запроса ping. Не добавляйте несколько файлов Sitemap и не отправляйте запросы ping, если в файл не вносились изменения и он не был новым.

Если вы обновляли страницы, включенные в такой файл, отметьте их с помощью поля . В XML-файлах других типов есть такие поля (например, в Atom XML это поле). Подробнее о том, как определить нужный…

Предоставить Google доступ к файлу Sitemap можно множеству способов:

  • Отправить файл через интерфейс отчета.
  • Выполнение запроса ping. GET на приведенный ниже адрес, указав полный URL файла Карта сайта и убедившись, что этот файл доступен:

Устранение неполадок, использующих при обработке файлы Sitemap

Если не указано иное, содержимое этой страницы предоставляется по лицензии Creative Commons Attribution 4.0, а образцы кода — по лицензии Apache 2.0. Подробнее см. в Правилах сайта Google Developers. Java является зарегистрированным товарным знаком Oracle и/или ее дочерних компаний.

Теперь, когда вы создали карту сайта и отправили ее в консоль поиска Google, вы получили сообщение об ошибке:

Ваш файл Sitemap выглядит как HTML-страница. Вместо этого используйте поддерживаемый формат карты сайта.

Из этого сообщения видно, что ваша карта сайта — это всего лишь HTML-страница для поисковых роботов Google. Таким образом, вместо поиска XML-страницы робот Googlebot находит HTML-страницу, формат которой отличается от требуемого ему поддерживаемого формата.

Теперь давайте решим проблему и посмотрим, как это работает.

Во-первых, обязательно протестируйте карту сайта своего блога или веб-сайта с помощью этого онлайн-инструмента. Все, что вам нужно, это ввести точный URL-адрес вашей карты сайта и нажать «Подтвердить» внизу этой страницы. Как правило, вы увидите недопустимый формат XML. Это решения для устранения проблемы с Google Search Console.

Отключить кеширование XML-карты сайта

Подключаемые модули кэширования WordPress создают кэшированную копию вашей карты сайта в формате XML. Итак, с этим кешем они добавляют оптимизации, а иногда и минимизируют XML и тому подобное. Другими словами, эти инструменты могут сохранить неправильный файловый кеш из-за оптимизации.

Чтобы решить эту проблему, вам нужно исключить страницу карты сайта из параметра кеша, а затем полностью очистить кеш WordPress. Итак, если вы используете популярный плагин, вы найдете такие параметры, как фильтры или исключение кэширования страниц в их настройках. Это работает для популярных плагинов, таких как W3 Total Cache, WP Super Cache, WP Rocket, HyperCache и других.

Например, в W3 Total Cache вы можете исключить кэш карты сайта, нажав «Кэш страницы» в разделе «Производительность». Затем прокручивайте, пока не увидите параметр «Никогда не кэшировать следующие страницы». Затем добавьте карту сайта в список. Если вы используете подключаемый модуль карты сайта Google XML, добавьте sitemap.xml, а если вы используете подключаемый модуль Yoast для карты сайта XML, добавьте sitemap_index.xml и сохраните изменения, а затем очистите кеш.

Обратите внимание: если вы используете файлы Sitemap для видео, изображений или авторов, добавьте их в основной файл Sitemap. Вы также можете полностью очистить сеть CDN, если вы ее используете.

Вы также можете создать группу агента пользователя для робота Googlebot, но это не гарантирует работу. Поэтому я предпочитаю отключать кэш XML, чтобы избежать ошибок и предупреждений в вашей учетной записи консоли Google.

Если вы используете подключаемый модуль HyperCache WordPress, вы найдете параметры отклонения URL.

Пользователи WP Rocket могут найти этот параметр в разделе «Дополнительные настройки» в меню WP Rocket на панели инструментов WordPress. Они могут добавить URL-адрес своей карты сайта в поле «Никогда не кэшировать следующие страницы».

Использовать параметр таблицы стилей по умолчанию

По умолчанию подключаемый модуль генератора карт сайта Google XML использует свой файл таблицы стилей, чтобы страница выглядела хорошо. Но по многим причинам пользователи могут отключить эту опцию по ошибке. Таким образом, плагин покажет правильный XML-файл, но без каких-либо параметров форматирования или стиля. Вот почему, когда вы щелкаете URL-адрес своей XML-карты сайта в браузере, вы увидите страницу, полную строк с предупреждением вверху, подобным этому сообщению:

Похоже, что с этим файлом XML не связана никакая информация о стиле

XML будет выглядеть следующим образом:

Теперь, чтобы решить эту проблему, используйте меню области администрирования WordPress и нажмите «XML-Sitemaps» в разделе «Настройки». Затем прокрутите немного в разделе «Основные параметры» и установите флажок «использовать по умолчанию», как показано на следующем снимке экрана, который я создал.

Наконец, нажмите кнопку «Обновить параметры», и все снова заработает. Очистите кеш браузера, сделайте то же самое для кеша WordPress и снова проверьте XML.

Если вы используете другой подключаемый модуль, обратитесь в их службу поддержки и при необходимости запросите их вариант таблицы стилей.

Приведенное выше решение подойдет большинству пользователей WordPress. Но со многими сложностями в настройках сервера и плагинов проблема может быть вызвана другими вещами. Итак, добавьте свое собственное решение в разделе комментариев ниже и позвольте другим решить их проблему. Карта сайта в формате XML — это один из лучших способов позволить Google и другим поисковым системам лучше сканировать ваш сайт. Без действительного формата карты сайта робот Googlebot не сможет найти все ваши сообщения и страницы и просканировать их.

Инструменты Google для веб-мастеров поддерживают 9 форматов файлов Sitemap. Файлы Sitemap позволяют веб-мастеру информировать различные поисковые системы о ссылках на веб-сайты, которые доступны для сканирования. Карты сайта также предоставляют веб-мастерам информацию о каждом URL-адресе в XML-файле.Дополнительные сведения включают дату последнего обновления URL-адреса, частоту его изменений и важность по сравнению с другими URL-адресами на веб-сайте. Это позволит поисковым системам более эффективно сканировать сайт. Существуют различные способы создания карты сайта в зависимости от типа веб-сайта или публикуемого контента. Это необходимо, потому что аудиты контента используют карты сайта для сканирования, таким образом предоставляя информацию о том, как сделать его лучше. Использование правильных типов файлов Sitemap не только способствует более успешному сканированию веб-сайта, но и повышает его популярность в поисковых системах.

Вся информация, содержащаяся в сгенерированной карте сайта, нужна поисковым системам при предоставлении пользователям Интернета результатов поиска. Независимо от того, создает ли веб-сайт новичок или профессиональный веб-мастер, важно знать, какой тип карты сайта идеально подходит для веб-сайта (и содержимого на нем) и как его создать, чтобы максимально раскрыть его потенциал.


XML-файлы Sitemap для веб-страниц

Эти файлы будут использоваться для отправки страниц с веб-сайта.


RSS 2.0 и Atom 1.0

Фиды RSS 2.0 иногда автоматически создаются во многих блогах.

  • RSS означает Really Simple Syndication и представляет собой формат распространения контента веб-сайта. Это разновидность языка XML.
  • На самом высоком уровне документ RSS представляет собой элемент RSS с обязательным атрибутом версии, который указывает, какой версии RSS документ будет соответствовать. Если он соответствует спецификации, версия должна быть 2.0.

Фиды Atom 1.0 представляют собой документы на основе XML. Каналы состоят из «записей», и каждая запись состоит из большого количества метаданных, и у каждой записи есть заголовок.

  • Атомы в основном используются в блогах и заголовках новостных сайтов.
  • Atom используется как альтернатива RSS, разработанная, поскольку считалось, что у RSS есть недостатки.
  • Говорят, что формат Atom четко и тщательно определен, свободно расширяется для всех, реализуется всеми и абсолютно не зависит от поставщика.
  • Многие приложения, включая iTunes, поддерживают использование Atom 1.0.
  • Использование формата Atom позволяет снова использовать элементы вне контекста документа фида, который не является Atom.
  • Atom удобно использовать, когда ссылки на ресурсы и содержимое содержат символы, не входящие в стандартный набор символов ASCII США.


Текстовые файлы с URL-адресами веб-страниц

Если вы не можете создать карты сайта в любом из перечисленных выше форматов, вы можете создать текстовый файл, содержащий ваш URL. Карта сайта будет иметь один URL-адрес в строке, и многие поисковые системы, такие как Google и Yahoo, могут сканировать карты сайта в текстовых файлах. Чтобы убедиться, что карты сайта и поисковые системы совместимы. Выполните следующие действия:

  • Текстовые файлы Sitemap не должны содержать более 50 000 URL-адресов.
  • Для Yahoo основная текстовая карта сайта должна называться urllist.txt.
  • Текстовые файлы Sitemap следует сохранять как документы UTF-8. Это особенно важно, если вы имеете дело с веб-сайтом, на котором используются неанглийские символы.


XML-файлы Sitemap для поиска видео

Видео на вашем веб-сайте можно проиндексировать и сделать доступными для поиска в Google Video. Карты сайта Google Video предоставляют Google метаданные о видео и его содержании на веб-сайте. Видеосайт Google является крупнейшим объектом для поиска видео в Интернете, и с помощью карты сайта для видео владельцы веб-сайтов могут сообщить поисковой системе категорию, название, описание, продолжительность и аудиторию, предназначенную для каждого видео, которое находится на веб-сайт. Это помогает поисковой системе получить информацию о богатом видеоконтенте на веб-сайте, что, в свою очередь, улучшит позицию веб-сайта при просмотре в результатах поиска видео.

  • Информация о видео (включая URL-адреса) доступна для поиска, если она представлена ​​в виде отдельной карты сайта или включена в обычную карту сайта в поиске видео поисковой системы.
  • Затем видео будут отображаться в виде эскиза видео вместе с соответствующей информацией, взятой из карты сайта.


Медиа RSS-каналы для поиска видео

mRSS-каналы являются расширением RSS-каналов, и основное отличие состоит в том, что в карте сайта указано, что это мультимедийное расширение RSS. Это необходимо для того, чтобы приложения для чтения новостей знали, что в ленте есть медиаданные, и, в свою очередь, знали, как их интерпретировать.


XML-файлы Sitemap для Google Code Search

Эта функция используется, когда Google ищет файлы исходного кода в Интернете. Это полезно для владельцев веб-сайтов, чьи веб-сайты содержат исходный код, поскольку они могут создавать карты сайта, которые помогают Google индексировать код.Карта сайта Code будет выглядеть как обычная карта сайта XML, но у нее есть некоторые дополнительные требования к карте сайта XML и теги.

  • Помните, что при создании карты сайта для кода вы должны убедиться, что включены все соответствующие расширения файлов для файлов с кодом.
  • Возможно, вам также потребуется ужесточить шаблоны имен файлов, которые принимаются в качестве файлов кода.
  • Оба этих действия можно выполнить с помощью выходных фильтров при создании карты сайта.


XML-файлы Sitemap для мобильных веб-страниц

Этот формат позволяет разработчикам распознавать контент, оптимизированный для мобильных устройств, поскольку в последнее время формат претерпел небольшие изменения.

  • Не следует создавать карту сайта для обычных телефонов, если только не существует конкретной версии веб-сайта для обычных телефонов, предназначенной для обычных телефонов (не смартфонов).
  • Можно создать отдельную карту сайта со списком видеоконтента или добавить информацию о видеоконтенте в уже существующую карту сайта. Это просто вопрос удобства создателя веб-сайта.
  • Карта сайта для обычных телефонов использует протокол карты сайта с дополнительными требованиями к пространству имен и тегам.
  • Если вы решили использовать инструмент для создания карты сайта, убедитесь, что он может создавать карты сайта для мобильных веб-страниц.
  • Необходимо включить этот тег, чтобы обеспечить правильное сканирование мобильных URL.
  • Список URL-адресов, которые обслуживают несколько языков разметки, в одном файле Sitemap.
  • Search Console автоматически обнаружит и поддержит мобильный профиль XHTML, WML и cHTML.


XML-файлы Sitemap для геоданных

Это используется, когда на вашем веб-сайте есть географические данные в виде файлов GeoRSS или KML.

  • Поисковые системы совершенствуют и изобретают новые способы использования данных о местоположении.
  • Если у поисковой системы есть данные о местоположении пользователя, она переместит результаты в верхней части страницы результатов поиска любых искомых элементов.
  • Это происходит, даже если пользователь не указывает свое местоположение в условиях поиска. Вот почему владельцам веб-сайтов так важно иметь точную информацию о местоположении, включенную в их веб-сайт.
  • Географическая карта сайта — это особая форма XML, содержащая всю географическую информацию обо всех местоположениях.
  • Существуют специальные генераторы карт сайта для геоданных. Они полезны для начинающих веб-мастеров.
    • Найдите нужный инструмент для создания географической карты сайта.
    • Правильно заполните информацию о своей компании.
    • Укажите сведения о веб-сайте.
    • Теперь вы можете загрузить детали KML и географической карты сайта, а затем загрузить их на свой веб-сайт. Используйте FTP-загрузчик.
    • отправьте географическую карту сайта своему веб-мастеру.


    Файлы XML Sitemap для новостей

    Веб-сайты, предназначенные для новостей, теперь могут отправлять свои новости прямо через этот специальный формат карты сайта. Эти пользователи должны сначала зарегистрироваться в Новостях Google, прежде чем файлы смогут быть обработаны.

    • Карта сайта новостей должна быть «актуальной» — она должна содержать только URL-адреса статей, опубликованных за последние 2 дня. Статьи старше 2 дней могут быть удалены из карты сайта новостей, но останутся в индексе новостей в течение 30 дней.
    • Создателям веб-сайтов рекомендуется постоянно обновлять файлы Sitemap для новостей и добавлять свежие статьи по мере их публикации.
    • При создании карты сайта для новостей она может содержать не более 1000 URL-адресов. Чтобы включить больше, вы должны разбить URL-адреса на несколько карт сайта, а затем использовать файл индекса карты сайта, чтобы упростить управление ими.
    • Используйте формат XML, указанный в протоколе карты сайта. Файл индекса карты сайта, в котором не должно быть более 50 000 карт сайта. Причиной этого ограничения является гарантия того, что веб-сервер не будет перегружен при обслуживании больших файлов.
    • Когда новостная статья публикуется, вам не следует каждый раз создавать карту сайта для новостей. Вы должны обновить текущую карту сайта с новыми URL-адресами статей.
    • Не используйте генератор карты сайта Google для создания новой карты сайта, так как в нее будут включены URL-адреса, не соответствующие определенным новостным статьям. Существует множество сторонних инструментов для создания карты сайта для новостей Google.
    • После создания карты сайта загрузите ее в каталог верхнего уровня, содержащий ваши новостные статьи.

    Веб-мастер должен либо выбрать правильный формат карты сайта для веб-сайта, либо создать карту сайта с помощью генератора, который предоставит правильный тип. При выборе типа карты сайта веб-мастер должен учитывать тип контента, который будет размещен на веб-сайте, а также любые соответствующие геоданные. Правильное выполнение всех этих действий не только облегчит сканирование, но и поможет обеспечить правильное форматирование веб-сайта и его точность в поисковых системах.Если владелец веб-сайта не уверен, какой формат карты сайта использовать, он должен просмотреть свое содержание и выбрать тот, который лучше всего подходит для них.

    Читайте также: