Обнаружены ошибки в файлах карты сайта

Обновлено: 21.11.2024

Используйте отчет о файлах Sitemap, чтобы сообщать Google о любых новых файлах Sitemap для вашего ресурса, просматривать историю отправки файлов Sitemap и любые ошибки, обнаруженные Google при анализе отправленных вами файлов Sitemap.

Что такое карта сайта? Нужен ли мне этот отчет?

Карта сайта – это файл на вашем сайте, который сообщает Google, о каких страницах вашего сайта нам следует знать.

  • Если вы используете службу веб-хостинга, такую ​​как Squarespace или Wix, они могут создать для вас карту сайта, и в этом случае вам не нужно использовать карты сайта или этот отчет. Найдите у своего хостинг-провайдера информацию о файлах Sitemap.
  • Если у вас небольшой сайт (менее 100 страниц) и вы можете перейти на любую страницу своего сайта, перейдя по одной или нескольким ссылкам с главной страницы, вам не нужно использовать файлы Sitemap или этот отчет. В этом случае просто запросите индексацию своей главной страницы (если только вы не используете услугу веб-хостинга, как упоминалось ранее, и в этом случае вам вообще ничего не нужно делать).

Управление файлами Sitemap

Для управления файлами Sitemap также можно использовать API Sitemaps Search Console. API предоставляет все те же функции и информацию, что и этот отчет.

"Отправка" карты сайта означает сообщение Google, где ее найти на вашем сайте. На самом деле вы не можете загрузить карту сайта в Google.

Чтобы отправить новую карту сайта для сканирования:

  1. Предпосылки:
    • У вас должны быть права владельца ресурса, чтобы отправить карту сайта с помощью отчета о файлах Sitemap. Если у вас нет разрешений владельца, вместо этого вы можете указать его в файле robots.txt.
    • Обратите внимание, что в отчете может отображаться не более 1000 отправленных файлов Sitemap. Вы можете отправить больше, но здесь могут быть показаны только 1000 (которые не отображаются в порядке отправки). В настоящее время нет никакого способа увидеть лишние файлы Sitemap в Search Console.
  2. Разместите карту сайта на своем сайте.
    • Карта сайта должна использовать один из допустимых форматов карты сайта. Следуйте рекомендациям по синтаксису, местоположению файла и т. д. для файла Sitemap.
    • Мы рекомендуем размещать карту сайта в корневом каталоге вашего сайта, но если вы используете службу хостинга сайта (такую ​​как Blogger, Wix или GoDaddy), вам следует прочитать документацию по вашей службе, чтобы узнать, где и как опубликовать карту сайта (или даже необходимо).
    • Карта сайта должна быть доступна для робота Googlebot и не должна быть заблокирована какими-либо требованиями входа в систему. Вы можете проверить, доступна ли карта сайта роботу Googlebot, проверив, можете ли вы перейти по URL-адресу карты сайта в режиме инкогнито.
  3. Откройте отчет о файлах Sitemap.
  4. Введите относительный URL-адрес карты сайта в отчет о файлах Sitemap и нажмите "Отправить".

Карта сайта должна быть обработана немедленно. Однако сканирование URL-адресов, перечисленных в карте сайта, может занять некоторое время, и возможно, что не все URL-адреса в карте сайта будут просканированы, в зависимости от размера сайта, активности, трафика и т. д.

Повторно отправить карту сайта

Вам не нужно повторно отправлять карту сайта, о которой мы уже знаем, даже если вы ее изменили. Google заметит любые изменения при следующем сканировании вашего сайта.

Удалить карту сайта

При удалении карты сайта она удаляется из этого отчета, но Google не забывает карту сайта или любые указанные в ней URL-адреса. Если вам действительно нужно, чтобы Google перестал посещать URL-адреса, указанные в карте сайта, вам потребуется использовать правило robots.txt.

Чтобы удалить карту сайта:

  1. В таблице основного отчета о файлах Sitemap найдите и щелкните файл Sitemap, который вы хотите удалить.
  2. На странице сведений о карте сайта нажмите кнопку дополнительных параметров.
  3. Нажмите Удалить карту сайта.
  4. Чтобы Google больше не посещал карту сайта, либо используйте правило robots.txt, чтобы заблокировать ее чтение Google, либо удалите файл карты сайта со своего сайта.

Чтение отчета

  • В этом отчете показаны только те файлы Sitemap, которые вы отправили с помощью этого отчета или API. Он не показывает какие-либо карты сайта, обнаруженные с помощью ссылки robots.txt или других методов обнаружения. Однако, даже если мы уже обнаружили карту сайта с помощью других средств, вы все равно можете отправить ее с помощью этого отчета, чтобы отслеживать наши успехи и количество ошибок.
  • В отчете показаны только те файлы Sitemap, которые относятся к текущему ресурсу.
  • Вы можете отправить изображения, видео или URL-адреса новостей в карту сайта. Однако в настоящее время в отчете нет данных для этих типов URL.

Для каждой карты сайта отображается следующая информация:

Моей карты сайта нет в списке!

Вот несколько причин, по которым ваш файл Sitemap может не отображаться в отчете:

Ошибки файла Sitemap

Отчет о файлах Sitemap сообщает о следующих ошибках.

URL недоступны

Google обнаружил ошибку при попытке сканирования URL-адреса в вашей карте сайта. Проверьте URL-адрес в карте сайта с помощью инструмента проверки URL-адресов, чтобы узнать, доступен ли URL-адрес для Google.

URL не отслеживаются

Google не удалось просканировать все URL-адреса, указанные в вашей карте сайта. Вот несколько возможных причин:

  • URL содержит слишком много переадресаций для поисковых роботов Google. Мы предлагаем вам заменить все URL-адреса перенаправления в ваших картах сайта URL-адресами, которые действительно должны сканироваться.
    • Если вы постоянно перенаправляете с одной страницы на другую, используйте постоянную переадресацию.
    • Избегайте использования переадресации JavaScript или мета-обновления.

    URL запрещен

    Ваша карта сайта содержит некоторые URL-адреса, которые находятся на более высоком уровне или в другом домене, чем файл карты сайта.

    Ошибка сжатия

    Google обнаружил ошибку при попытке распаковать сжатый файл карты сайта. Повторно сожмите карту сайта (с помощью такого инструмента, как gzip), загрузите ее на свой сайт и отправьте повторно.

    Пустой файл Sitemap

    Ваша карта сайта не содержит URL-адресов. Проверьте свою карту сайта, чтобы убедиться, что она не пуста.

    Ошибка размера файла карты сайта: размер вашей карты сайта превышает максимально допустимый размер файла.

    Ваша карта сайта в несжатом виде превышает 50 МБ. Если ваша карта сайта больше установленного лимита, разбейте ее на несколько файлов меньшего размера, перечислите их в файле индекса карты сайта и отправьте файл(ы) индекса карты сайта.

    Недопустимое значение атрибута

    Вы присвоили недопустимое значение атрибуту тега XML. Проверьте свои карты сайта, чтобы убедиться, что присутствуют только разрешенные атрибуты, и что вы назначаете только разрешенные значения в соответствии со спецификациями карты сайта. Проверьте атрибуты и значения на наличие опечаток.

    Недопустимая дата

    Ваш файл Sitemap содержит одну или несколько недопустимых дат. Эта ошибка может быть связана с тем, что дата имеет неправильный формат или сама дата недействительна. Даты должны использовать кодировку даты и времени W3C, хотя вы можете опустить часть времени. Убедитесь, что ваши даты соответствуют одному из следующих форматов даты и времени W3C:

    Указывать время необязательно (время по умолчанию – 00:00:00 по Гринвичу), но если вы указываете время, необходимо также указать часовой пояс.

    Недопустимое значение тега

    Ваша карта сайта содержит один или несколько тегов с недопустимым значением. Проверьте характеристики своего типа карты сайта (индекс, стандарт, видео и т. д.).

    Неверный URL

    Убедитесь, что URL-адреса, указанные в карте сайта, закодированы для удобства чтения и правильно экранированы. Проверьте наличие неправильных символов, таких как пробелы или кавычки. Вы также можете попробовать скопировать URL-адрес в браузер, чтобы проверить, сможет ли браузер понять URL-адрес и загрузить страницу.

    Недопустимый URL-адрес в файле индекса карты сайта: неполный URL-адрес

    Обновите файл индекса карты сайта, включив в него полный путь к каждому указанному файлу карты сайта, а затем отправьте повторно.

    Недопустимый XML: слишком много тегов

    Ваша карта сайта содержит повторяющиеся теги. Например, следующая запись вызовет эту ошибку, поскольку тег указан дважды:

    В ошибке указан проблемный тег и номер строки. Удалите повторяющийся тег и повторно отправьте карту сайта.

    Отсутствует атрибут XML

    У тега в карте сайта отсутствует обязательный атрибут. Проверьте свои карты сайта, чтобы убедиться, что все обязательные атрибуты отсутствуют. После того как вы исправите значения атрибутов, повторно отправьте карту сайта.

    Отсутствует тег XML

    В одной или нескольких записях на карте сайта отсутствует обязательный тег. В сообщении об ошибке указан номер строки. Просмотрите страницу основных сведений о карте сайта, чтобы узнать о необходимых тегах.

    Отсутствует URL эскиза

    В одной или нескольких видеозаписях отсутствует URL миниатюры. Убедитесь, что расположение всех URL миниатюр указано с помощью тега.

    Отсутствует название видео

    В одной или нескольких видеозаписях отсутствует заголовок. Убедитесь, что у каждого видео в вашей карте сайта есть заголовок, указанный в теге.

    Неправильный формат индекса карты сайта: вложенные индексы карты сайта

    Одна или несколько записей в файле индекса карты сайта используют собственный URL-адрес или URL-адрес другого файла индекса карты сайта. Файл индекса карты сайта не может отображать другие файлы индекса карты сайта, только файлы карты сайта.

    Удалите все записи, указывающие на файлы индекса карты сайта, а затем повторно отправьте карту сайта.

    Ошибка синтаксического анализа

    Google не удалось проанализировать XML карты сайта.

    Часто эта проблема возникает из-за неэкранированного символа в URL. Как и во всех XML-файлах, любые значения данных (включая URL-адреса) должны использовать escape-коды сущностей для определенных символов, таких как & ' " < >символы. Убедитесь, что ваши URL-адреса правильно экранированы.

    Временная ошибка

    В нашей системе возникла временная проблема, из-за которой мы не смогли обработать вашу карту сайта. Как правило, когда вы получаете эту ошибку, вам не нужно повторно отправлять карту сайта. Google может попытаться снова получить вашу карту сайта позже. Если ошибка не устранена через несколько часов, попробуйте повторно отправить файл Sitemap.

    Слишком много файлов Sitemap в индексном файле Sitemap

    В вашем файле индекса карты сайта содержится более 50 000 карт сайта.Разделите индекс карты сайта на несколько файлов индекса карты сайта и убедитесь, что в каждом из них содержится не более 50 000 карт сайта.

    Слишком много URL в карте сайта

    В вашей карте сайта указано более 50 000 URL-адресов. Разделите карту сайта на несколько карт сайта и убедитесь, что каждая из них содержит не более 50 000 URL-адресов. Вы также можете использовать файл индекса карты сайта для управления файлами карты сайта.

    Неподдерживаемый формат

    Ваша карта сайта имеет неподдерживаемый формат.

    Некоторые распространенные ошибки XML:

    • В карте сайта должен использоваться правильный заголовок. Например, если ваша карта сайта содержит информацию о видео, она будет иметь следующий заголовок:
    • Пространство имен в заголовке должно быть "http://www.sitemaps.org/schemas/sitemap/0.9" (не .9).
    • Все XML-атрибуты должны быть заключены либо в одинарные ('), либо в двойные (") кавычки, и эти кавычки должны быть прямыми, а не фигурными. Программы обработки текстов, такие как Microsoft Word, могут вставлять фигурные кавычки.

    Несоответствие пути: отсутствует www

    Измените карту сайта, чтобы удалить "www" из всех URL-адресов, чтобы они соответствовали местоположению вашей карты сайта.

    Несоответствие пути: включает www

    Измените карту сайта, чтобы добавить "www" ко всем URL-адресам, чтобы они соответствовали местоположению вашей карты сайта.

    Неверное пространство имен

    Корневой элемент вашей карты сайта не содержит правильного пространства имен, или пространство имен объявлено неправильно, или содержит опечатку или неверный URL.

    Убедитесь, что вы используете правильное пространство имен для вашего типа файла. Например:

    • Файл карты сайта: xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
    • Файл карты сайта для видео: xmlns:video="http://www.google.com/schemas/sitemap-video/1.1"
    • Файл карты сайта index: .

    Ведущий пробел

    Ваша карта сайта начинается с ведущего пробела, а не с объявления пространства имен. Файлы XML должны начинаться с объявления XML, указывающего используемую версию XML.

    Эта ошибка не помешает Google обработать вашу карту сайта, но вы можете удалить пробел, чтобы файл соответствовал стандарту XML и больше не появлялась эта ошибка.

    Миниатюра слишком большая

    Эскиз видео, указанный в карте сайта, слишком велик. Измените размер миниатюры видео до 160 x 120 пикселей. Обновите карту сайта новой информацией, а затем отправьте ее повторно. Подробнее о добавлении информации о видео в карту сайта.

    Миниатюра слишком маленькая

    Эскиз видео, указанный в карте сайта, слишком мал. Измените размер миниатюры видео до 160 x 120 пикселей. При необходимости обновите карту сайта. Подробнее о добавлении информации о видео в карту сайта.

    Местоположение видео и страница воспроизведения совпадают

    В карте сайта для видео URL-адрес видеоконтента и URL-адрес проигрывателя не могут совпадать. Если вы укажете и , и , URL-адреса должны быть разными. Подробнее о добавлении информации о видео в карту сайта.

    URL местоположения видео выглядит как URL страницы воспроизведения

    Карта сайта содержит URL-адреса, заблокированные файлом robots.txt

    Google не может получить доступ к вашей карте сайта или не может получить доступ ко всему контенту, указанному в вашей карте сайта, поскольку он заблокирован файлом robots.txt. Используйте инструмент проверки URL, чтобы убедиться, какой файл заблокирован, и измените файл robots.txt, чтобы разрешить роботу Googlebot доступ к нему.

    Сегодня я хочу поделиться некоторыми советами по быстрому устранению ошибок в XML-файлах карты сайта. Этот пост научит вас нескольким новым трюкам с любимым поисковым роботом Screamingfrog, инструментом, который представляет собой фантастическую проверку XML-карты сайта. Я надеюсь, что это руководство сэкономит вам время при проведении собственного SEO-аудита.

    К концу этого руководства ваша XML-карта сайта будет проверена на наличие ошибок 404 (или ошибок 5xx и т. д.).

    Зачем веб-сайту нужен безошибочный файл sitemap.xml?

    Совет, который мы всегда слышим от Google, таков: проверяйте свои файлы Sitemap и по возможности не допускайте ошибок. Файл карты сайта используется для объявления предпочтительного канонического URL.

    Обратите внимание, что ошибка в файле карты сайта является довольно серьезной проблемой, и ее лучше избегать.

    Я всегда считал, что файл карты сайта с очень низким временем загрузки также рекомендуется, если вы можете ускорить динамические элементы создания файла. Я сталкивался с очень большими картами сайта, которые явно регенерируются при каждом запросе без какого-либо кэширования. Проверьте это внимательно.

    Добавление и проверка новой карты сайта в (старой) Search Console.

    Предыдущая версия Google Search Console по-прежнему предлагает лучшую функциональность по сравнению с новой версией, которая в настоящее время крайне ограничена:

    Я обновлю эту статью, если появятся новые функции, в чем я совершенно уверен.

    Настройте Screamingfrog для сканирования только URL-адресов, найденных в карте сайта XML

    Screaming Frog – очень любопытный маленький поисковый робот. Конфигурация по умолчанию, даже в режиме списка, будет сканировать намного больше ресурсов, чем вам может понадобиться. Вот как настроить сканер:

    Перейдите в «Настройка» > «Паук» и снимите все флажки на вкладке «Основные». Это предотвратит обнаружение Frog новых URL-адресов или ненужное сканирование ресурсов, которые бесполезны для этого проекта.

    После настройки все готово. Вот краткое изложение процесса, которому я собираюсь научить вас сегодня:

    Как проверить файл Sitemap XML на наличие ошибок с помощью Screaming Frog

    1. Откройте Screamingfrog и выберите «Режим списка».
    2. Возьмите URL файла sitemap.xml
    3. Перейдите к загрузке > Загрузить файл Sitemap
    4. Frog подтвердит URL-адреса, найденные в файле карты сайта.
    5. Нажмите «Старт», чтобы начать сканирование.
    6. Экспортируйте данные в CSV или отсортируйте их по коду состояния, чтобы выявить потенциальные проблемы.

    Откройте Screamingfrog и выберите «Режим списка»

    Откройте Screamingfrog и выберите «Список» в раскрывающемся меню «Режим»:

    Теперь перейдите и получите URL-адрес sitemap.xml.

    Возьмите URL вашего файла sitemap.xml

    Во-первых, найдите URL-адрес файла Sitemap в формате XML. Если это ваш веб-сайт, очевидно, вы просто будете знать об этом. Он находится либо в «/sitemap.xml», либо в «/sitemap_index.xml».

    Он также должен быть доступен в отчете о картах сайта в Search Console или в вашем файле robots.txt:

    Вы можете посетить URL-адрес карты сайта в своем браузере. Вот как выглядит файл sitemap.xml для Builtvisible, сгенерированный плагином Yoast SEO:

    Скопируйте заголовок URL в Screamingfrog.

    Перейти к загрузке > Загрузить файл Sitemap

    Перейдите к загрузке > Загрузите карту сайта и вставьте URL-адрес в диалоговое окно:

    Frog подтвердит URL-адреса, найденные в файле карты сайта, в следующем диалоговом окне:

    Нажмите "ОК", и сканер запустится автоматически.

    После завершения сканирования вы можете экспортировать данные в CSV или отсортировать их по коду состояния, чтобы выделить возможные проблемы. Вам не нужна переадресация 301 или ошибка 404 — действуйте и решайте эти проблемы!

    Вы создали карту сайта, отправили ее в Google, но неожиданно статус вашей карты сайта не Успешно? Или, может быть, ваш отчет Sitemap выглядит хорошо, но вы решили также проверить Покрытие индекса отчет, и кажется, что Google игнорирует вашу вежливую просьбу и не будет индексировать многие из страницы из вашей карты сайта. Итак, теперь вы задаетесь вопросом, можете ли вы что-то сделать, чтобы улучшить свою статистику индексации. В любом случае, не ищите дальше, потому что все ответы вы найдете в этом посте.

    Если у вас еще нет карты сайта и вы хотите узнать, что такое хорошая карта сайта, посмотрите наш вводный ускоренный курс по созданию карты сайта. Там вы узнаете о преимуществах карты сайта и лучших методах работы с ней. Кроме того, вам следует обратиться к руководству, если вы еще не знаете, для чего используются теги и или что такое карта сайта видео или индексный файл карты сайта.

    В первой части этой публикации перечислены все ошибки, с которыми вы можете столкнуться в отчете GSC Sitemap. Итак, если вы ищете способ исправить некоторые проблемы, используйте оглавление, чтобы перейти к интересующим вас ошибкам.

    Во второй части представлены сведения, которые помогут вам максимально эффективно использовать карту сайта: вы узнаете, как найти мусорные страницы в карте сайта, где искать страницы, которые вы, возможно, не включили в файл карты сайта, и как чтобы побудить Google индексировать больше ваших страниц карты сайта. Поэтому настоятельно рекомендую всем внимательно изучить вторую главу этого поста.

    Исправление ошибок отчета Sitemap

    После того как вы отправите карту сайта в Google, вы увидите, удалось ли ему обработать файл, в столбце Статус. Если ваш файл соответствует всем правилам, статус должен быть Успешно. В этой главе мы обсудим два других кода состояния, а именно Не удалось получить и Есть ошибки

    У Google проблемы со сканированием вашего файла Sitemap

    Начнем с самого неблагоприятного сценария, когда Google не может получить файл карты сайта. В этом случае вам придется использовать инструмент проверки URL, чтобы выяснить, что может быть причиной проблемы.

    В инструменте проверки URL нажмите кнопку Тест в реальном времени и проверьте статус выборки страницы. Если написано Успешно, значит, ошибка на стороне Google.

    Ошибка «Не удалось получить» также может возникнуть, если вы отправили файл индекса карты сайта, а не одну карту сайта в GSC. Проблема должна быть решена так же, как и с одной картой сайта.

    Ошибки файла индекса Sitemap

    Теперь давайте перейдем к случаям, когда Google получил отправленный вами файл и обнаружил некоторые ошибки.

    С файлом индекса карты сайта Google необходимо дополнительно обработать все отдельные карты сайта, которые вы указали, чтобы наконец получить доступ к URL-адресам вашего веб-сайта. Если Google не сможет обработать URL-адреса, указанные в файле индекса карты сайта, вы получите сообщение об ошибке «Недопустимый URL-адрес в файле индекса карты сайта». Обычно это означает, что Google не может найти одну или несколько ваших карт сайта в указанных местах, потому что вы использовали неполные URL-адреса. Все URL-адреса, указывающие на отдельные карты сайта в файле индекса карты сайта, должны быть полностью определенными, иначе Google может не найти их.

    Кроме того, в файле индекса карты сайта не должны быть указаны другие файлы индекса карты сайта, только карты сайта. В этом случае вы получите сообщение Неверный формат индекса карты сайта: ошибка вложенных индексов карты сайта.

    Последняя ошибка: Слишком много файлов Sitemap в индексном файле Sitemap. Это может произойти с огромными веб-сайтами, на которых перечислено более 50 000 файлов Sitemap в одном файле.

    Размер файла Sitemap и ошибки сжатия

    Ограничения по размеру применяются как к файлам индекса карты сайта, так и к отдельным картам сайта. Размер файла карты сайта не должен превышать 50 МБ в несжатом виде, а файл не должен содержать более 50 000 URL-адресов. Если вы не будете следовать этим рекомендациям, вы получите сообщение об ошибке размера файла Sitemap. Вы можете узнать больше о разделении карты сайта на несколько файлов из нашего окончательного руководства по карте сайта.

    Теперь, хотя ваша карта сайта не должна быть огромной, она, естественно, не должна быть и пустой. Если вы отправите пустую карту сайта, вы получите соответствующую ошибку.

    Кроме того, я упомянул, что размер карты сайта в несжатом виде не должен превышать 50 МБ, но обычно сжимают карты сайта для экономии пропускной способности. Обычно для этой цели используется инструмент gzip, который добавляет расширение gz к карте сайта. Если вы видите ошибку сжатия в отчете GSC, это означает, что что-то пошло не так в процессе сжатия, и вы должны сделать это еще раз.

    У Google проблемы со сканированием URL-адресов вашей карты сайта

    По ряду причин Google может не сканировать некоторые URL-адреса, указанные в карте сайта. Давайте рассмотрим все такие ошибки.

    Карта сайта содержит URL-адреса, заблокированные файлом robots.txt. Ошибка довольно очевидна, поскольку GSC укажет вам на заблокированные URL-адреса. В зависимости от того, хотите ли вы, чтобы эти URL-адреса были проиндексированы, вам придется либо снять блокировку, либо удалить их из карты сайта.

    Другие ошибки, такие как недоступные URL-адреса, неотслеживаемые URL-адреса, недопустимые URL-адреса, не столь очевидны. Кратко пройдемся по каждому из них.

    Ошибка URL недоступна означает, что Google нашел вашу карту сайта в указанном месте, но не смог получить некоторые URL из вашего списка. В этом случае вам снова нужно использовать инструмент проверки URL, как если бы Google вообще не мог получить вашу карту сайта.

    Ошибка URL-адреса не отслеживается либо из-за того, что вы использовали относительные URL-адреса в карте сайта вместо полных URL-адресов, либо из-за проблем с переадресацией. Цепочки и циклы перенаправления, временные перенаправления, используемые вместо постоянного перенаправления, перенаправления HTML и JS могут привести к этим ошибкам.

    Google Search Console не указывает, что именно вызывает проблему, поэтому вам придется использовать другие инструменты, чтобы понять, какие проблемы необходимо устранить. Например, в инструменте аудита веб-сайта SE Ranking есть специальный раздел «Перенаправления», где вы можете проверить, есть ли на вашем веб-сайте проблемы с переадресацией.

    Если инструмент обнаружит какие-либо проблемы, вы сможете получить всю необходимую информацию о каждой ошибке, щелкнув количество страниц. Вы узнаете, на какой странице обнаружена ошибка и как эта страница связана с другими страницами. веб-сайта.

    Инструмент Аудит веб-сайтов от SE Ranking также предупредит вас о таких случаях.

    Google подозревает, что вы указали неправильные URL

    Синтаксические ошибки карты сайта

    Теперь в большинстве случаев вам не нужно беспокоиться об ошибке карты сайта из-за синтаксиса, потому что, если вы создаете карту сайта с помощью одного из специальных инструментов, они не должны смешиваться с тегами и атрибутами. Однако если у вас есть настраиваемый файл Sitemap, созданный вручную, вы можете столкнуться с одной из следующих проблем:

    • Недопустимое значение тега. Значение тега — это то, что вы ставите между открывающим и закрывающим тегом — URL между тегами, дату, которую вы указываете с помощью тега. Ошибка возникает, когда вы указываете недопустимое значение в карте сайта, например. когда вы устанавливаете приоритет вне диапазона от 0,0 до 1,0. Не то чтобы вам вообще нужно было устанавливать значение приоритета!
    • Недопустимое значение атрибута. Значение атрибута — это то, что вы указываете после знака равенства (=) в кавычках. Следующая строка кода перечисляет различные языковые версии страницы в карте сайта.

    Здесь «альтернативный», «gb» и «fr» — это значения атрибутов, а «gb» — неправильный, поскольку вы не можете указать только код страны в hreflangs — он должен быть соединен с кодом языка, как в «en -gb.”

    • Неверный URL. Как вы должны были догадаться, эта ошибка означает, что вам нужно искать опечатки в перечисленных вами URL-адресах. Напомню, что все URL-адреса в карте сайта должны быть полными.
    • Недопустимая дата. Это довольно просто — это означает, что вы использовали неправильный формат даты для тега. Единственным приемлемым форматом является следующий:
    • Ошибки «Отсутствует атрибут XML» и «Отсутствует тег XML» также довольно очевидны. Опускать обязательные теги и атрибуты (urlset, url, loc, xmlns) нельзя — вам нужно указать их, чтобы ваша карта сайта функционировала должным образом.
    • Недопустимый XML: слишком много тегов. Эта ошибка может возникнуть, если вы используете один из тегов несколько раз, например. вы указываете два разных местоположения URL-адресов или две разные даты модификации для одного URL-адреса. Таким образом, вам придется удалить повторяющийся тег.
    • Неверное пространство имен. Пространство имен, указанное в вашем теге, должно быть одним из принятых протоколов. В настоящее время используются следующие протоколы:
    • Если вы использовали неверный протокол для своей карты сайта, вы получите сообщение об ошибке "Неподдерживаемый формат". Ошибка также может возникать из-за всевозможных других синтаксических ошибок, таких как использование неправильных кавычек (допускаются только прямые одинарные или двойные кавычки) или отсутствие тега кодировки.

    Есть также несколько ошибок, связанных с файлом Sitemap для видео: миниатюра слишком большая/маленькая, местоположение видео и страница воспроизведения совпадают, URL-адрес местоположения видео выглядит как URL-адрес страницы воспроизведения. Подробнее об этих ошибках можно узнать здесь.

    Чтобы избежать синтаксических ошибок, используйте один из валидаторов карты сайта, подобных этому, перед отправкой карты сайта — инструменты выявят проблемы, которые необходимо исправить.

    После того как вы исправите все ошибки карты сайта, упомянутые в отчете GSC, повторно отправьте обновленную карту сайта. Это побудит Google повторно просканировать ваш веб-сайт и, наконец, проиндексировать страницы, которые не удалось просканировать из-за ошибок.

    Уравнивание соотношения отправленных URL и проиндексированных URL

    Состояние вашей карты сайта или файла индекса карты сайта может быть Успешно, но это не означает, что вы закончили работу с картой сайта. Щелкните значок покрытия индекса рядом с количеством обнаруженных URL-адресов, чтобы перейти к соответствующему отчету. Начав расследование, вы можете заметить, что не все отправленные вами страницы были проиндексированы.

    Теперь можно исключить страницы из индексации — Google не может поставить лайк и проиндексировать все известные ему страницы вашего веб-сайта. Более того, почти на каждом веб-сайте есть страницы, которые веб-мастера не хотят индексировать — области администрирования, служебные страницы, дубликаты и альтернативные страницы. Что не является нормой, так это наличие ошибок Ошибки и Действительно с предупреждениями в отчете Покрытие индекса. Также ненормально, когда количество исключенных из индексации страниц во много раз превышает количество действительных страниц.

    Почему же Google может не индексировать ваши страницы, отправленные для индексации? В большинстве случаев это происходит, когда вы добавляете страницы, которых не должно быть в вашей карте сайта. Возможно, Google просто не может индексировать и сканировать страницу из-за директивы noindex. Кроме того, может возникнуть путаница, действительно ли вы хотите, чтобы страница была проиндексирована или нет, например, когда вы добавляете неканонические страницы в свою карту сайта. Все такие экземпляры можно найти на разных вкладках отчета GSC Покрытие индекса, но удобнее проверять их с помощью инструмента Аудит веб-сайта от SE Ranking — если на вашем сайте есть какие-либо проблемы. такого рода, вы найдете их в разделе Сканирование отчета Ошибка.

    Удалите неиндексируемые и неканонические страницы из карты сайта или, если страницы были помечены как неиндексируемые и неканонические по ошибке, устраните проблемы с неправильными тегами.

    Убедившись, что ваш файл Sitemap не посылает в Google вводящие в заблуждение сигналы, просмотрите отчет Покрытие индекса, чтобы найти случаи, когда вы и Google расходитесь во мнениях относительно ценности страницы.

    • На вкладке Действительно с предупреждениями обратите внимание на страницы, которые были проиндексированы, несмотря на директиву noindex — скорее всего, Google был прав, и вам нужно удалить noindex с этих страниц или ваш тег X-Robots.
    • На вкладке Действительные посмотрите на Проиндексированные, не отправленные на страницы карты сайта — вы можете добавить их в свою карту сайта, так как Google считает, что они высоко- качественные страницы. В то же время, если Google проиндексировал вашу страницу с Условиями использования, которая не была включена в вашу карту сайта, вы также можете ничего не делать. Кроме того, следите за дубликатами страниц, которые были проиндексированы, но не были включены в вашу карту сайта — такие случаи часто возникают из-за плохой нумерации страниц и обработки параметров.
    • Наконец, перейдите на вкладку Исключенные. Большинство страниц здесь должны быть исключены из индексации в соответствии с вашими собственными директивами, например. старые страницы 404, страницы, заблокированные robots.txt, noindex и канонизированные страницы. Обратите внимание на канонические страницы, которые Google решил не индексировать, потому что поисковая система считает, что на вашем сайте есть лучшие альтернативы. Скрупулезно изучите каждый случай и решите, действительно ли страница ценнее своих дубликатов — исправьте свои канонические теги, если Google был прав. Если вы все еще считаете, что страница должна быть проиндексирована, вам придется поработать над ее содержанием, профилем обратных ссылок и внутренними ссылками, чтобы убедить Google, что она более достойна, чем другие.

    Вкладка Исключенные содержит еще две интересные категории страниц: Просканировано – в настоящее время не проиндексировано и Обнаружено – в настоящее время не проиндексировано. Оба типа обычно обозначают некачественные страницы с тонким содержанием, которые Google не хочет показывать пользователям. В первом случае страницу как минимум просканировали и потом признали некачественной, а во втором поисковик даже не удосужился потратить краулинговый бюджет на страницу. Присмотритесь повнимательнее ко всем таким страницам и узнайте, что вы можете сделать, чтобы повысить их ценность — поработать над содержанием, взаимодействием с пользователем, внутренними ссылками и т. д.

    Заключение

    Благодаря множеству инструментов для создания карты сайта создать карту сайта очень просто. Однако, если вы просто воспользуетесь одним из случайных инструментов и проигнорируете рекомендации по составлению карты сайта, вы можете получить отчет Sitemap, полный ошибок, или отправить в Google множество некачественных страниц через вашу карту сайта.

    Я надеюсь, что это руководство помогло вам исправить каждую ошибку в вашем отчете о карте сайта GSC, и вам также удастся оставить в карте сайта только сочные высококачественные страницы и удалить все страницы, которые производят плохое впечатление на поисковые системы. . Если у вас остались вопросы, не стесняйтесь оставлять их в разделе комментариев ниже.

    Карта сайта вашего веб-сайта – это файл, который предоставляет Google наиболее важные страницы вашего сайта. Однако иногда вы сталкиваетесь с ошибками в статусе карты сайта. Вы можете посмотреть следующее видео, чтобы узнать больше о том, что такое файлы Sitemap и как они работают.

    Иногда проблема заключается в простом управлении. Узнайте больше об управлении файлом Sitemap прямо сейчас, чтобы определить, связана ли ваша проблема с управлением.

    Что такое ошибка неправильного формата файла Sitemap?

    Подумайте о страницах, связанных между собой в домене — это карта сайта. Это индекс содержимого веб-сайта, и его часто недооценивают, потому что посетители не видят его. С повышенным удобством создания карт сайта с помощью плагинов и генераторов также увеличивается количество ошибок.

    Что вызывает проблему?

    Ошибка формата карты сайта обычно возникает, когда на вашем веб-сайте отсутствуют теги XML, слишком много тегов или видео без тегов.

    Ошибка форматирования обычно возникает при использовании плагина Yoast SEO. Инструмент Yoast SEO не поддерживается, как и другие плагины. Если вы уже используете Yoast и у вас возникла проблема с форматом карты сайта, вы уже ничего не можете сделать, чтобы изменить ее или найти решение.

    Как проверить проблему

    Чтобы проверить наличие ошибок в карте сайта и избежать ошибок переадресации 301 и 404, вы можете использовать поисковые роботы сайта для подтверждения URL-адресов и выделения любых возможных проблем.

    Проанализируйте не только файл Sitemap.xml с ошибками формата, но и весь сайт!

    Проведите полный аудит, чтобы выяснить и исправить техническую SEO-оптимизацию, чтобы улучшить результаты поисковой выдачи.

    Почему это важно?

    Оптимизированная и организованная карта сайта имеет решающее значение, поскольку она не позволяет поисковым роботам упускать важные ссылки на вашей странице при кэшировании информации. Файлы Sitemap помогают сканерам следить за тем, чтобы новые обновления вашего веб-сайта отображались в поисковой системе.

    Как исправить ошибку формата

    Устраните проблему, перейдя на панель инструментов с помощью универсального плагина SEO.

    • Нажмите кнопку XML-карты сайта.
    • Первое, что вам нужно сделать, это воссоздать карту сайта, внеся небольшие изменения в карту. Изменение может быть таким же простым, как удаление запланированных обновлений или переключение их на другую частоту обновления. После этого обновите карту сайта, чтобы заново сгенерировать и восстановить ее.
    • После обновления проверьте карту с помощью инструмента аудита. Если ошибка формата все еще возникает, перейдите к следующему шагу.
    • Шаг второй – снимите флажки для всех типов таксономий. Вы также должны найти поле «динамически генерировать карту сайта» и снять его. Наконец, выберите страницы и сообщения, которые вы можете найти в разделе «Типы сообщений». Отключите или снимите флажки для всех других типов сообщений, кроме двух упомянутых выше (страниц и сообщений).
    • Обновите свою карту сайта, нажав кнопку "Обновить". Повторите шаг обновления и используйте инструмент SEO-аудита, чтобы проверить, исправлена ​​ли ошибка формата XML.

    Если с вашей картой сайта по-прежнему что-то не так, вы можете сделать еще одну вещь, чтобы убедиться, что XML-файлы в порядке, а именно отключить индексы.

    Обычно на этом этапе ошибка формата карты сайта исчезает. В редком случае, когда он все еще остается, лучшее, что вы можете сделать, это отправить заявку. Вместо того, чтобы разбираться с ошибкой самостоятельно, ваша SEO-компания поможет вам найти решение.

    Иван работает специалистом по маркетингу продуктов в Sitechecker. Увлекается аналитикой и созданием бизнес-стратегии для продуктов SaaS.

    2 октября 2019 г. Команда Botify

    В нашей статье «5 самых больших ошибок XML-карты сайта, которых следует избегать», мы рассказали о самых частых ошибках, которые мы наблюдаем при работе с файлами XML-карты сайта, таких как перечисление неиндексируемых страниц и пропуск важных страниц. Важно избегать подобных ошибок, потому что наличие точной и актуальной карты сайта может гарантировать, что Google не пропустит контент, который вы хотите проиндексировать, и не потратит краулинговый бюджет на URL-адреса, которые вам не нужны.

    Как же проверить URL-адреса в карте сайта? Вы можете вручную просмотреть файлы карты сайта, но это будет непрактично, особенно на сайте с миллионами URL-адресов. Более простым вариантом было бы провести программное сканирование с помощью такого инструмента, как Botify, для сканирования ваших URL-адресов на наличие ошибок.

    Обычно поисковые роботы начинают сканирование вашего сайта с одного URL — вашей домашней страницы. С главной страницы сканер будет переходить по ссылкам на этой странице на другие страницы вашего сайта, а затем по ссылкам на этих страницах и т. д.

    Это не единственный способ сканирования вашего сайта. Вы также можете использовать Botify, чтобы настроить сканирование таким образом, чтобы оно начиналось с:

    • Карта сайта в формате XML или индексный файл карты сайта.
    • Текстовый файл
    • Пользовательские начальные URL

    Сканирование вашего сайта с помощью файлов Sitemap или пользовательских текстовых файлов отлично подходит для различных случаев использования. Давайте рассмотрим, как работает каждый вариант и чего с их помощью можно добиться.

    Аудит карты сайта, вариант 1: начать сканирование с карты сайта

    Вы можете начать сканирование из внешнего файла, такого как карта сайта или индекс карты сайта, чтобы вы могли легко найти любые ошибки в ваших картах сайта XML. Важно отметить, что в Botify вы можете не только сканировать все URL-адреса в файле карты сайта, но и сканировать из файла карты сайта.

    Чем эти вещи отличаются?

    Запуск сканирования с карты сайта означает, что вы сканируете не только URL-адреса в карте сайта, но и страницы, на которые они ссылаются.

    В чем преимущество? Предположим, например, что URL-адрес в вашей карте сайта не проиндексирован. Это приятно знать, потому что в идеале в вашем файле карты сайта должны быть только индексируемые страницы. Однако что, если эта неиндексируемая страница связана со страницей 404? Вы не сможете найти этот URL 404d, если он не будет также связан с вашей картой сайта.

    Запуск сканирования сайта с карты сайта – это отличный способ убедиться, что не только URL-адреса в карте сайта безошибочны, но и страницы, на которые они ссылаются или на которые перенаправляются, также не содержат ошибок.

    Легко считать само собой разумеющимся, что URL-адреса в вашей карте сайта — это только те URL-адреса, которые мы хотим просканировать/проиндексировать, но сканирование из файлов вашей карты сайта — ценная защита от траты времени Google на URL-адреса. мы даже не хотим сканироваться.

    Как просканировать файл индекса карты сайта?

    Что делать, если у вас есть файл индекса карты сайта, а не один XML-файл карты сайта?

    Многие сайты используют файл индекса карты сайта. Если вы не знакомы, файл индекса карты сайта — это файл, содержащий несколько карт сайта. Думайте об этом как о контейнере, в котором вы можете хранить все XML-файлы карты сайта на своем веб-сайте.

    Не каждому сайту требуется несколько файлов Sitemap, но это может быть необходимо для многих крупных веб-сайтов, поскольку XML-файлы Sitemap не могут превышать 50 000 URL-адресов или 50 МБ (без сжатия).

    Иногда файлы индекса карты сайта могут создавать проблемы для поисковых роботов. К счастью, начать сканирование индекса вашей карты сайта в Botify так же просто, как вставить ссылку на него при настройке сканирования. Мы будем следить за индексом вашей карты сайта и загружать любые дополнительные карты сайта, на которые есть ссылки.

    Сравнение сканирования карты сайта со сканированием с главной страницы

    Файлы Sitemap — это отличный способ отправить в Google информацию о том, что вы хотите просканировать, но они не гарантируют, что Google найдет и просканирует все эти страницы. Когда дело доходит до вашего веб-сайта, хороший способ узнать, насколько вы полагаетесь на Google, чтобы «выяснить это» самостоятельно, — это сравнить сканирование с вашей домашней страницы со сканированием с вашей карты сайта.

    Другими словами, есть ли несоответствие между тем, что вы предоставляете Google в своей карте сайта, и тем, что Google может легко получить из архитектуры вашего сайта?

    Вы должны не только убедиться, что ваши важные страницы правильно указаны в карте сайта, но и убедиться, что эти страницы доступны по ссылкам на других ваших страницах. Сделать страницы доступными в архитектуре вашего сайта важно не только для того, чтобы помочь Google найти ваш важный контент; это также важно для того, чтобы помочь вашим посетителям ориентироваться на вашем сайте!

    Вариант 2 аудита карты сайта: сканирование текстового файла

    Иногда вам не нужно сканировать всю карту сайта. Существует множество случаев, когда вы можете захотеть сканировать только определенный набор URL-адресов. Для этого вы можете использовать опцию Botify «сканировать из текстового файла». Просто добавьте все URL-адреса, которые вы хотите сканировать, в текстовый файл, и мы просканируем только эти URL-адреса.

    Для этого существует множество возможных вариантов использования, в том числе:

    • Постоянный мониторинг URL-адресов платного поиска. Вы можете создать текстовый файл, содержащий все ваши URL-адреса платного поиска, чтобы использовать их специально для отслеживания ошибок. Больше никогда не тратьте деньги на переходы на мертвые страницы!
    • Постоянный мониторинг «VIP» URL-адресов. Вы можете создать текстовый файл со списком ваших наиболее ценных URL-адресов (например, страниц ваших ценных продуктов) для постоянного мониторинга, чтобы убедиться, что с ними ничего не происходит. Вы даже можете использовать Botify для настройки отчета, который предупреждает вас, если коды состояния этих страниц возвращают ошибки!
    • Аудит промежуточных URL-адресов перед запуском. Вы можете добавить промежуточные URL-адреса в текстовый файл, чтобы сканировать их на предмет качества, прежде чем выкладывать в открытый доступ. Это может помочь вам предотвратить запуск страниц с ошибками.

    Хорошо иметь возможность проверять карту сайта в целом, но есть много действительно конкретных случаев использования, когда полезно также иметь возможность сканировать пользовательский список URL-адресов.

    Например, если бы у вас была возможность сканировать только с домашней страницы или из официального XML-файла карты сайта, вы не смогли бы сканировать страницы «за пределами вашего веб-сайта» (например, скрытые целевые страницы). Использование текстового файла для сканирования определенных URL-адресов означает, что каждый день вы можете выполнять сканирование по-разному, что позволяет при необходимости увеличивать и детализировать определенные разделы вашего сайта.

    Вариант 3 аудита карты сайта: сканирование с определенных URL

    Сканирование многих сайтов начинается с главной страницы, но вы также можете начать сканирование с определенных URL-адресов на своем сайте.

    Этот параметр позволяет начать сканирование с определенной страницы или подпапки, но при этом будет продолжаться сканирование всего сайта по ссылкам, обнаруженным на этих страницах. Это может показать, насколько хорошо связаны различные разделы вашего веб-сайта с остальной частью вашего веб-сайта.

    Настройка сканирования в соответствии с вашими целями

    Выбранный вами вариант сканирования всегда будет зависеть от того, чего вы хотите достичь — не существует «наилучшего способа» сканирования вашего сайта. Возможно, вы проводите комплексный аудит карты сайта, и в этом случае «сканирование с карты сайта» будет отличным вариантом. Или вы можете проанализировать только определенную группу URL-адресов из вашей карты сайта, и в этом случае будет полезно использовать параметр «текстовый файл».

    Какой бы вариант вы ни выбрали, Botify поможет вам сделать это быстро. Наш облачный сканер может проверять до 250 URL в секунду.

    Есть вопросы о нашем сканере? У нас есть ответы! Свяжитесь с нами, чтобы запланировать время для чата, или отправьте нам вопрос в Твиттере, используя @Botify.

    Читайте также: