Не удалось обработать файл карты сайта

Обновлено: 21.11.2024

В Google несколько языков файлов Sitemap.

Во всех форматах следует использовать стандартный протокол. В настоящее время Google не ходит в файлы Карта сайта атрибут .

Вот пример XML-файла Sitemap с одним URL:

RSS, mRSS и Atom 1.0

Текст

Правила создания текстовых файлов Карта сайта

  • Необходимо использовать кодировку UTF-8.
  • В файл Sitemap можно добавить только URL.
  • Этому текстовому файлу можно дать любое имя, но необходимо использовать расширение .txt (например, sitemap.txt).

Файлы Sitemap с расширенным синтаксисом

Google поддерживает расширенный синтаксис файлов Карта сайта для упрощения ниже MIME-типов. С помощью дополнительных элементов можно описывать видео, изображения и плохо поддающийся анализу контент, чтобы они лучше индексировались.

Общие рекомендации в отношении файлов Карта сайта

Кроме того, все URL-адреса (включая адрес файла Sitemap) должны быть правильно экранированы и закодированы, чтобы их мог обработать веб-сервер. Обычно это происходит автоматически, если для создания URL-адреса вы запрашиваете какой-либо шаблон, инструмент или файл журнала, то есть не вводите адрес вручную. Если при отправке файла Sitemap вы эффективно оживите, что Google не удалось найти ваши URL, убедитесь, что они соответствуют стандарту RFC-3986 для URI, стандарту RFC-3987 для IRI и стандарту XML.

Пример URL, где есть символ, не отображающийся к кодировке ASCII ( ü ), а также символ, который требует экранирования ( & ):

Этот же URL в кодировке ISO 8859 и с применением экранирования:

Этот же URL в кодировке UTF-8 и с применением экранирования:

Как создать файл Sitemap

Создайте файл Карта сайта, вы сообщаете поисковым системам, какие из ваших URL следует выбрать для показа в офисе. Такие URL являются каноническими. Если вы нашли соответствующий контент по показателю URL, выберите основной вариант страницы и добавьте его в файл Sitemap, только его.

Выберите URL-адрес, добавьте его в файл Sitemap, создайте его из контекста ниже. Оптимальный вариант будет зависеть от архитектуры и размеров сайта.

  • Файл Sitemap можно сгенерировать с помощью системы управления контентом.
  • Если в файле уже используется URL-адрес или меньше, попробуйте создать его вручную.
  • Если ожидается, что файл Sitemap будет очень большим, создадим его автоматически.

Как создать файл Sitemap с помощью системы управления контентом

Если вы работаете с системой управления контентом, такой как WordPress, Wix или Blogger, то возможно, что она уже сгенерировала файл Sitemap, доступный поисковым системам. Попробуйте найти сведения о том, как ваша система управления контентом создает файлы Sitemap, или о том, как подготовить такой файл, если она не сделала это автоматически. Например, если вы работаете с Wix, введите в поиске Google запрос «wix sitemap».

В остальных случаях вам может понадобиться создать файл Sitemap самостоятельно.

Как создать файл Sitemap вручную

Если вы планируете добавить в файл Sitemap, его существующий URL-адрес может быть создан вручную. Для этой библиотеки текстовый редактор, такой как Блокнот (Windows) или nano (Linux, macOS), и начните вносить в новый файл данные в соответствии с синтаксисом, который описан в разделе Форматы файлов Карта сайта выше.

Вручную можно создавать и увеличивать файлы Sitemap, но это очень трудоемкий процесс.

Как создать файл Sitemap автоматически

Если вам нужно включить в файл Sitemap его URL-адрес, то желательно будет создать автоматически. Сгенерировать файл Sitemap можно с помощью различных инструментов, но лучше всего использовать ресурсы вашего сайта. Например, вы можете выбрать URL-адрес, найти сайт, из его базы данных и экспортировать этот адрес на экран или в файл на следующем веб-сервере. При необходимости обратитесь к разработчикам или серверам. сбор с нашей подборкой внешних генераторов файлов Карта сайта: вы можете создать их на основе аналогового инструмента.

Как сделать файл Sitemap более ранним для Google

Файл Sitemap анализируется только при первом его обнаружении, а не при каждом сканировании сайта. Чтобы файл был восстановлен, перенос нам, что данные в нем изменились. Это делается с помощью запроса ping. Не добавляйте несколько файлов Sitemap и не отправляйте запросы ping, если в файл не вносились изменения и он не был новым.

Предоставить Google доступ к файлу Sitemap можно множеству способов:

  • Отправить файл через интерфейс отчета.
  • Выполнение запроса ping.GET на приведенный ниже адрес, указав полный URL файла Карта сайта и убедившись, что этот файл доступен:

Файл Карта сайта служитель лишь подсказкой для поисковых систем. Его наличие не гарантирует, что система Google скачивает этот файл или использует его для мощной страницы на сайте.

Устранение неполадок, использующих при обработке файлы Sitemap

Если не указано иное, содержимое этой страницы предоставляется по лицензии Creative Commons Attribution 4.0, а образцы кода — по лицензии Apache 2.0. Подробнее см. в Правилах сайта Google Developers. Java является зарегистрированным товарным знаком Oracle и/или ее дочерних компаний.

Вы создали карту сайта, отправили ее в Google, но неожиданно статус вашей карты сайта не Успешно? Или, может быть, ваш отчет Sitemap выглядит хорошо, но вы решили также проверить Покрытие индекса отчет, и кажется, что Google игнорирует вашу вежливую просьбу и не будет индексировать многие из страницы из вашей карты сайта. Итак, теперь вы задаетесь вопросом, можете ли вы что-то сделать, чтобы улучшить свою статистику индексации. В любом случае, не ищите дальше, потому что все ответы вы найдете в этом посте.

Если у вас еще нет карты сайта и вы хотите узнать, что такое хорошая карта сайта, посмотрите наш вводный ускоренный курс по созданию карты сайта. Там вы узнаете о преимуществах карты сайта и лучших методах работы с ней. Кроме того, вам следует обратиться к руководству, если вы еще не знаете, для чего используются теги и или что такое карта сайта видео или индексный файл карты сайта.

В первой части этой публикации перечислены все ошибки, с которыми вы можете столкнуться в отчете GSC Sitemap. Итак, если вы ищете способ исправить некоторые проблемы, используйте оглавление, чтобы перейти к интересующим вас ошибкам.

Во второй части представлены сведения, которые помогут вам максимально эффективно использовать карту сайта: вы узнаете, как найти мусорные страницы в карте сайта, где искать страницы, которые вы, возможно, не включили в файл карты сайта, и как чтобы побудить Google индексировать больше ваших страниц карты сайта. Поэтому настоятельно рекомендую всем внимательно изучить вторую главу этого поста.

Исправление ошибок отчета Sitemap

После того как вы отправите карту сайта в Google, вы увидите, удалось ли ему обработать файл, в столбце Статус. Если ваш файл соответствует всем правилам, статус должен быть Успешно. В этой главе мы обсудим два других кода состояния, а именно Не удалось получить и Есть ошибки

У Google проблемы со сканированием вашего файла Sitemap

Начнем с самого неблагоприятного сценария, когда Google не может получить файл карты сайта. В этом случае вам придется использовать инструмент проверки URL, чтобы выяснить, что может быть причиной проблемы.

В инструменте проверки URL нажмите кнопку Тест в реальном времени и проверьте статус выборки страницы. Если написано Успешно, значит, ошибка на стороне Google.

Ошибка «Не удалось получить» также может возникнуть, если вы отправили файл индекса карты сайта, а не одну карту сайта в GSC. Проблема должна быть решена так же, как и с одной картой сайта.

Ошибки файла индекса Sitemap

Теперь давайте перейдем к случаям, когда Google получил отправленный вами файл и обнаружил некоторые ошибки.

С файлом индекса карты сайта Google необходимо дополнительно обработать все отдельные карты сайта, которые вы указали, чтобы наконец получить доступ к URL-адресам вашего веб-сайта. Если Google не сможет обработать URL-адреса, указанные в файле индекса карты сайта, вы получите сообщение об ошибке «Недопустимый URL-адрес в файле индекса карты сайта». Обычно это означает, что Google не может найти одну или несколько ваших карт сайта в указанных местах, потому что вы использовали неполные URL-адреса. Все URL-адреса, указывающие на отдельные карты сайта в файле индекса карты сайта, должны быть полностью определенными, иначе Google может не найти их.

Кроме того, в файле индекса карты сайта не должны быть указаны другие файлы индекса карты сайта, только карты сайта. В этом случае вы получите сообщение Неверный формат индекса карты сайта: ошибка вложенных индексов карты сайта.

Последняя ошибка: Слишком много файлов Sitemap в индексном файле Sitemap. Это может произойти с огромными веб-сайтами, на которых перечислено более 50 000 файлов Sitemap в одном файле.

Размер файла Sitemap и ошибки сжатия

Ограничения по размеру применяются как к файлам индекса карты сайта, так и к отдельным картам сайта. Размер файла карты сайта не должен превышать 50 МБ в несжатом виде, а файл не должен содержать более 50 000 URL-адресов. Если вы не будете следовать этим рекомендациям, вы получите сообщение об ошибке размера файла Sitemap.Вы можете узнать больше о разделении карты сайта на несколько файлов из нашего окончательного руководства по карте сайта.

Теперь, хотя ваша карта сайта не должна быть огромной, она, естественно, не должна быть и пустой. Если вы отправите пустую карту сайта, вы получите соответствующую ошибку.

Кроме того, я упомянул, что размер карты сайта в несжатом виде не должен превышать 50 МБ, но обычно сжимают карты сайта для экономии пропускной способности. Обычно для этой цели используется инструмент gzip, который добавляет расширение gz к карте сайта. Если вы видите ошибку сжатия в отчете GSC, это означает, что что-то пошло не так в процессе сжатия, и вы должны сделать это еще раз.

У Google проблемы со сканированием URL-адресов вашей карты сайта

По ряду причин Google может не сканировать некоторые URL-адреса, указанные в карте сайта. Давайте рассмотрим все такие ошибки.

Карта сайта содержит URL-адреса, заблокированные файлом robots.txt. Ошибка довольно очевидна, поскольку GSC укажет вам на заблокированные URL-адреса. В зависимости от того, хотите ли вы, чтобы эти URL-адреса были проиндексированы, вам придется либо снять блокировку, либо удалить их из карты сайта.

Другие ошибки, такие как недоступные URL-адреса, неотслеживаемые URL-адреса, недопустимые URL-адреса, не столь очевидны. Кратко пройдемся по каждому из них.

Ошибка URL недоступна означает, что Google нашел вашу карту сайта в указанном месте, но не смог получить некоторые URL из вашего списка. В этом случае вам снова нужно использовать инструмент проверки URL, как если бы Google вообще не мог получить вашу карту сайта.

Ошибка URL-адреса не отслеживается либо из-за того, что вы использовали относительные URL-адреса в карте сайта вместо полных URL-адресов, либо из-за проблем с переадресацией. Цепочки и циклы перенаправления, временные перенаправления, используемые вместо постоянного перенаправления, перенаправления HTML и JS могут привести к этим ошибкам.

Google Search Console не указывает, что именно вызывает проблему, поэтому вам придется использовать другие инструменты, чтобы понять, какие проблемы необходимо устранить. Например, в инструменте аудита веб-сайта SE Ranking есть специальный раздел «Перенаправления», где вы можете проверить, есть ли на вашем веб-сайте проблемы с переадресацией.

Если инструмент обнаружит какие-либо проблемы, вы сможете получить всю необходимую информацию о каждой ошибке, щелкнув количество страниц. Вы узнаете, на какой странице обнаружена ошибка и как эта страница связана с другими страницами. веб-сайта.

Инструмент Аудит веб-сайтов от SE Ranking также предупредит вас о таких случаях.

Google подозревает, что вы указали неправильные URL

Синтаксические ошибки карты сайта

Теперь в большинстве случаев вам не нужно беспокоиться об ошибке карты сайта из-за синтаксиса, потому что, если вы создаете карту сайта с помощью одного из специальных инструментов, они не должны смешиваться с тегами и атрибутами. Однако если у вас есть настраиваемый файл Sitemap, созданный вручную, вы можете столкнуться с одной из следующих проблем:

  • Недопустимое значение тега. Значение тега — это то, что вы ставите между открывающим и закрывающим тегом — URL между тегами, дату, которую вы указываете с помощью тега. Ошибка возникает, когда вы указываете недопустимое значение в карте сайта, например. когда вы устанавливаете приоритет вне диапазона от 0,0 до 1,0. Не то чтобы вам вообще нужно было устанавливать значение приоритета!
  • Недопустимое значение атрибута. Значение атрибута — это то, что вы указываете после знака равенства (=) в кавычках. Следующая строка кода перечисляет различные языковые версии страницы в карте сайта.

Здесь «альтернативный», «gb» и «fr» — это значения атрибутов, а «gb» — неправильный, поскольку вы не можете указать только код страны в hreflangs — он должен быть соединен с кодом языка, как в «en -gb.”

  • Неверный URL. Как вы должны были догадаться, эта ошибка означает, что вам нужно искать опечатки в перечисленных вами URL-адресах. Напомню, что все URL-адреса в карте сайта должны быть полными.
  • Недопустимая дата. Это довольно просто — это означает, что вы использовали неправильный формат даты для тега. Единственным приемлемым форматом является следующий:
  • Ошибки «Отсутствует атрибут XML» и «Отсутствует тег XML» также довольно очевидны. Опускать обязательные теги и атрибуты (urlset, url, loc, xmlns) нельзя — вам нужно указать их, чтобы ваша карта сайта функционировала должным образом.
  • Недопустимый XML: слишком много тегов. Эта ошибка может возникнуть, если вы используете один из тегов несколько раз, например.вы указываете два разных местоположения URL-адресов или две разные даты модификации для одного URL-адреса. Таким образом, вам придется удалить повторяющийся тег.
  • Неверное пространство имен. Пространство имен, указанное в вашем теге, должно быть одним из принятых протоколов. В настоящее время используются следующие протоколы:
  • Если вы использовали неверный протокол для своей карты сайта, вы получите сообщение об ошибке "Неподдерживаемый формат". Ошибка также может возникать из-за всевозможных других синтаксических ошибок, таких как использование неправильных кавычек (допускаются только прямые одинарные или двойные кавычки) или отсутствие тега кодировки.

Есть также несколько ошибок, связанных с файлом Sitemap для видео: миниатюра слишком большая/маленькая, местоположение видео и местоположение страницы воспроизведения совпадают, URL-адрес местоположения видео выглядит как URL-адрес страницы воспроизведения. Подробнее об этих ошибках можно узнать здесь.

Чтобы избежать синтаксических ошибок, используйте один из валидаторов карты сайта, подобных этому, перед отправкой карты сайта — инструменты выявят проблемы, которые необходимо исправить.

После того как вы исправите все ошибки карты сайта, упомянутые в отчете GSC, повторно отправьте обновленную карту сайта. Это побудит Google повторно просканировать ваш веб-сайт и, наконец, проиндексировать страницы, которые не удалось просканировать из-за ошибок.

Уравнивание соотношения отправленных URL и проиндексированных URL

Состояние вашей карты сайта или файла индекса карты сайта может быть Успешно, но это не означает, что вы закончили работу с картой сайта. Щелкните значок покрытия индекса рядом с количеством обнаруженных URL-адресов, чтобы перейти к соответствующему отчету. Начав расследование, вы можете заметить, что не все отправленные вами страницы были проиндексированы.

Теперь можно исключить страницы из индексации — Google не может поставить лайк и проиндексировать все известные ему страницы вашего веб-сайта. Более того, почти на каждом веб-сайте есть страницы, которые веб-мастера не хотят индексировать — области администрирования, служебные страницы, дубликаты и альтернативные страницы. Что не является нормой, так это наличие ошибок Ошибки и Действительно с предупреждениями в отчете Покрытие индекса. Также ненормально, когда количество исключенных из индексации страниц во много раз превышает количество действительных страниц.

Почему же Google может не индексировать ваши страницы, отправленные для индексации? В большинстве случаев это происходит, когда вы добавляете страницы, которых не должно быть в вашей карте сайта. Возможно, Google просто не может индексировать и сканировать страницу из-за директивы noindex. Кроме того, может возникнуть путаница, действительно ли вы хотите, чтобы страница была проиндексирована или нет, например, когда вы добавляете неканонические страницы в свою карту сайта. Все такие экземпляры можно найти на разных вкладках отчета GSC Покрытие индекса, но удобнее проверять их с помощью инструмента Аудит веб-сайта от SE Ranking — если на вашем сайте есть какие-либо проблемы. такого рода, вы найдете их в разделе Сканирование отчета Ошибка.

Удалите неиндексируемые и неканонические страницы из карты сайта или, если страницы были помечены как неиндексируемые и неканонические по ошибке, устраните проблемы с неправильными тегами.

Убедившись, что ваш файл Sitemap не посылает в Google вводящие в заблуждение сигналы, просмотрите отчет Покрытие индекса, чтобы найти случаи, когда вы и Google расходитесь во мнениях относительно ценности страницы.

  • На вкладке Действительно с предупреждениями обратите внимание на страницы, которые были проиндексированы, несмотря на директиву noindex — скорее всего, Google был прав, и вам нужно удалить noindex с этих страниц или ваш тег X-Robots.
  • На вкладке Действительные посмотрите на Проиндексированные, не отправленные на страницы карты сайта — вы можете добавить их в свою карту сайта, так как Google считает, что они высоко- качественные страницы. В то же время, если Google проиндексировал вашу страницу с Условиями использования, которая не была включена в вашу карту сайта, вы также можете ничего не делать. Кроме того, следите за дубликатами страниц, которые были проиндексированы, но не были включены в вашу карту сайта — такие случаи часто возникают из-за плохой нумерации страниц и обработки параметров.
  • Наконец, перейдите на вкладку Исключенные. Большинство страниц здесь должны быть исключены из индексации в соответствии с вашими собственными директивами, например. старые страницы 404, страницы, заблокированные robots.txt, noindex и канонизированные страницы. Обратите внимание на канонические страницы, которые Google решил не индексировать, потому что поисковая система считает, что на вашем сайте есть лучшие альтернативы. Скрупулезно изучите каждый случай и решите, действительно ли страница ценнее своих дубликатов — исправьте свои канонические теги, если Google был прав.Если вы все еще считаете, что страница должна быть проиндексирована, вам придется поработать над ее содержанием, профилем обратных ссылок и внутренними ссылками, чтобы убедить Google, что она более достойна, чем другие.

Вкладка Исключенные содержит еще две интересные категории страниц: Просканировано – в настоящее время не проиндексировано и Обнаружено – в настоящее время не проиндексировано. Оба типа обычно обозначают некачественные страницы с тонким содержанием, которые Google не хочет показывать пользователям. В первом случае страницу как минимум просканировали и потом признали некачественной, а во втором поисковик даже не удосужился потратить краулинговый бюджет на страницу. Присмотритесь повнимательнее ко всем таким страницам и узнайте, что вы можете сделать, чтобы повысить их ценность — поработать над содержанием, взаимодействием с пользователем, внутренними ссылками и т. д.

Заключение

Благодаря множеству инструментов для создания карты сайта создать карту сайта очень просто. Однако, если вы просто используете один из случайных инструментов и игнорируете передовые методы сопоставления сайта, вы можете получить отчет Sitemap, полный ошибок, или отправить в Google множество некачественных страниц через свою карту сайта.

Я надеюсь, что это руководство помогло вам исправить каждую ошибку в вашем отчете о карте сайта GSC, и вам также удастся оставить в карте сайта только сочные высококачественные страницы и удалить все страницы, которые производят плохое впечатление на поисковые системы. . Если у вас остались вопросы, не стесняйтесь оставлять их в разделе комментариев ниже.

Сообщения об ошибках в WordPress, как правило, сбивают с толку и требуют решения, но ошибка «Ваша карта сайта выглядит как HTML-страница», к счастью, не является одной из них.

Если вы столкнулись с этой проблемой, вы, вероятно, задаетесь вопросом, что означает эта ошибка, что не так с вашей картой сайта в формате HTML и как именно вы можете решить эту проблему. А что, если ваша карта сайта уже имеет правильный формат, но вы все еще видите эту ошибку?

Мы расскажем вам обо всем: о том, как работает карта сайта, в каком формате она должна быть и о нескольких способах решения этой проблемы.

Посмотрите наше видеоруководство по устранению ошибки «Ваш файл Sitemap выглядит как HTML-страница»:

Что такое карта сайта?

Знаете ли вы, как поисковые системы находят ваш сайт? Ответ заключается в использовании удобного маленького бота, называемого поисковым роботом — автоматического инструмента, рассылаемого поисковыми системами для индексации страниц вашего сайта.

С учетом того, что в Интернете буквально миллионы страниц, сбор информации о каждом сайте был бы невозможен для людей. Поисковые роботы просматривают Интернет, кэшируя информацию на каждой странице и фрагменте мультимедиа.

Это кажется достаточно простым, но Google не знает автоматически, когда вы добавляете новую страницу на свой сайт, например, когда вы публикуете сообщение в блоге или добавляете новый продукт в свой магазин. Они периодически отправляют поисковый робот на ваш сайт и проверяют, не изменилось ли что-нибудь, но этот процесс не происходит мгновенно.

Если у вас большой веб-сайт, сканер может легко пропустить ключевые страницы даже после нескольких посещений. В первую очередь беспокоит то, что на такие страницы редко ссылаются.

Именно здесь на помощь сканерам приходят карты сайта. Эти XML-файлы отличаются от обычных страниц вашего сайта; они, как правило, нечитаемы людьми и не предназначены для просмотра посетителями. Но поисковые роботы могут использовать их, чтобы убедиться, что все проиндексировано.

Пример файла Sitemap в формате XML.

Они работают, просто перечисляя все страницы вашего сайта вместе с их иерархией ссылок, а также другие файлы на вашем сайте, такие как изображения и видео. Это гарантирует, что Google увидит все, что есть на вашем сайте, и соответствующим образом улучшит поисковую оптимизацию.

Если вы использовали такой инструмент, как Google Analytics или Google Search Console, вы, возможно, видели вариант ссылки на карту сайта. Google будет ссылаться на это в первую очередь при отправке поисковых роботов на ваш сайт.

Главная страница Google Search Console. Столкнулись с этой распространенной ошибкой WordPress? 🤯 Решение находится всего в одном клике 😌 Нажмите, чтобы твитнуть

Различия между файлами Sitemap в формате HTML и XML

Итак, ваша карта сайта представляет собой HTML-страницу, но в чем именно заключается проблема? Почему Google хочет, чтобы вы изменили его?

Файлы Sitemap должны быть написаны в определенном формате, чтобы поисковые роботы могли их понять. В большинстве случаев это должен быть файл XML. Они также могут читать RSS, Atom, KML или текстовые файлы, но чаще всего выбирают XML.

Пример RSS-канала.

XML означает «расширяемый язык разметки». Это веб-язык, очень похожий на HTML. Разница заключается в его использовании: хотя он удобочитаем для человека, его основная функция — помогать машинам кодировать документы и считывать данные.

В данном случае это помогает поисковому роботу понять, где находятся страницы и другие медиаданные на вашем сайте и как они взаимодействуют друг с другом.

Но вы, возможно, уже встречали термин "карта сайта" в совсем другом контексте. Файлы Sitemap в формате HTML существуют, но большая разница в том, что они созданы для людей, а не для поисковых роботов.

Если вы когда-либо нажимали ссылку на навигацию по сайту и находили удобочитаемый и приятно оформленный список страниц на сайте, технически это называется картой сайта. Но хотя это может быть полезно вашим посетителям, это не то, что нужно Google.

Карта сайта в формате XML для большинства пользователей будет выглядеть как беспорядок из нечитаемого кода или массивная стена ссылок, поэтому, если вы хотите добавить на свой сайт полезную навигационную страницу, не стесняйтесь создавать вместе с ней карту сайта в формате HTML… но вы необходимо также создать XML-карту сайта.

Пример карты сайта.

Другие типы файлов Sitemap

Когда вы думаете о карте сайта, на ум может прийти простой список страниц вашего сайта. Но Google использует несколько разных типов карт сайта для каталогизации различной информации. К ним относятся:

  • Видео. Видео на вашем сайте можно специально проиндексировать, чтобы оно отображалось в результатах Google Video.
  • Изображения. То же самое относится и к изображениям. Некоторые изображения, например встроенные в код Javascript, обычно не индексируются. Карта сайта с изображением может помочь обеспечить отображение вашего сайта в Картинках Google.
  • Новости: написать колонку? У Google есть специальный раздел Новостей Google в поиске, а файл Sitemap для новостей может гарантировать, что вы будете правильно отображаться в нем и получать больше трафика.
  • Код: Google индексирует фрагменты кода, чтобы помочь программистам искать код и файлы.
  • Географические данные. Вы можете использовать специальную карту сайта KML, чтобы предоставить Google более точные данные о местонахождении вашего бизнеса.

Обычно часть этой информации содержится в вашей основной карте сайта. Другие должны иметь свою специальную специальную карту сайта. И, наконец, все они должны быть соответствующим образом отформатированы в XML или другом поддерживаемом формате, а не в HTML.

Как создать файл Sitemap в формате XML

Если вы намеренно отправили ссылку на карту сайта в формате HTML, вам необходимо заменить ее файлом XML. Если вы не знаете, как его создать, есть несколько разных способов сделать это с помощью плагинов и генераторов WordPress, которые вы можете найти в Интернете.

Даже если у вас есть XML-карта сайта, которая просто не работает, повторное создание или отправка другой карты сайта может решить проблему.

Существует два простых способа получить карту сайта: либо использовать подключаемый модуль, либо создать его с помощью карты сайта.

Создать файл Sitemap с помощью плагина

В WordPress самый простой способ получить динамически обновляемую карту сайта на своем веб-сайте — загрузить подключаемый модуль. Таким образом, вам не нужно загружать файлы на сервер вручную.

Существует довольно много плагинов, которые генерируют карту сайта:

    : самый популярный SEO-плагин в репозитории также включает в себя создание карты сайта. Вы можете найти настройки в разделе SEO > Общие > Функции и XML-карты сайта. : Помимо обычной карты сайта, этот SEO-плагин также может генерировать карту сайта WooCommerce и карту сайта с геоданными KML. Перейдите в RankMath > Настройки карты сайта. : Как следует из названия, XML Sitemaps создает карту сайта. Плагин на 100% бесплатный и с открытым исходным кодом, поэтому никаких скрытых платежей. : этот плагин создает карту сайта в формате XML и карту сайта Google News. Его также несложно установить и настроить. : Если вы хотите создать карту сайта HTML вместе с картой сайта XML, этот плагин для вас. Оба обновляются автоматически, поэтому вам не нужно выполнять какую-либо ручную работу.

Сайты с генераторами файлов Sitemap

Вместо подключаемого модуля вы можете использовать генератор карты сайта, например XML-Sitemaps или XML Sitemap Generator. Затем вы можете загрузить его на свой сайт.

Шаг 1. Создайте карту сайта с помощью одного из указанных выше сайтов или любого генератора по вашему выбору. Загрузите XML-документ.

Генератор XML-карты сайта

Шаг 2. Загрузите FileZilla или (если поддерживается) используйте веб-хост для подключения к сайту через FTP.

Подпишитесь на рассылку новостей

Хотите узнать, как мы увеличили трафик более чем на 1000 %?

Присоединяйтесь к более чем 20 000 человек, которые получают нашу еженедельную рассылку с полезными советами по WordPress!

Шаг 3. Поместите XML-файл в корневую папку вашего сайта. Корень — это самый верхний каталог вашего сайта — тот же каталог, с которого вы начинаете при первом подключении.

В отличие от карт сайта на основе подключаемых модулей, карты сайта, созданные с помощью веб-сайта, не являются динамическими. Статические карты сайта не будут обновляться при публикации новых сообщений и страниц на вашем сайте. Вам нужно каждый раз создавать новый файл. Так что для блогов и других сайтов, которые часто обновляются, это не идеальный вариант.

Как исправить ошибку файла Sitemap

Ошибка карты сайта часто возникает из-за случайной отправки HTML-страницы, а не правильно отформатированного XML-файла. Но если ваша XML-карта сайта по-прежнему претендует на роль HTML-страницы, у вас может быть более серьезная проблема.

Не беспокойтесь: проблема обычно связана с легко устранимым конфликтом в ваших плагинах WordPress. Вот несколько советов, как восстановить правильную работу карты сайта.

Проверить наличие ошибок и перенаправлений

Намного легче диагностировать проблему, если у вас есть явный код ошибки для поиска. Первое, что вы должны сделать, это посетить страницу с картой сайта и посмотреть, нет ли каких-либо странных кодов ошибок.

Страница ошибки 404 Kinsta.

Что делать, если вы время от времени замечаете ошибку карты сайта — иногда появляется, а иногда нет? Это может произойти, если вы динамически создаете карту сайта.

Незначительные ошибки сервера и тайм-ауты будут считаны Google, как если бы ваша карта сайта внезапно превратилась в HTML-страницу, поскольку она показывает сообщение об ошибке, а не XML-файл. Если ошибка возникает редко, не является постоянной или частой, она обычно не вызывает беспокойства.

Еще одна вещь, на которую следует обратить внимание, — это переадресация. Если вы зайдете на страницу с картой сайта и внезапно окажетесь на главной странице или в бесконечном цикле переадресации, это также приведет к поломке.

Если вы обнаружите какие-либо ошибки или перенаправления, которые не исчезнут, проблема обычно связана с конфликтом плагинов. Плагины, создающие карты сайта, такие как Yoast, могут вызвать конфликт, или источником проблемы может быть плагин кэширования.

Но иногда даже кажущиеся случайными плагины могут вызывать конфликты. Используйте подключаемый модуль проверки работоспособности и устранения неполадок, чтобы идентифицировать их.

Плагин проверки работоспособности и устранения неполадок после установки.

Установите его, если он еще не установлен, затем выберите Инструменты > Здоровье сайта > Режим устранения неполадок. Он временно отключит все плагины, не повлияв на ваших посетителей.

Нужен быстрый, надежный и безопасный хостинг для вашего нового веб-сайта? Kinsta предоставляет невероятно быстрые серверы и круглосуточную поддержку мирового класса от экспертов WordPress. Ознакомьтесь с нашими планами

Проверьте, исчезла ли ошибка или переадресация на вашем сайте. Если это так, повторно включайте плагины один за другим, пока сайт снова не сломается. Ищите конфликты между несколькими плагинами.

Теперь вы можете связаться с автором(ами) плагина, чтобы сообщить об ошибке и попросить о помощи.

Отключить кэширование

Одна из основных причин конфликтов связана с подключаемыми модулями кэширования. Кэширование карты сайта может иногда вызывать проблемы с ее чтением Google как HTML-страницы, поскольку таким образом не следует кэшировать XML-файлы.

Из-за этого большинство подключаемых модулей кэширования не будут кэшировать страницу карты сайта, но они все равно могут сделать это ошибочно, особенно если вы используете уникальный URL для своей карты сайта.

К счастью, вам не нужно отключать весь подключаемый модуль кэширования. Вы можете добавить исключение, и проблема должна исчезнуть автоматически.

Это должно быть описано в документации вашего плагина, но вот как это сделать в WP Super Cache и W3 Total Cache.

Для WP Super Cache выберите «Настройки» > «WP Super Cache». На вкладке "Дополнительно" прокрутите до пункта "Добавить сюда строки (не имя файла), которые запрещают кэширование страницы".

Для общего кэша W3 перейдите в раздел «Производительность» > «Кэш страниц», затем найдите «Дополнительно» > «Никогда не кэшировать следующие страницы». Как и в случае с WP Super Cache, введите URL-адрес карты сайта.

Вы также можете добавить его в Minify в меню Performance > Miniify and Never minify для следующих страниц, так как это может привести к проблемам.

Проверьте URL-адрес файла Sitemap

Хотя это небольшое предложение, всегда стоит перепроверить: вы отправили правильную ссылку? Это элементарная ошибка, и даже один неправильный символ укажет не на то место.

Проверьте отправленную вами ссылку как через Google, так и в любых плагинах SEO или Sitemap.

Снова включите режим устранения неполадок в подключаемом модуле проверки работоспособности и попытайтесь определить, какой подключаемый модуль вызывает эту проблему.В большинстве случаев вы можете отследить это до одного отдельного плагина.

Удалить лишние файлы Sitemap

Хотя это обычно не вызывает проблем, если вы ссылаетесь на нужную страницу, наличие дополнительных активных файлов Sitemap может иногда вызывать проблемы или путаницу у вас самих. Кроме того, ваш сервер тратит дополнительные ресурсы на обновление нескольких ненужных файлов Sitemap.

Плагины могут добавлять разные карты сайта, и вы можете не знать, что WordPress даже создает для вас свои собственные карты. Вы должны проверить их и удалить все, кроме того, который вы хотите использовать. Вот несколько URL-адресов, которые вы можете попробовать на своем сайте:

  • /sitemap.xml — общий выбор для создания карт сайта в большинстве плагинов для карт сайта.
  • /wp-sitemap.xml — это карта сайта по умолчанию, созданная WordPress, начиная с версии 5.5.
  • /sitemap_index.xml — URL-адрес карты сайта, созданной Yoast.

И если вы загрузили другие плагины SEO или карты сайта, они могут использовать совершенно другой URL. Ознакомьтесь с документацией и убедитесь, что вы отключили все функции карты сайта, которые вам не нужны.

Действительно ли вам нужен файл Sitemap?

Иногда файлы Sitemap необъяснимым образом могут стать источником постоянного потока проблем. И простого исправления может быть недостаточно, чтобы они исчезли. Если вы постоянно сталкиваетесь с трудными для решения проблемами, вы можете начать сомневаться в том, что карта сайта жизненно важна для вас.

Обычно рекомендуется создавать карту сайта, так как Google заявляет, что никогда не накажет за это SEO-специалистов. Это может только помочь улучшить SEO и ускорить индексацию вашего сайта.

Но в определенных ситуациях он не обязателен, и сам Google предлагает не использовать их на некоторых сайтах.

Предположим, что на вашем сайте менее 500 страниц, и вряд ли когда-либо будет больше. В этом случае, если он имеет хорошие внутренние ссылки (что вы должны делать в любом случае) и не имеет большого количества медиафайлов, которые вы хотите отображать в Google Images и Google Video, вам может вообще не понадобиться карта сайта.

С другой стороны, наличие карты сайта действительно может помочь вашему SEO, и в этом нет ничего плохого, поэтому проталкивание и устранение проблемы не принесет ничего, кроме пользы. Сейчас ваш сайт может быть маленьким, но, вероятно, так будет не всегда.

Если вы застряли, вы всегда можете обратиться в службу поддержки вашего хоста, чтобы выяснить, что может быть причиной проблемы.

Обзор

Ошибка «карта сайта выглядит как HTML-страница» может раздражать, но обычно это просто результат неправильного форматирования страницы или легко устраняемый конфликт кэширования. После того, как вы выяснили проблему, для ее решения достаточно нескольких дополнительных шагов.

За одной ошибкой часто следует другая, поэтому, если у вас все еще возникают проблемы с сайтом, попробуйте ознакомиться с нашей основной статьей о 65+ ошибках WordPress и о том, как их исправить.

Экономьте время, деньги и повышайте эффективность сайта с помощью:

  • Мгновенная помощь от экспертов по хостингу WordPress, круглосуточно и без выходных.
  • Интеграция с Cloudflare Enterprise.
  • Глобальный охват аудитории благодаря 29 центрам обработки данных по всему миру.
  • Оптимизация с помощью нашего встроенного мониторинга производительности приложений.

Все это и многое другое в одном плане без долгосрочных контрактов, помощи при миграции и 30-дневной гарантии возврата денег. Ознакомьтесь с нашими планами или поговорите с отделом продаж, чтобы найти план, который подходит именно вам.

Отобранные статьи по теме

Блог

Полное руководство по отладке WordPress (включите WP_DEBUG + другие инструменты)

Проблемы с WordPress? Вот как включить WP_DEBUG в вашем файле wp-config.php, чтобы найти виновника, и некоторые другие советы по отладке вашего WordPres…

Блог

Блог

Как найти и исправить неработающие ссылки в WordPress (5 методов)

Неработающие ссылки отрицательно сказываются на пользовательском опыте и SEO. Ознакомьтесь с этими различными методами поиска и исправления неработающих ссылок в WordPress без ущерба для производительности…

Карта сайта – это файл, содержащий список страниц веб-сайта, который позволяет поисковым роботам, таким как Googlebot, сканировать веб-сайт. Многие поисковые роботы могут исследовать и обнаруживать все файлы на веб-сайте, но с помощью карты сайта сканер может собирать метаданные о сайте. Эти метаданные будут сообщать, как часто информация на странице меняется, указывая, как часто следует сканировать веб-страницу.Он также покажет подробности о контенте, который поисковой системе будет сложно проанализировать, например, описания файлов для изображений или видео. Консоль поиска Google позволяет просматривать, добавлять и тестировать карты сайта.


Работа с отчетами Sitemap


Что делать, если файла Sitemap нет в списке?

Существует несколько причин, по которым карта сайта может не отображаться в отчете. Рекомендуется дважды проверить следующие вещи:

Ниже приведен полный список ошибок и предупреждений, которые могут возникнуть при использовании файлов Sitemap, которые могут отображаться в отчете о файлах Sitemap:

1. URL-адреса не отслеживаются

В целом это указывает на то, что Google не смог полностью обработать карту сайта, поскольку один или несколько URL-адресов охватывают слишком много переадресаций, что затрудняет отслеживание поисковыми роботами Google. Предлагается заменить URL-адреса, которые перенаправляют, URL-адресом, на который будет указывать перенаправление (это будет целевой URL-адрес).

Этот список расскажет вам о некоторых других причинах, по которым перенаправление может повлиять на возможность перехода по ссылке:


2. URL-адреса недоступны

Эта ошибка возникает, когда Google обнаруживает ошибку при попытке просмотра URL-адреса в карте сайта. Вам нужно будет:

  • Убедитесь, что файл существует в указанном месте.
  • Проверьте это с помощью тестера Google robots.txt, чтобы определить, какой именно файл блокирует его.
  • Используйте инструмент "Просмотреть как Google", чтобы увидеть, не блокируется ли он файлом robots.txt.
  • Убедитесь, что в картах сайта указан правильный URL-адрес, если Google пытался просканировать URL-адрес из карты сайта.


3. URL-адреса, которые не разрешены

Карта сайта может включать несколько URL-адресов, которые находятся на более высоком уровне или в другом домене, чем указано в файле карты сайта.


4. Пустой файл Sitemap

Вот что происходит, когда ваша карта сайта на самом деле не содержит никаких URL-адресов. Убедитесь, что ваша карта сайта не пуста. Если карта сайта использует протокол карты сайта, убедитесь, что URL-адреса помечены правильно.


5. Ошибки сжатия

Google столкнется с ошибкой при попытке разархивировать сжатый файл карты сайта. Рекомендуется снова сжать карту сайта с помощью такого инструмента, как gzip, загрузить ее на веб-сайт, а затем снова отправить.


6. Ошибка размера файла Sitemap

Эта ошибка возникает, когда файл карты сайта превышает максимальный размер файла. Несжатая карта сайта размером более 10 МБ выдаст это сообщение об ошибке. Когда карта сайта настолько велика, ее следует разбить на множество меньших файлов Sitemap, а затем эти карты сайта должны быть перечислены в файле индекса карты сайта.


7. Неверная дата

Это сообщение об ошибке указывает на то, что в карте сайта есть одна или несколько недопустимых дат. Дата может быть недействительной, поскольку дата имеет неправильный формат или сама дата недействительна. Даты в карте сайта должны соответствовать стандартам кодирования даты и времени W3C, хотя часть времени можно полностью опустить. Вы должны убедиться, что дата и время (если есть) соответствуют одному из следующих форматов:

Время указывать необязательно, но если вы решите его указать, необходимо указать часовой пояс, который по умолчанию равен 00:00:00Z.


8. Недопустимое значение атрибута

Подобное сообщение об ошибке появится, если вы присвоили недопустимое значение атрибуту тега XML. Вы должны дважды проверить свою карту сайта, чтобы убедиться, что присутствуют только разрешенные атрибуты. Вы также должны убедиться, что вы присвоили только допустимые значения в соответствии со спецификациями карты сайта. Ваши атрибуты и значения должны быть проверены на наличие опечаток.


9. Недопустимые значения тегов

Если ваша карта сайта содержит один или несколько тегов с недопустимым значением, вы можете увидеть это сообщение об ошибке. Ожидается, что сообщение об ошибке будет отображать тег в тексте сообщения об ошибке. Проверьте свои спецификации для типа карты сайта — стандартная, индексная, видео и т. д.


10. Недействительный URL

Этот код ошибки немного очевиден, но он возникает, когда URL-адрес в вашей карте сайта недействителен. Это может быть связано с тем, что URL-адрес состоит из неподдерживаемых символов, пробелов, кавычек и т. п., или он может быть неправильно отформатирован. Убедитесь, что URL-адреса, включенные в карту сайта, были закодированы для удобочитаемости и правильно экранированы. Вы должны проверить наличие неправильных символов, таких как пробелы или кавычки, и вы также можете попытаться скопировать URL-адрес в браузере — это проверит, может ли браузер прочитать или не может прочитать URL-адрес и правильно загрузить страницу.


11. Недопустимый URL-адрес в файле индекса Sitemap: неполный URL-адрес


12. Отсутствует атрибут XML

Если в карте сайта есть тег, в котором отсутствует обязательный атрибут, вы получите это сообщение об ошибке. Убедитесь, что ваша карта сайта верна и все обязательные атрибуты отсутствуют. Как только отсутствующие атрибуты будут исправлены, вы можете повторно отправить карту сайта.


13. Отсутствует тег XML

Если в карте сайта есть одна или несколько записей, в которых отсутствует обязательный тег, вы увидите эту ошибку. В сообщении об ошибке вы увидите перечисленные номера строк.


14. Недопустимый XML: слишком много тегов

Если ваша карта сайта содержит повторяющиеся теги, появится код ошибки. Сюда входят теги любого типа, которые были дублированы, например тег.


15. Отсутствует URL миниатюры

Эта ошибка возникает, когда в одном или нескольких видеоэлементах отсутствует URL миниатюры. Вы должны убедиться, что расположение URL миниатюр указано с помощью тега.


16. Отсутствует название видео

Убедитесь, что каждое видео в карте сайта имеет собственное название, которое должно быть указано с помощью тега.


17. Ошибка синтаксического анализа

Эта ошибка может быть вызвана неэкранированным символом в URL-адресе. Как и в случае со всеми файлами XML, все значения данных должны использовать escape-коды сущностей для таких символов, как & < >' “. Все символы в URL-адресе должны быть правильно экранированы. Эти escape-коды будут выглядеть примерно так: & или " внутри URL.


18. Вложенные индексы Sitemap: неверный формат индекса Sitemap

Одна или несколько записей в файле карты сайта используют собственный URL-адрес или URL-адрес другого файла индекса карты сайта. Эта ошибка связана с тем, что файл индекса карты сайта не может перечислить другие файлы индекса карты сайта — только файлы карты сайта. Вы должны избавиться от всех записей, которые указывают на файл индекса карты сайта, а затем повторно отправить карту сайта.


19. Временная ошибка

Возможно, в системе возникла временная проблема, из-за которой она не может обработать карту сайта. Как правило, при получении этой ошибки вы не будете повторно отправлять карту сайта. Google может попытаться получить его позже. Если ошибка по-прежнему возникает через несколько часов, попробуйте повторно отправить файл Sitemap.


20. Слишком много файлов Sitemap в файле индекса Sitemap

Файл индекса карты сайта не должен содержать более 50 000 карт сайта. Если это так, вы должны разбить его на несколько индексов карты сайта.


21. Слишком много URL в файле Sitemap

Карта сайта не должна содержать более 50 000 URL-адресов в одном файле. Если их больше, разбейте их на несколько файлов Sitemap и используйте файл индекса Sitemap.


22. Неподдерживаемый формат

Карта сайта должна содержать правильный заголовок, а все атрибуты XML должны быть заключены в одинарные или двойные кавычки.


23. Несоответствующий путь: отсутствует/включает www


24. Неверное пространство имен

Корневой элемент карты сайта должен содержать правильное пространство имен, правильно написанное. Это касается файлов Sitemap, индексных файлов Sitemap и файлов Sitemap для видео.


25. Миниатюра слишком большая

Размер эскизов видео не должен превышать 160 x 120 пикселей. Измените размер эскиза и обновите его, чтобы отразить в карте сайта, а затем отправьте его повторно.

Сталкивались ли вы с ошибкой «Не удалось получить карту сайта» при попытке отправить карту сайта? Это может быть ошибка консоли поиска или проблема с картой сайта. Мы обсудим оба.

Многие веб-сайты используют Search Console для добавления карты сайта WordPress в индекс Google. Около двух лет назад Google обновил свою поисковую консоль и изменил некоторые ее функции.

Однако пользователи сталкивались с ошибками как в новой, так и в старой версии поисковой консоли Google, иногда из-за того, что статус карты сайта не может быть получен. Наличие ошибок в программировании неизбежно. Даже ведущие развивающиеся компании, такие как Google, могут столкнуться с этими ошибками в своих приложениях.

Не удалось получить карту сайта (иногда «Карта сайта не может быть прочитана») — это ошибка в новой поисковой консоли Google. ‌Но это также может быть настоящей ошибкой. Ниже мы обсудим причины этой ошибки и способы ее исправления.

Не удалось получить карту сайта, как правило, ошибка Google

Ошибка «Не удалось получить карту сайта» обычно возникает из-за ошибки в поисковой консоли Google. Для этого нет простого решения. На самом деле статус находится на рассмотрении, и вам придется подождать несколько секунд, пока не вернется результат.

Возможно, изменение вашего IP-адреса или браузера может исправить ошибку «Не удалось получить карту сайта». Но надежных решений нет.

Узнайте, можно ли получить карту сайта

В новой поисковой консоли вы можете ввести URL своего веб-сайта, чтобы узнать, проиндексирован он или нет.

Если URL проиндексирован, вы увидите сообщение «URL есть в Google».Если он не проиндексирован или вы хотите, чтобы ваш URL был переиндексирован, просто нажмите «Запросить индексирование», чтобы поисковый робот Google снова проверил ваш URL.

Хотя эта функция никогда не покажет вашу карту сайта как проиндексированную. Потому что мы используем тег noindex в картах сайта, чтобы этого не произошло. Но с помощью Inspect URL вы можете увидеть, можно ли получить карту сайта.

Для этого сначала введите URL-адрес вашей карты сайта. Как только вы увидите, что Google не проиндексировал URL-адрес, нажмите «Живой тест». Появится новая страница, на которой будет указано, что из-за тега noindex карта не может быть проиндексирована. Прокрутите вниз, пока не увидите «Выбор страницы». Если он говорит «Успешно», это означает, что статус вашей карты сайта все еще находится в ожидании, и ошибка не может получить карту сайта — это просто ошибка.

Что, если статус карты сайта не может быть получен, это не ошибка?

Иногда это может быть не ошибка Google, и ваша карта сайта действительно не может быть прочитана. В этом случае откройте карту сайта и убедитесь, что содержимое в ней действительно доступно. Вы также можете использовать инструменты проверки карты сайта Google, чтобы убедиться, что карта сайта соответствует критериям Google.

Отличным инструментом Google для проверки карты сайта является XML Sitemap Validator. Как веб-сайт для проверки формата вашей карты сайта, этот инструмент сообщит вам, использовали ли вы правильное форматирование для своей карты сайта.

Кроме того, некоторые подключаемые модули могут блокировать доступ Google к вашим веб-страницам. Вы должны проверить свои плагины и убедиться, что они не блокируют работу Google.

Поскольку Google удалил функцию "Визуализация" из своей поисковой консоли, вы можете использовать аналогичные инструменты. Fetch & Render – это хорошая замена просмотру веб-страницы с точки зрения Google.

Читайте также: