Неверный формат URL карты сайта
Обновлено: 21.11.2024
Сегодня я хочу поделиться некоторыми советами по быстрому устранению ошибок в XML-файлах карты сайта. Этот пост научит вас нескольким новым трюкам с любимым поисковым роботом Screamingfrog, инструментом, который представляет собой фантастическую проверку XML-карты сайта. Я надеюсь, что это руководство сэкономит вам время при проведении собственного SEO-аудита.
К концу этого руководства ваша XML-карта сайта будет проверена на наличие ошибок 404 (или ошибок 5xx и т. д.).
Зачем веб-сайту нужен безошибочный файл sitemap.xml?
Совет, который мы всегда слышим от Google, таков: проверяйте свои файлы Sitemap и по возможности не допускайте ошибок. Файл карты сайта используется для объявления предпочтительного канонического URL.
Обратите внимание, что ошибка в файле карты сайта является довольно серьезной проблемой, и ее лучше избегать.
Я всегда считал, что файл карты сайта с очень низким временем загрузки также рекомендуется, если вы можете ускорить динамические элементы создания файла. Я сталкивался с очень большими картами сайта, которые явно регенерируются при каждом запросе без какого-либо кэширования. Проверьте это внимательно.
Добавление и проверка новой карты сайта в (старой) Search Console.
Предыдущая версия Google Search Console по-прежнему предлагает лучшую функциональность по сравнению с новой версией, которая в настоящее время крайне ограничена:
Я обновлю эту статью, если появятся новые функции, в чем я совершенно уверен.
Настройте Screamingfrog для сканирования только URL-адресов, найденных в карте сайта XML
Screaming Frog – очень любопытный маленький поисковый робот. Конфигурация по умолчанию, даже в режиме списка, будет сканировать намного больше ресурсов, чем вам может понадобиться. Вот как настроить сканер:
Перейдите в «Настройка» > «Паук» и снимите все флажки на вкладке «Основные». Это предотвратит обнаружение Frog новых URL-адресов или ненужное сканирование ресурсов, которые бесполезны для этого проекта.
После настройки все готово. Вот краткое изложение процесса, которому я собираюсь научить вас сегодня:
Как проверить файл Sitemap XML на наличие ошибок с помощью Screaming Frog
- Откройте Screamingfrog и выберите «Режим списка».
- Возьмите URL файла sitemap.xml
- Перейдите к загрузке > Загрузить файл Sitemap
- Frog подтвердит URL-адреса, найденные в файле карты сайта.
- Нажмите «Старт», чтобы начать сканирование.
- Экспортируйте данные в CSV или отсортируйте их по коду состояния, чтобы выявить потенциальные проблемы.
Откройте Screamingfrog и выберите «Режим списка»
Откройте Screamingfrog и выберите «Список» в раскрывающемся меню «Режим»:
Теперь перейдите и получите URL-адрес sitemap.xml.
Возьмите URL вашего файла sitemap.xml
Во-первых, найдите URL-адрес файла Sitemap в формате XML. Если это ваш веб-сайт, очевидно, вы просто будете знать об этом. Он находится либо в «/sitemap.xml», либо в «/sitemap_index.xml».
Он также должен быть доступен в отчете о картах сайта в Search Console или в вашем файле robots.txt:
Вы можете посетить URL-адрес карты сайта в своем браузере. Вот как выглядит файл sitemap.xml для Builtvisible, сгенерированный плагином Yoast SEO:
Скопируйте заголовок URL в Screamingfrog.
Перейти к загрузке > Загрузить файл Sitemap
Перейдите к загрузке > Загрузите карту сайта и вставьте URL-адрес в диалоговое окно:
Frog подтвердит URL-адреса, найденные в файле карты сайта, в следующем диалоговом окне:
Нажмите "ОК", и сканер запустится автоматически.
После завершения сканирования вы можете экспортировать данные в CSV или отсортировать их по коду состояния, чтобы выделить возможные проблемы. Вам не нужна переадресация 301 или ошибка 404 — действуйте и решайте эти проблемы!
Вы создали карту сайта, отправили ее в Google, но неожиданно статус вашей карты сайта не Успешно? Или, может быть, ваш отчет Sitemap выглядит хорошо, но вы решили также проверить Покрытие индекса отчет, и кажется, что Google игнорирует вашу вежливую просьбу и не будет индексировать многие из страницы из вашей карты сайта. Итак, теперь вы задаетесь вопросом, можете ли вы что-то сделать, чтобы улучшить свою статистику индексации. В любом случае, не ищите дальше, потому что все ответы вы найдете в этом посте.
Если у вас еще нет карты сайта и вы хотите узнать, что такое хорошая карта сайта, посмотрите наш вводный ускоренный курс по созданию карты сайта. Там вы узнаете о преимуществах карты сайта и лучших методах работы с ней. Кроме того, вам следует обратиться к руководству, если вы еще не знаете, для чего используются теги и или что такое карта сайта для видео или индексный файл карты сайта.
В первой части этой публикации перечислены все ошибки, с которыми вы можете столкнуться в отчете GSC Sitemap. Итак, если вы ищете способ исправить некоторые проблемы, используйте оглавление, чтобы перейти к интересующим вас ошибкам.
Во второй части представлены сведения, которые помогут вам максимально эффективно использовать карту сайта: вы узнаете, как найти мусорные страницы в карте сайта, где искать страницы, которые вы, возможно, не включили в файл карты сайта, и как чтобы побудить Google индексировать больше ваших страниц карты сайта. Поэтому настоятельно рекомендую всем внимательно изучить вторую главу этого поста.
Исправление ошибок отчета Sitemap
После того как вы отправите карту сайта в Google, вы увидите, удалось ли ему обработать файл, в столбце Статус. Если ваш файл соответствует всем правилам, статус должен быть Успешно. В этой главе мы обсудим два других кода состояния, а именно Не удалось получить и Есть ошибки
У Google проблемы со сканированием вашего файла Sitemap
Начнем с самого неблагоприятного сценария, когда Google не может получить файл карты сайта. В этом случае вам придется использовать инструмент проверки URL, чтобы выяснить, что может быть причиной проблемы.
В инструменте проверки URL нажмите кнопку Тест в реальном времени и проверьте статус выборки страницы. Если написано Успешно, значит, ошибка на стороне Google.
Ошибка «Не удалось получить» также может возникнуть, если вы отправили файл индекса карты сайта, а не одну карту сайта в GSC. Проблема должна быть решена так же, как и с одной картой сайта.
Ошибки файла индекса Sitemap
Теперь давайте перейдем к случаям, когда Google получил отправленный вами файл и обнаружил некоторые ошибки.
С файлом индекса карты сайта Google необходимо дополнительно обработать все отдельные карты сайта, которые вы указали, чтобы наконец получить доступ к URL-адресам вашего веб-сайта. Если Google не сможет обработать URL-адреса, указанные в файле индекса карты сайта, вы получите сообщение об ошибке «Недопустимый URL-адрес в файле индекса карты сайта». Обычно это означает, что Google не может найти одну или несколько ваших карт сайта в указанных местах, потому что вы использовали неполные URL-адреса. Все URL-адреса, указывающие на отдельные карты сайта в файле индекса карты сайта, должны быть полностью определенными, иначе Google может не найти их.
Кроме того, в файле индекса карты сайта не должны быть указаны другие файлы индекса карты сайта, только карты сайта. В этом случае вы получите сообщение Неверный формат индекса карты сайта: ошибка вложенных индексов карты сайта.
Последняя ошибка: Слишком много файлов Sitemap в индексном файле Sitemap. Это может произойти с огромными веб-сайтами, на которых перечислено более 50 000 файлов Sitemap в одном файле.
Размер файла Sitemap и ошибки сжатия
Ограничения по размеру применяются как к файлам индекса карты сайта, так и к отдельным картам сайта. Размер файла карты сайта не должен превышать 50 МБ в несжатом виде, а файл не должен содержать более 50 000 URL-адресов. Если вы не будете следовать этим рекомендациям, вы получите сообщение об ошибке размера файла Sitemap. Вы можете узнать больше о разделении карты сайта на несколько файлов из нашего окончательного руководства по карте сайта.
Теперь, хотя ваша карта сайта не должна быть огромной, она, естественно, не должна быть и пустой.Если вы отправите пустую карту сайта, вы получите соответствующую ошибку.
Кроме того, я упомянул, что размер карты сайта в несжатом виде не должен превышать 50 МБ, однако обычно сжимают карты сайта для экономии полосы пропускания. Обычно для этой цели используется инструмент gzip, который добавляет расширение gz к карте сайта. Если вы видите ошибку сжатия в отчете GSC, это означает, что что-то пошло не так в процессе сжатия, и вы должны сделать это еще раз.
У Google проблемы со сканированием URL-адресов вашей карты сайта
По ряду причин Google может не сканировать некоторые URL-адреса, указанные в карте сайта. Давайте рассмотрим все такие ошибки.
Карта сайта содержит URL-адреса, заблокированные файлом robots.txt. Ошибка довольно очевидна, поскольку GSC укажет вам на заблокированные URL-адреса. В зависимости от того, хотите ли вы, чтобы эти URL-адреса были проиндексированы, вам придется либо снять блокировку, либо удалить их из карты сайта.
Другие ошибки, такие как недоступные URL-адреса, неотслеживаемые URL-адреса, недопустимые URL-адреса, не столь очевидны. Кратко пройдемся по каждому из них.
Ошибка URL недоступна означает, что Google нашел вашу карту сайта в указанном месте, но не смог получить некоторые URL из вашего списка. В этом случае вам снова нужно использовать инструмент проверки URL, как если бы Google вообще не мог получить вашу карту сайта.
Ошибка URL-адреса не отслеживается либо из-за того, что вы использовали относительные URL-адреса в карте сайта вместо полных URL-адресов, либо из-за проблем с переадресацией. Цепочки и циклы перенаправления, временные перенаправления, используемые вместо постоянного перенаправления, перенаправления HTML и JS могут привести к этим ошибкам.
Google Search Console не указывает, что именно вызывает проблему, поэтому вам придется использовать другие инструменты, чтобы понять, какие проблемы необходимо устранить. Например, в инструменте аудита веб-сайта SE Ranking есть специальный раздел «Перенаправления», где вы можете проверить, есть ли на вашем веб-сайте проблемы с переадресацией.
Если инструмент обнаружит какие-либо проблемы, вы сможете получить всю необходимую информацию о каждой ошибке, щелкнув количество страниц. Вы узнаете, на какой странице обнаружена ошибка и как эта страница связана с другими страницами. веб-сайта.
Инструмент Аудит веб-сайтов от SE Ranking также предупредит вас о таких случаях.
Google подозревает, что вы указали неправильные URL
Синтаксические ошибки карты сайта
Теперь в большинстве случаев вам не нужно беспокоиться об ошибке карты сайта из-за синтаксиса, потому что, если вы создаете карту сайта с помощью одного из специальных инструментов, они не должны смешиваться с тегами и атрибутами. Однако если у вас есть настраиваемый файл Sitemap, созданный вручную, вы можете столкнуться с одной из следующих проблем:
- Недопустимое значение тега. Значение тега — это то, что вы ставите между открывающим и закрывающим тегом — URL между тегами, дату, которую вы указываете с помощью тега. Ошибка возникает, когда вы указываете недопустимое значение в карте сайта, например. когда вы устанавливаете приоритет вне диапазона от 0,0 до 1,0. Не то чтобы вам вообще нужно было устанавливать значение приоритета!
- Недопустимое значение атрибута. Значение атрибута — это то, что вы указываете после знака равенства (=) в кавычках. Следующая строка кода перечисляет различные языковые версии страницы в карте сайта.
Здесь «альтернативный», «gb» и «fr» — это значения атрибутов, а «gb» — неправильный, поскольку вы не можете указать только код страны в hreflangs — он должен быть соединен с кодом языка, как в «en -gb.”
- Неверный URL. Как вы должны были догадаться, эта ошибка означает, что вам нужно искать опечатки в перечисленных вами URL-адресах. Напомню, что все URL-адреса в карте сайта должны быть полными.
- Недопустимая дата. Это довольно просто — это означает, что вы использовали неправильный формат даты для тега. Единственным приемлемым форматом является следующий:
- Ошибки «Отсутствует атрибут XML» и «Отсутствует тег XML» также довольно очевидны. Пропускать обязательные теги и атрибуты (urlset, url, loc, xmlns) нельзя — вам нужно указать их, чтобы ваша карта сайта функционировала должным образом.
- Недопустимый XML: слишком много тегов. Эта ошибка может возникнуть, если вы используете один из тегов несколько раз, например. вы указываете два разных местоположения URL-адресов или две разные даты модификации для одного URL-адреса. Таким образом, вам придется удалить повторяющийся тег.
- Неверное пространство имен.Пространство имен, указанное в вашем теге, должно быть одним из принятых протоколов. В настоящее время используются следующие протоколы:
- Если вы использовали неверный протокол для своей карты сайта, вы получите сообщение об ошибке "Неподдерживаемый формат". Ошибка также может возникать из-за всевозможных других синтаксических ошибок, таких как использование неправильных кавычек (допускаются только прямые одинарные или двойные кавычки) или отсутствие тега кодировки.
Есть также несколько ошибок, связанных с файлом Sitemap для видео: миниатюра слишком большая/маленькая, местоположение видео и местоположение страницы воспроизведения совпадают, URL-адрес местоположения видео выглядит как URL-адрес страницы воспроизведения. Подробнее об этих ошибках можно узнать здесь.
Чтобы избежать синтаксических ошибок, используйте один из валидаторов карты сайта, подобных этому, перед отправкой карты сайта — инструменты выявят проблемы, которые необходимо исправить.
После того как вы исправите все ошибки карты сайта, упомянутые в отчете GSC, повторно отправьте обновленную карту сайта. Это побудит Google повторно просканировать ваш веб-сайт и, наконец, проиндексировать страницы, которые не удалось просканировать из-за ошибок.
Уравнивание соотношения отправленных URL и проиндексированных URL
Состояние вашей карты сайта или файла индекса карты сайта может быть Успешно, но это не означает, что вы закончили работу с картой сайта. Щелкните значок покрытия индекса рядом с количеством обнаруженных URL-адресов, чтобы перейти к соответствующему отчету. Начав расследование, вы можете заметить, что не все отправленные вами страницы были проиндексированы.
Теперь можно исключить страницы из индексации — Google не может поставить лайк и проиндексировать все известные ему страницы вашего веб-сайта. Более того, почти на каждом веб-сайте есть страницы, которые веб-мастера не хотят индексировать — области администрирования, служебные страницы, дубликаты и альтернативные страницы. Что не является нормой, так это наличие ошибок Ошибки и Действительно с предупреждениями в отчете Покрытие индекса. Также ненормально, когда количество исключенных из индексации страниц во много раз превышает количество действительных страниц.
Почему же Google может не индексировать ваши страницы, отправленные для индексации? В большинстве случаев это происходит, когда вы добавляете страницы, которых не должно быть в вашей карте сайта. Возможно, Google просто не может индексировать и сканировать страницу из-за директивы noindex. Кроме того, может возникнуть путаница, действительно ли вы хотите, чтобы страница была проиндексирована или нет, например, когда вы добавляете неканонические страницы в свою карту сайта. Все такие экземпляры можно найти на разных вкладках отчета GSC Покрытие индекса, но удобнее проверять их с помощью инструмента Аудит веб-сайта от SE Ranking — если на вашем сайте есть какие-либо проблемы. такого рода, вы найдете их в разделе Сканирование отчета Ошибка.
Удалите неиндексируемые и неканонические страницы из карты сайта или, если страницы были помечены как неиндексируемые и неканонические по ошибке, устраните проблемы с неправильными тегами.
Убедившись, что ваш файл Sitemap не посылает в Google вводящие в заблуждение сигналы, просмотрите отчет Покрытие индекса, чтобы найти случаи, когда вы и Google расходитесь во мнениях относительно ценности страницы.
- На вкладке Действительно с предупреждениями обратите внимание на страницы, которые были проиндексированы, несмотря на директиву noindex — скорее всего, Google был прав, и вам нужно удалить noindex с этих страниц или ваш тег X-Robots.
- На вкладке Действительные посмотрите на Проиндексированные, не отправленные на страницы карты сайта — вы можете добавить их в свою карту сайта, так как Google считает, что они высоко- качественные страницы. В то же время, если Google проиндексировал вашу страницу с Условиями использования, которая не была включена в вашу карту сайта, вы также можете ничего не делать. Кроме того, следите за дубликатами страниц, которые были проиндексированы, но не были включены в вашу карту сайта — такие случаи часто возникают из-за плохой нумерации страниц и обработки параметров.
- Наконец, перейдите на вкладку Исключенные. Большинство страниц здесь должны быть исключены из индексации в соответствии с вашими собственными директивами, например. старые страницы 404, страницы, заблокированные robots.txt, noindex и канонизированные страницы. Обратите внимание на канонические страницы, которые Google решил не индексировать, потому что поисковая система считает, что на вашем сайте есть лучшие альтернативы. Скрупулезно изучите каждый случай и решите, действительно ли страница ценнее своих дубликатов — исправьте свои канонические теги, если Google был прав. Если вы все еще считаете, что страница должна быть проиндексирована, вам придется поработать над ее содержанием, профилем обратных ссылок и внутренними ссылками, чтобы убедить Google, что она более достойна, чем другие.
Вкладка Исключенные содержит еще две интересные категории страниц: Просканировано – в настоящее время не проиндексировано и Обнаружено – в настоящее время не проиндексировано. Оба типа обычно обозначают некачественные страницы с тонким содержанием, которые Google не хочет показывать пользователям. В первом случае страницу как минимум просканировали и потом посчитали некачественной, а во втором поисковик даже не удосужился потратить краулинговый бюджет на страницу. Присмотритесь повнимательнее ко всем таким страницам и узнайте, что вы можете сделать, чтобы повысить их ценность — поработать над содержанием, взаимодействием с пользователем, внутренними ссылками и т. д.
Заключение
Благодаря множеству инструментов для создания карты сайта создать карту сайта очень просто. Однако, если вы просто используете один из случайных инструментов и игнорируете передовые методы сопоставления сайта, вы можете получить отчет Sitemap, полный ошибок, или отправить в Google множество некачественных страниц через свою карту сайта.
Я надеюсь, что это руководство помогло вам исправить каждую ошибку в вашем отчете о карте сайта GSC, и вам также удастся оставить в карте сайта только сочные высококачественные страницы и удалить все страницы, которые производят плохое впечатление на поисковые системы. . Если у вас остались вопросы, не стесняйтесь оставлять их в разделе комментариев ниже.
Сообщения об ошибках в WordPress, как правило, сбивают с толку и требуют решения, но ошибка «Ваша карта сайта выглядит как HTML-страница», к счастью, не является одной из них.
Если вы столкнулись с этой проблемой, вы, вероятно, задаетесь вопросом, что означает эта ошибка, что не так с вашей картой сайта в формате HTML и как именно вы можете решить эту проблему. А что, если ваша карта сайта уже имеет правильный формат, но вы все еще видите эту ошибку?
Мы расскажем вам обо всем: о том, как работает карта сайта, в каком формате она должна быть и о нескольких способах решения этой проблемы.
Посмотрите наше видеоруководство по устранению ошибки «Ваш файл Sitemap выглядит как HTML-страница»:
Что такое карта сайта?
Знаете ли вы, как поисковые системы находят ваш сайт? Ответ заключается в использовании удобного маленького бота, называемого поисковым роботом — автоматического инструмента, рассылаемого поисковыми системами для индексации страниц вашего сайта.
С учетом того, что в Интернете буквально миллионы страниц, сбор информации о каждом сайте был бы невозможен для людей. Поисковые роботы просматривают Интернет, кэшируя информацию на каждой странице и фрагменте мультимедиа.
Это кажется достаточно простым, но Google не знает автоматически, когда вы добавляете новую страницу на свой сайт, например, когда вы публикуете сообщение в блоге или добавляете новый продукт в свой магазин. Они периодически отправляют поисковый робот на ваш сайт и проверяют, не изменилось ли что-нибудь, но этот процесс не происходит мгновенно.
Если у вас большой веб-сайт, сканер может легко пропустить ключевые страницы даже после нескольких посещений. В первую очередь беспокоит то, что на такие страницы редко ссылаются.
Именно здесь на помощь сканерам приходят карты сайта. Эти XML-файлы отличаются от обычных страниц вашего сайта; они, как правило, нечитаемы людьми и не предназначены для просмотра посетителями. Но поисковые роботы могут использовать их, чтобы убедиться, что все проиндексировано.
Пример файла Sitemap в формате XML.
Они работают, просто перечисляя все страницы вашего сайта вместе с их иерархией ссылок, а также другие файлы на вашем сайте, такие как изображения и видео. Это гарантирует, что Google увидит все, что есть на вашем сайте, и соответствующим образом улучшит поисковую оптимизацию.
Если вы использовали такой инструмент, как Google Analytics или Google Search Console, вы, возможно, видели вариант ссылки на карту сайта. Google будет ссылаться на это в первую очередь при отправке поисковых роботов на ваш сайт.
Главная страница Google Search Console. Столкнулись с этой распространенной ошибкой WordPress? 🤯 Решение находится всего в одном клике 😌 Нажмите, чтобы твитнуть
Различия между файлами Sitemap в формате HTML и XML
Итак, ваша карта сайта представляет собой HTML-страницу, но в чем именно заключается проблема? Почему Google хочет, чтобы вы изменили его?
Файлы Sitemap должны быть написаны в определенном формате, чтобы поисковые роботы могли их понять. В большинстве случаев это должен быть файл XML. Они также могут читать RSS, Atom, KML или текстовые файлы, но чаще всего выбирают XML.
Пример RSS-канала.
XML означает «расширяемый язык разметки». Это веб-язык, очень похожий на HTML. Разница заключается в его использовании: хотя он удобочитаем для человека, его основная функция — помогать машинам кодировать документы и считывать данные.
В данном случае это помогает поисковому роботу понять, где находятся страницы и другие медиаданные на вашем сайте и как они взаимодействуют друг с другом.
Но вы, возможно, уже встречали термин "карта сайта" в совсем другом контексте. Файлы Sitemap в формате HTML существуют, но большая разница в том, что они созданы для людей, а не для поисковых роботов.
Если вы когда-либо нажимали ссылку на навигацию по сайту и находили удобочитаемый и приятно оформленный список страниц на сайте, технически это называется картой сайта. Но хотя это может быть полезно вашим посетителям, это не то, что нужно Google.
Карта сайта в формате XML для большинства пользователей будет выглядеть как беспорядок из нечитаемого кода или массивная стена ссылок, поэтому, если вы хотите добавить на свой сайт полезную навигационную страницу, не стесняйтесь создавать вместе с ней карту сайта в формате HTML… но вы необходимо также создать XML-карту сайта.
Пример карты сайта.
Другие типы файлов Sitemap
Когда вы думаете о карте сайта, на ум может прийти простой список страниц вашего сайта. Но Google использует несколько разных типов карт сайта для каталогизации различной информации. К ним относятся:
- Видео. Видео на вашем сайте можно специально проиндексировать, чтобы оно отображалось в результатах Google Video.
- Изображения. То же самое относится и к изображениям. Некоторые изображения, например встроенные в код Javascript, обычно не индексируются. Карта сайта с изображением может помочь обеспечить отображение вашего сайта в Картинках Google.
- Новости: написать колонку? У Google есть специальный раздел Новостей Google в поиске, а файл Sitemap для новостей может гарантировать, что вы будете правильно отображаться в нем и получать больше трафика.
- Код: Google индексирует фрагменты кода, чтобы помочь программистам искать код и файлы.
- Географические данные. Вы можете использовать специальную карту сайта KML, чтобы предоставить Google более точные данные о местонахождении вашего бизнеса.
Обычно часть этой информации содержится в вашей основной карте сайта. Другие должны иметь свою специальную специальную карту сайта. И, наконец, все они должны быть соответствующим образом отформатированы в XML или другом поддерживаемом формате, а не в HTML.
Как создать файл Sitemap в формате XML
Если вы намеренно отправили ссылку на карту сайта в формате HTML, вам необходимо заменить ее файлом XML. Если вы не знаете, как его создать, есть несколько разных способов сделать это с помощью плагинов и генераторов WordPress, которые вы можете найти в Интернете.
Даже если у вас есть XML-карта сайта, которая просто не работает, повторное создание или отправка другой карты сайта может решить проблему.
Существует два простых способа получить карту сайта: либо использовать подключаемый модуль, либо создать его с помощью карты сайта.
Создать файл Sitemap с помощью плагина
В WordPress самый простой способ получить динамически обновляемую карту сайта на своем веб-сайте — загрузить подключаемый модуль. Таким образом, вам не нужно загружать файлы на сервер вручную.
Существует довольно много плагинов, которые генерируют карту сайта:
-
: самый популярный SEO-плагин в репозитории также включает в себя создание карты сайта. Вы можете найти настройки в разделе SEO > Общие > Функции и XML-карты сайта. : Помимо обычной карты сайта, этот SEO-плагин также может генерировать карту сайта WooCommerce и карту сайта с геоданными KML. Перейдите в RankMath > Настройки карты сайта. : Как следует из названия, XML Sitemaps создает карту сайта. Плагин на 100% бесплатный и с открытым исходным кодом, поэтому никаких скрытых платежей. : этот плагин создает карту сайта в формате XML и карту сайта Google News. Его также несложно установить и настроить. : Если вы хотите создать карту сайта HTML вместе с картой сайта XML, этот плагин для вас. Оба обновляются автоматически, поэтому вам не нужно выполнять какую-либо ручную работу.
Сайты с генераторами файлов Sitemap
Вместо подключаемого модуля вы можете использовать генератор карты сайта, например XML-Sitemaps или XML Sitemap Generator. Затем вы можете загрузить его на свой сайт.
Шаг 1. Создайте карту сайта с помощью одного из указанных выше сайтов или любого генератора по вашему выбору. Загрузите XML-документ.
Генератор XML-карты сайта
Шаг 2. Загрузите FileZilla или (если поддерживается) используйте веб-хост для подключения к сайту через FTP.
Подпишитесь на рассылку новостей
Хотите узнать, как мы увеличили трафик более чем на 1000 %?
Присоединяйтесь к более чем 20 000 человек, которые получают нашу еженедельную рассылку с полезными советами по WordPress!
Шаг 3. Поместите XML-файл в корневую папку вашего сайта. Корень — это самый верхний каталог вашего сайта — тот же каталог, с которого вы начинаете при первом подключении.
В отличие от карт сайта на основе подключаемых модулей, карты сайта, созданные с помощью веб-сайта, не являются динамическими. Статические карты сайта не будут обновляться при публикации новых сообщений и страниц на вашем сайте. Вам нужно каждый раз создавать новый файл. Так что для блогов и других сайтов, которые часто обновляются, это не идеальный вариант.
Как исправить ошибку файла Sitemap
Ошибка карты сайта часто возникает из-за случайной отправки HTML-страницы, а не правильно отформатированного XML-файла. Но если ваша XML-карта сайта по-прежнему претендует на роль HTML-страницы, у вас может быть более серьезная проблема.
Не беспокойтесь: проблема обычно связана с легко устранимым конфликтом в ваших плагинах WordPress. Вот несколько советов, как восстановить правильную работу карты сайта.
Проверить наличие ошибок и перенаправлений
Намного легче диагностировать проблему, если у вас есть явный код ошибки для поиска. Первое, что вы должны сделать, это посетить страницу с картой сайта и посмотреть, нет ли каких-либо странных кодов ошибок.
Страница ошибки 404 Kinsta.
Что делать, если вы время от времени замечаете ошибку карты сайта — иногда появляется, а иногда нет? Это может произойти, если вы динамически создаете карту сайта.
Незначительные ошибки сервера и тайм-ауты будут считаны Google, как если бы ваша карта сайта внезапно превратилась в HTML-страницу, поскольку она показывает сообщение об ошибке, а не XML-файл. Если ошибка возникает редко, не является постоянной или частой, она обычно не вызывает беспокойства.
Еще одна вещь, на которую следует обратить внимание, — это переадресация. Если вы зайдете на страницу с картой сайта и внезапно окажетесь на главной странице или в бесконечном цикле переадресации, это также приведет к поломке.
Если вы обнаружите какие-либо ошибки или перенаправления, которые не исчезнут, проблема обычно связана с конфликтом плагинов. Плагины, создающие карты сайта, такие как Yoast, могут вызвать конфликт, или источником проблемы может быть плагин кэширования.
Но иногда даже кажущиеся случайными плагины могут вызывать конфликты. Используйте подключаемый модуль проверки работоспособности и устранения неполадок, чтобы идентифицировать их.
Плагин проверки работоспособности и устранения неполадок после установки.
Установите его, если он еще не установлен, затем выберите Инструменты > Здоровье сайта > Режим устранения неполадок. Он временно отключит все плагины, не повлияв на ваших посетителей.
Нужен быстрый, надежный и безопасный хостинг для вашего нового веб-сайта? Kinsta предоставляет невероятно быстрые серверы и круглосуточную поддержку мирового класса от экспертов WordPress. Ознакомьтесь с нашими планами
Проверьте, исчезла ли ошибка или переадресация на вашем сайте. Если это так, повторно включайте плагины один за другим, пока сайт снова не сломается. Ищите конфликты между несколькими плагинами.
Теперь вы можете связаться с автором(ами) плагина, чтобы сообщить об ошибке и попросить о помощи.
Отключить кэширование
Одна из основных причин конфликтов связана с подключаемыми модулями кэширования. Кэширование карты сайта может иногда вызывать проблемы с ее чтением Google как HTML-страницы, поскольку таким образом не следует кэшировать XML-файлы.
Из-за этого большинство подключаемых модулей кэширования не будут кэшировать страницу карты сайта, но они все равно могут сделать это ошибочно, особенно если вы используете уникальный URL для своей карты сайта.
К счастью, вам не нужно отключать весь подключаемый модуль кэширования. Вы можете добавить исключение, и проблема должна исчезнуть автоматически.
Это должно быть описано в документации вашего плагина, но вот как это сделать в WP Super Cache и W3 Total Cache.
Для WP Super Cache выберите «Настройки» > «WP Super Cache». На вкладке "Дополнительно" прокрутите до пункта "Добавить сюда строки (не имя файла), которые запрещают кэширование страницы".
Для общего кэша W3 перейдите в раздел «Производительность» > «Кэш страниц», затем найдите «Дополнительно» > «Никогда не кэшировать следующие страницы». Как и в случае с WP Super Cache, введите URL-адрес карты сайта.
Вы также можете добавить его в Minify в меню Performance > Miniify and Never minify для следующих страниц, так как это может привести к проблемам.
Проверьте URL-адрес файла Sitemap
Хотя это небольшое предложение, всегда стоит перепроверить: вы отправили правильную ссылку? Это элементарная ошибка, и даже один неправильный символ укажет не на то место.
Проверьте отправленную вами ссылку как через Google, так и в любых плагинах SEO или Sitemap.
Снова включите режим устранения неполадок в подключаемом модуле проверки работоспособности и попытайтесь определить, какой подключаемый модуль вызывает эту проблему. В большинстве случаев вы можете отследить это до одного отдельного плагина.
Удалить лишние файлы Sitemap
Хотя это обычно не вызывает проблем, если вы ссылаетесь на правильную страницу, дополнительные активные файлы Sitemap могут иногда вызывать проблемы или путаницу у вас самих.Кроме того, ваш сервер тратит дополнительные ресурсы на обновление нескольких ненужных файлов Sitemap.
Плагины могут добавлять разные карты сайта, и вы можете не знать, что WordPress даже создает для вас свои собственные карты. Вы должны проверить их и удалить все, кроме того, который вы хотите использовать. Вот несколько URL-адресов, которые вы можете попробовать на своем сайте:
- /sitemap.xml — общий выбор для создания карт сайта в большинстве плагинов для карт сайта.
- /wp-sitemap.xml — это карта сайта по умолчанию, созданная WordPress, начиная с версии 5.5.
- /sitemap_index.xml — URL-адрес карты сайта, созданной Yoast.
И если вы загрузили другие плагины SEO или карты сайта, они могут использовать совершенно другой URL. Ознакомьтесь с документацией и убедитесь, что вы отключили все функции карты сайта, которые вам не нужны.
Действительно ли вам нужен файл Sitemap?
Иногда файлы Sitemap необъяснимым образом могут стать источником постоянного потока проблем. И простого исправления может быть недостаточно, чтобы они исчезли. Если вы постоянно сталкиваетесь с трудными для решения проблемами, вы можете начать сомневаться в том, что карта сайта жизненно важна для вас.
Обычно рекомендуется создавать карту сайта, так как Google заявляет, что никогда не накажет за это SEO-специалистов. Это может только помочь улучшить SEO и ускорить индексацию вашего сайта.
Но в определенных ситуациях он не обязателен, и сам Google предлагает не использовать их на некоторых сайтах.
Предположим, что на вашем сайте менее 500 страниц, и вряд ли когда-либо будет больше. В этом случае, если он имеет хорошие внутренние ссылки (что вы должны делать в любом случае) и не имеет большого количества медиафайлов, которые вы хотите отображать в Google Images и Google Video, вам может вообще не понадобиться карта сайта.
С другой стороны, наличие карты сайта действительно может помочь вашему SEO, и в этом нет ничего плохого, поэтому проталкивание и устранение проблемы не принесет ничего, кроме пользы. Сейчас ваш сайт может быть маленьким, но, вероятно, так будет не всегда.
Если вы застряли, вы всегда можете обратиться в службу поддержки вашего хоста, чтобы выяснить, что может быть причиной проблемы.
Обзор
Ошибка «карта сайта выглядит как HTML-страница» может раздражать, но обычно это просто результат неправильного форматирования страницы или легко устраняемый конфликт кэширования. После того, как вы выяснили проблему, для ее решения достаточно нескольких дополнительных шагов.
За одной ошибкой часто следует другая, поэтому, если у вас все еще возникают проблемы с сайтом, попробуйте ознакомиться с нашей основной статьей о 65+ ошибках WordPress и о том, как их исправить.
Экономьте время, деньги и повышайте эффективность сайта с помощью:
- Мгновенная помощь от экспертов по хостингу WordPress, круглосуточно и без выходных.
- Интеграция с Cloudflare Enterprise.
- Глобальный охват аудитории благодаря 29 центрам обработки данных по всему миру.
- Оптимизация с помощью нашего встроенного мониторинга производительности приложений.
Все это и многое другое в одном плане без долгосрочных контрактов, помощи при миграции и 30-дневной гарантии возврата денег. Ознакомьтесь с нашими планами или поговорите с отделом продаж, чтобы найти план, который подходит именно вам.
Отобранные статьи по теме
Блог
Полное руководство по отладке WordPress (включите WP_DEBUG + другие инструменты)
Проблемы с WordPress? Вот как включить WP_DEBUG в вашем файле wp-config.php, чтобы найти виновника, и некоторые другие советы по отладке вашего WordPres…
Блог
Блог
Как найти и исправить неработающие ссылки в WordPress (5 методов)
Неработающие ссылки отрицательно сказываются на пользовательском опыте и SEO. Ознакомьтесь с этими различными методами поиска и исправления неработающих ссылок в WordPress без ущерба для производительности…
Используйте отчет о файлах Sitemap, чтобы сообщать Google о любых новых файлах Sitemap для вашего ресурса, просматривать историю отправки файлов Sitemap и любые ошибки, обнаруженные Google при анализе отправленных вами файлов Sitemap.
Что такое карта сайта? Нужен ли мне этот отчет?
Карта сайта – это файл на вашем сайте, который сообщает Google, о каких страницах вашего сайта нам следует знать.
- Если вы используете службу веб-хостинга, такую как Squarespace или Wix, они могут создать для вас карту сайта, и в этом случае вам не нужно использовать карты сайта или этот отчет. Найдите у своего хостинг-провайдера информацию о файлах Sitemap.
- Если у вас небольшой сайт (менее 100 страниц) и вы можете перейти на любую страницу своего сайта, перейдя по одной или нескольким ссылкам с главной страницы, вам не нужно использовать файлы Sitemap или этот отчет. В этом случае просто запросите индексацию своей главной страницы (если только вы не используете услугу веб-хостинга, как упоминалось ранее, и в этом случае вам вообще ничего не нужно делать).
Управление файлами Sitemap
Для управления файлами Sitemap также можно использовать API Sitemaps Search Console. API предоставляет все те же функции и информацию, что и этот отчет.
"Отправка" карты сайта означает сообщение Google, где ее найти на вашем сайте. На самом деле вы не можете загрузить карту сайта в Google.
Чтобы отправить новую карту сайта для сканирования:
- Предпосылки:
- У вас должны быть права владельца ресурса, чтобы отправить карту сайта с помощью отчета о файлах Sitemap. Если у вас нет разрешений владельца, вместо этого вы можете указать его в файле robots.txt.
- Обратите внимание, что в отчете может отображаться не более 1000 отправленных файлов Sitemap. Вы можете отправить больше, но здесь могут быть показаны только 1000 (которые не отображаются в порядке отправки). В настоящее время нет никакого способа увидеть лишние файлы Sitemap в Search Console.
- Разместите карту сайта на своем сайте.
- Карта сайта должна использовать один из допустимых форматов карты сайта. Следуйте рекомендациям по синтаксису, местоположению файла и т. д. для файла Sitemap.
- Мы рекомендуем размещать карту сайта в корневом каталоге вашего сайта, но если вы используете службу хостинга сайта (такую как Blogger, Wix или GoDaddy), вам следует прочитать документацию по вашей службе, чтобы узнать, где и как опубликовать карту сайта (или даже необходимо).
- Карта сайта должна быть доступна для робота Googlebot и не должна быть заблокирована какими-либо требованиями входа в систему. Вы можете проверить, доступна ли карта сайта роботу Googlebot, проверив, можете ли вы перейти по URL-адресу карты сайта в режиме инкогнито.
- Откройте отчет о файлах Sitemap.
- Введите относительный URL-адрес карты сайта в отчет о файлах Sitemap и нажмите "Отправить".
Карта сайта должна быть обработана немедленно. Однако сканирование URL-адресов, перечисленных в карте сайта, может занять некоторое время, и возможно, что не все URL-адреса в карте сайта будут просканированы, в зависимости от размера сайта, активности, трафика и т. д.
Повторно отправить карту сайта
Вам не нужно повторно отправлять карту сайта, о которой мы уже знаем, даже если вы ее изменили. Google заметит любые изменения при следующем сканировании вашего сайта.
Удалить карту сайта
При удалении карты сайта она удаляется из этого отчета, но Google не забывает карту сайта или любые указанные в ней URL-адреса. Если вам действительно нужно, чтобы Google перестал посещать URL-адреса, указанные в карте сайта, вам потребуется использовать правило robots.txt.
Чтобы удалить карту сайта:
- В таблице основного отчета о файлах Sitemap найдите и щелкните файл Sitemap, который вы хотите удалить.
- На странице сведений о карте сайта нажмите кнопку дополнительных параметров.
- Нажмите Удалить карту сайта.
- Чтобы Google больше не посещал карту сайта, либо используйте правило robots.txt, чтобы заблокировать ее чтение Google, либо удалите файл карты сайта со своего сайта.
Чтение отчета
- В этом отчете показаны только те файлы Sitemap, которые вы отправили с помощью этого отчета или API. Он не показывает какие-либо карты сайта, обнаруженные с помощью ссылки robots.txt или других методов обнаружения. Однако, даже если мы уже обнаружили карту сайта с помощью других средств, вы все равно можете отправить ее с помощью этого отчета, чтобы отслеживать наши успехи и количество ошибок.
- В отчете показаны только те файлы Sitemap, которые относятся к текущему ресурсу.
- Вы можете отправить изображения, видео или URL-адреса новостей в карту сайта. Однако в настоящее время в отчете нет данных для этих типов URL.
Для каждой карты сайта отображается следующая информация:
Моей карты сайта нет в списке!
Вот несколько причин, по которым ваш файл Sitemap может не отображаться в отчете:
Ошибки файла Sitemap
Отчет о файлах Sitemap сообщает о следующих ошибках.
URL недоступны
Google обнаружил ошибку при попытке сканирования URL-адреса в вашей карте сайта. Проверьте URL-адрес в карте сайта с помощью инструмента проверки URL-адресов, чтобы узнать, доступен ли URL-адрес для Google.
URL не отслеживаются
Google не удалось просканировать все URL-адреса, указанные в вашей карте сайта. Вот несколько возможных причин:
- URL содержит слишком много переадресаций для поисковых роботов Google. Мы предлагаем вам заменить все URL-адреса перенаправления в ваших картах сайта URL-адресами, которые действительно должны сканироваться.
- Если вы постоянно перенаправляете с одной страницы на другую, используйте постоянную переадресацию.
- Избегайте использования переадресации JavaScript или мета-обновления.
URL запрещен
Ваша карта сайта содержит некоторые URL-адреса, которые находятся на более высоком уровне или в другом домене, чем файл карты сайта.
Ошибка сжатия
Google обнаружил ошибку при попытке распаковать сжатый файл карты сайта. Повторно сожмите карту сайта (с помощью такого инструмента, как gzip), загрузите ее на свой сайт и отправьте повторно.
Пустой файл Sitemap
Ваша карта сайта не содержит URL-адресов. Проверьте свою карту сайта, чтобы убедиться, что она не пуста.
Ошибка размера файла карты сайта: размер вашей карты сайта превышает максимально допустимый размер файла.
Ваша карта сайта в несжатом виде превышает 50 МБ. Если ваша карта сайта больше установленного лимита, разбейте ее на несколько меньших файлов Sitemap и перечислите их в файле индекса карты сайта, а затем отправьте файл(ы) индекса карты сайта.
Недопустимое значение атрибута
Вы присвоили недопустимое значение атрибуту тега XML. Проверьте свои карты сайта, чтобы убедиться, что присутствуют только разрешенные атрибуты, и что вы назначаете только разрешенные значения в соответствии со спецификациями карты сайта. Проверьте атрибуты и значения на наличие опечаток.
Недопустимая дата
Ваш файл Sitemap содержит одну или несколько недопустимых дат. Эта ошибка может быть связана с тем, что дата имеет неправильный формат или сама дата недействительна. Даты должны использовать кодировку даты и времени W3C, хотя вы можете опустить часть времени. Убедитесь, что ваши даты соответствуют одному из следующих форматов даты и времени W3C:
Указывать время необязательно (время по умолчанию – 00:00:00 по Гринвичу), но если вы указываете время, необходимо также указать часовой пояс.
Недопустимое значение тега
Ваша карта сайта содержит один или несколько тегов с недопустимым значением. Проверьте характеристики своего типа карты сайта (индекс, стандарт, видео и т. д.).
Неверный URL
Убедитесь, что URL-адреса, указанные в карте сайта, закодированы для удобства чтения и правильно экранированы. Проверьте наличие неправильных символов, таких как пробелы или кавычки. Вы также можете попробовать скопировать URL-адрес в браузер, чтобы проверить, сможет ли браузер понять URL-адрес и загрузить страницу.
Недопустимый URL-адрес в файле индекса карты сайта: неполный URL-адрес
Обновите файл индекса карты сайта, включив в него полный путь к каждому указанному файлу карты сайта, а затем отправьте повторно.
Недопустимый XML: слишком много тегов
Ваша карта сайта содержит повторяющиеся теги. Например, следующая запись вызовет эту ошибку, поскольку тег указан дважды:
В ошибке указан проблемный тег и номер строки. Удалите повторяющийся тег и повторно отправьте карту сайта.
Отсутствует атрибут XML
У тега в карте сайта отсутствует обязательный атрибут. Проверьте свои карты сайта, чтобы убедиться, что все обязательные атрибуты отсутствуют. После того как вы исправите значения атрибутов, повторно отправьте карту сайта.
Отсутствует тег XML
В одной или нескольких записях на карте сайта отсутствует обязательный тег. В сообщении об ошибке указан номер строки. Просмотрите страницу основных сведений о карте сайта, чтобы узнать о необходимых тегах.
Отсутствует URL эскиза
В одной или нескольких видеозаписях отсутствует URL миниатюры. Убедитесь, что расположение всех URL миниатюр указано с помощью тега.
Отсутствует название видео
В одной или нескольких видеозаписях отсутствует заголовок. Убедитесь, что у каждого видео в вашей карте сайта есть заголовок, указанный в теге.
Неправильный формат индекса карты сайта: вложенные индексы карты сайта
Одна или несколько записей в файле индекса карты сайта используют собственный URL-адрес или URL-адрес другого файла индекса карты сайта. Файл индекса карты сайта не может отображать другие файлы индекса карты сайта, только файлы карты сайта.
Удалите все записи, указывающие на файлы индекса карты сайта, а затем повторно отправьте карту сайта.
Ошибка синтаксического анализа
Google не удалось проанализировать XML карты сайта.
Часто эта проблема возникает из-за неэкранированного символа в URL. Как и во всех файлах XML, любые значения данных (включая URL-адреса) должны использовать escape-коды сущностей для определенных символов, таких как символы & ' ". Убедитесь, что ваши URL-адреса правильно экранированы.
Временная ошибка
В нашей системе возникла временная проблема, из-за которой мы не смогли обработать вашу карту сайта. Как правило, когда вы получаете эту ошибку, вам не нужно повторно отправлять карту сайта. Google может попытаться снова получить вашу карту сайта позже. Если ошибка не устранена через несколько часов, попробуйте повторно отправить файл Sitemap.
Слишком много файлов Sitemap в индексном файле Sitemap
В вашем файле индекса карты сайта содержится более 50 000 карт сайта. Разделите индекс карты сайта на несколько файлов индекса карты сайта и убедитесь, что в каждом из них содержится не более 50 000 карт сайта.
Слишком много URL в карте сайта
В вашей карте сайта указано более 50 000 URL-адресов. Разделите карту сайта на несколько карт сайта и убедитесь, что каждая из них содержит не более 50 000 URL-адресов. Вы также можете использовать файл индекса карты сайта для управления файлами карты сайта.
Неподдерживаемый формат
Ваша карта сайта имеет неподдерживаемый формат.
Некоторые распространенные ошибки XML:
- В карте сайта должен использоваться правильный заголовок. Например, если ваша карта сайта содержит информацию о видео, она будет иметь следующий заголовок:
- Пространство имен в заголовке должно быть "http://www.sitemaps.org/schemas/sitemap/0.9" (не .9).
- Все XML-атрибуты должны быть заключены либо в одинарные ('), либо в двойные (") кавычки, и эти кавычки должны быть прямыми, а не фигурными. Программы обработки текстов, такие как Microsoft Word, могут вставлять фигурные кавычки.
Несоответствие пути: отсутствует www
Измените карту сайта, чтобы удалить "www" из всех URL-адресов, чтобы они соответствовали местоположению вашей карты сайта.
Несоответствие пути: включает www
Измените карту сайта, чтобы добавить "www" ко всем URL-адресам, чтобы они соответствовали местоположению вашей карты сайта.
Неверное пространство имен
Корневой элемент вашей карты сайта не содержит правильного пространства имен, или пространство имен объявлено неправильно, или содержит опечатку или неверный URL.
Убедитесь, что вы используете правильное пространство имен для вашего типа файла. Например:
- Файл карты сайта: xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
- Файл карты сайта для видео: xmlns:video="http://www.google.com/schemas/sitemap-video/1.1"
- Файл карты сайта index: .
Ведущий пробел
Ваша карта сайта начинается с ведущего пробела, а не с объявления пространства имен. Файлы XML должны начинаться с объявления XML, указывающего используемую версию XML.
Эта ошибка не помешает Google обработать вашу карту сайта, но вы можете удалить пробел, чтобы файл соответствовал стандарту XML и больше не появлялась эта ошибка.
Миниатюра слишком большая
Эскиз видео, указанный в карте сайта, слишком велик. Измените размер миниатюры видео до 160 x 120 пикселей. Обновите карту сайта новой информацией, а затем отправьте ее повторно. Подробнее о добавлении информации о видео в карту сайта.
Миниатюра слишком маленькая
Эскиз видео, указанный в карте сайта, слишком мал. Измените размер миниатюры видео до 160 x 120 пикселей. При необходимости обновите карту сайта. Подробнее о добавлении информации о видео в карту сайта.
Местоположение видео и страница воспроизведения совпадают
В карте сайта для видео URL-адрес видеоконтента и URL-адрес проигрывателя не могут совпадать. Если вы укажете и , и , URL-адреса должны быть разными. Подробнее о добавлении информации о видео в карту сайта.
URL местоположения видео выглядит как URL страницы воспроизведения
В карте сайта для видео URL-адрес указывает на страницу, на которой размещен проигрыватель. Подробнее о добавлении информации о видео в карту сайта.
Читайте также: