- Отличие XML-карты сайта от HTML версии
- Синтаксис файла sitemap.xml
- XML-карта позволяет экономить краулинговый бюджет
- Как рассказать поисковым роботам о карте сайта
- 4 cпособа создать sitemap.xml
- При любом способе обратите внимание на следующие моменты:
- Онлайн генераторы карты сайта
- Как создать sitemap.xml в разных CMS
- 1C-Битрикс: встроенная функция
- WordPress: используйте плагины
- Модули для других популярных CMS
Отличие XML-карты сайта от HTML версии
Под термином «веб-карта» понимаются 2 вида документов:
- HTML (веб-страница) — список ссылок на страницы сайта. Необходимая для навигации пользователя, обычно оформленная в виде древовидной структуры, имеет адрес типа site.com/sitemap/ или site.com/karta-saita/ и т д.
Пример оформления html карты сайта
- XML — это файл в корневом каталоге сайта, который содержит список URL-адресов с информацией об их последнем обновлении и приоритете индексации. Требуется для поисковых роботов, должен быть доступен на site.com/sitemap.xml.
Фрагмент XML-карты сайта.
Веб-сайт должен иметь как HTML-карту, так и XML. Первый нужен для пользователей, второй для ботов. Далее мы поговорим о XML-карте сайта.
Карта XML полезна для анализа данных с веб-сайтов. Парсит метатеги и заголовки в систему PromoPult: быстро, с любого сайта. Мы соберем метатеги и заголовки H1 со всех веб-страниц. Загрузите список страниц или карту сайта.
Синтаксис файла sitemap.xml
Первая строка файла карты сайта — это ссылка на пространство имен XML (описание стандарта, на котором основан файл). Строка по умолчанию и всегда выглядит так:
Карта сайта XML должна быть в кодировке UTF-8 и содержать следующие теги:
- открывающий/закрывающий тег, содержит все ссылки на файл карты сайта.
- содержит всю необходимую для робота информацию о каждой ссылке: URL, как часто обновляется информация по этому адресу, дата последнего обновления и приоритет в индексации.
- ограничивает определенный URL:
- указывает периодичность обновления информации на странице: всегда, ежечасно, ежедневно, еженедельно, ежемесячно, ежегодно, никогда (всегда, ежечасно, ежедневно, еженедельно, ежемесячно, ежегодно, никогда). Благодаря этому тегу робот может понять, как часто меняется содержимое документа и нужно ли его сканировать. Тег является необязательным и сейчас редко используется.
- указывает дату с момента последнего обновления. Так робот понимает, изменилось ли что-то с момента последнего визита.
- дает роботам рекомендацию о приоритете индексации. На главной странице всегда1, остальные можно заказать в зависимости от предпочтений оптимизатора (например, 0,8, 0,6 и так далее до 0,1).
Рекомендуемое количество ссылок в файле sitemap.xml — не более 50 тысяч. Если количество страниц сайта превышает это число, необходимо создать дополнительные карты и указать ссылки на них в файле site.com/sitemap.xml:
SEO-модуль в системе Promopult: все инструменты для улучшения качества сайта и продвижения в поисковых системах. Полный комплекс работ – с нами вы не упустите ни одной детали. Контрольные списки, советы, прозрачная отчетность и профессиональные рекомендации. Гарантии, оплата работ в рассрочку.
XML-карта позволяет экономить краулинговый бюджет
Краулер (паук) — это поисковый робот, который сканирует страницы веб-сайта и добавляет их в индекс. Бюджет просмотра — это количество страниц за одно посещение робота, для разных сайтов бюджет ограничен — это могут быть десятки и сотни документов. Вот почему вам нужно направлять поисковый робот на страницы, важные для веб-маркетинга, и следить за тем, чтобы он не попадал на плохие, неинформативные служебные страницы.
Важно понимать, что инструкции в файлах robots.txt и sitemap.xml являются только рекомендациями для роботов.
Отсутствие файла карты сайта не является критической ошибкой. Но если краулер не найдет файл sitemap.xml, он просканирует и добавит документы в индекс по своему усмотрению, и тогда наличие «мусора», служебных страниц, дубликатов, страниц с ошибкой 404 в индексе может стать проблемой препятствие на странице выходит наверх.
Все боты поисковых систем могут самостоятельно обнаруживать XML-карту сайта, если она доступна по адресу site.com/sitemap.xml, но есть способы быстрее передать важную информацию поисковым системам.
Читайте также: Что такое хеш-сумма файла и как её замерять
Как рассказать поисковым роботам о карте сайта
- Укажите ссылку на файл в директиве sitemap файла robots.txt:
- Добавьте файл sitemap.xml в разделы «Индексирование — Карты сайта» Яндекс.Вебмастера и разделы «Карты сайта» Google Search Console.
Яндекс и Гугл не только просканируют добавленный файл, но и укажут на возможные ошибки.
4 cпособа создать sitemap.xml
- Вручную, руководствуясь описанными выше правилами синтаксиса. Этот вариант подходит для небольших сайтов. Не забудьте поместить файл sitemap.xml в корневую папку сайта (нужен доступ к хостингу или ftp) и проверьте, корректно ли он открывается по адресу site.com/sitemap.xml.
- Используйте платные и бесплатные программы для создания XML-карты сайта (например, Sitemap Generator, Sitemap Writer Pro, SiteMap XML Dynamic). Такое программное обеспечение использовалось до широкого распространения онлайн-генераторов. На момент написания статьи все три программы давно не обновлялись.
- использование онлайн-генераторов карты сайта — это самый простой и бесплатный способ создать файл sitemap.xml.
- Воспользуйтесь преимуществами системы управления контентом.
При любом способе обратите внимание на следующие моменты:
- Вам необходимо поместить файл sitemap.xml в корень сайта.
- Ссылки в карте сайта не должны противоречить правилам файла robots.txt. Другими словами, страницы, закрытые от индексации в robots.txt, не должны быть в XML-карте сайта.
- После автоматического создания проверьте и исправьте XML-карту для URL-адресов, которые не требуются для индексации.
Давайте подробнее рассмотрим наиболее популярные способы создания XML-карты.
Онлайн генераторы карты сайта
Если на вашем сайте небольшое количество страниц, вы можете создать карту сайта с помощью веб-генераторов.
Основным недостатком веб-генераторов является то, что они создают файл sitemap.xml раз и навсегда. Если на сайт постоянно добавляются новые страницы, этот способ не подходит.
Как создать sitemap.xml в разных CMS
Все популярные системы управления контентом (CMS) имеют возможность создавать XML-карту. Файлы карты сайта в этом случае обновляются автоматически, вам не нужно перегенерировать карту сайта после каждой добавленной страницы.
1C-Битрикс: встроенная функция
Настройка sitemap.xml доступна в разделе «Маркетинг» административной панели вашего сайта:
Добавьте файл, назовите его и установите флажок, чтобы добавить ссылку на robots.txt:
На вкладке «Файлы» выберите части, которые вы хотите предоставить для индексации поисковым роботом:
То же самое проделайте во вкладке «Блокировщик информации».
Сохраните все изменения и нажмите кнопку «Выполнить»:
После создания карты сайта вы увидите сообщение о том, что генерация завершена:
WordPress: используйте плагины
XML-карту сайта можно настроить в двух популярных SEO-плагинах: All in One SEO Pack и Yoast SEO. Также есть отдельный плагин для создания XML-карты — Google XML Sitemaps.
Сначала нужно установить плагин. Делается это в разделе «Плагины» консоли сайта. После установки он будет доступен для настройки. Нам понадобится раздел «Управление модулями»:
В нем активируем модуль, отвечающий за карту XML:
После активации модуль становится доступным для редактирования:
Затем вы можете оставить настройки по умолчанию или ввести свои собственные. Полная документация по модулю здесь. Он на английском языке, но даже встроенный переводчик Chrome поможет вам разобраться.
В Yoast SEO карта сайта создается автоматически по адресу site.com/sitemap_index.xml. Модуль также доступен для редактирования или вы можете оставить настройки по умолчанию.
Модули для других популярных CMS
- Joomla: используйте плагины OSMap (бесплатная версия Free и платная Pro), jSitemap (платное расширение, фактически целый набор SEO-инструментов).
- Drupal: Модуль XML Sitemap.
- Magento: настроить конфигурацию карты сайта.
Выберите правильный способ создания XML-карты сайта и сообщите краулерам, какие страницы посещать — это даст вам уверенность в том, что краулер вовремя проиндексирует все нужные страницы.