Discoverability Легко

Sitemap с lastmod для AI: как сделать правильно

Зачем AI-краулерам sitemap с датами lastmod, минимальный рабочий пример, правильно vs неправильно, типичные ошибки и как проверить.

Обновлено:

Что это

Sitemap — XML-файл (обычно /sitemap.xml), который перечисляет URL вашего сайта. Ключевой для AI-эпохи элемент — тег <lastmod> с датой последнего изменения страницы. Он сообщает краулерам, какие страницы свежие и достойны переобхода.

Зачем это AI-агентам

AI-движки (Perplexity, ChatGPT Search, YandexGPT) тянут в ответы свежий контент. <lastmod> — прямой сигнал свежести: без него краулер гадает, когда переобходить страницу, и часто отдаёт в ответах устаревшую версию. Корректный lastmod ускоряет попадание обновлений в AI-выдачу. Плюс sitemap — это карта, по которой агент находит страницы, не связанные ссылками с главной.

Минимальный рабочий пример

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://example.com/</loc>
    <lastmod>2026-06-07</lastmod>
  </url>
  <url>
    <loc>https://example.com/guides/llms-txt</loc>
    <lastmod>2026-06-05</lastmod>
  </url>
</urlset>

И обязательно сослаться на sitemap из robots.txt:

Sitemap: https://example.com/sitemap.xml

Правильно vs неправильно

ПравильноНеправильно
<lastmod> на каждом URL, дата в формате W3C (2026-06-07)lastmod отсутствует — краулер не видит свежести
Абсолютные URL в <loc>Относительные пути (/page) — невалидно
Ссылка Sitemap: в robots.txtSitemap есть, но нигде не указан
lastmod отражает реальную дату правкиВезде «сегодня» — краулер перестаёт доверять

Типичные ошибки

  • Фейковый lastmod (ставят текущую дату всем страницам) — краулеры распознают это и начинают игнорировать сигнал.
  • Sitemap не указан в robots.txt — снижает шанс обнаружения.
  • Больше 50 000 URL или >50 МБ в одном файле — нужен sitemap-index.
  • Относительные URL в <loc> — спецификация требует абсолютные.
  • 404 или неверный Content-Type на самом файле sitemap.

Как проверить

Бесплатный скан проверит наличие sitemap, корректность lastmod и ссылку из robots.txt. Вручную:

curl -sI https://example.com/sitemap.xml   # 200 + application/xml
curl -s  https://example.com/sitemap.xml | head -20

Также сабмитните sitemap в Google Search Console и Яндекс.Вебмастер — там видно статус индексации по нему.

Источники