Sitemap с lastmod для AI: как сделать правильно
Зачем AI-краулерам sitemap с датами lastmod, минимальный рабочий пример, правильно vs неправильно, типичные ошибки и как проверить.
Обновлено:
Что это
Sitemap — XML-файл (обычно /sitemap.xml), который перечисляет URL вашего сайта.
Ключевой для AI-эпохи элемент — тег <lastmod> с датой последнего изменения
страницы. Он сообщает краулерам, какие страницы свежие и достойны переобхода.
Зачем это AI-агентам
AI-движки (Perplexity, ChatGPT Search, YandexGPT) тянут в ответы свежий
контент. <lastmod> — прямой сигнал свежести: без него краулер гадает, когда
переобходить страницу, и часто отдаёт в ответах устаревшую версию. Корректный
lastmod ускоряет попадание обновлений в AI-выдачу. Плюс sitemap — это карта,
по которой агент находит страницы, не связанные ссылками с главной.
Минимальный рабочий пример
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://example.com/</loc>
<lastmod>2026-06-07</lastmod>
</url>
<url>
<loc>https://example.com/guides/llms-txt</loc>
<lastmod>2026-06-05</lastmod>
</url>
</urlset>
И обязательно сослаться на sitemap из robots.txt:
Sitemap: https://example.com/sitemap.xml
Правильно vs неправильно
| Правильно | Неправильно |
|---|---|
<lastmod> на каждом URL, дата в формате W3C (2026-06-07) | lastmod отсутствует — краулер не видит свежести |
Абсолютные URL в <loc> | Относительные пути (/page) — невалидно |
Ссылка Sitemap: в robots.txt | Sitemap есть, но нигде не указан |
lastmod отражает реальную дату правки | Везде «сегодня» — краулер перестаёт доверять |
Типичные ошибки
- Фейковый
lastmod(ставят текущую дату всем страницам) — краулеры распознают это и начинают игнорировать сигнал. - Sitemap не указан в
robots.txt— снижает шанс обнаружения. - Больше 50 000 URL или >50 МБ в одном файле — нужен sitemap-index.
- Относительные URL в
<loc>— спецификация требует абсолютные. - 404 или неверный
Content-Typeна самом файле sitemap.
Как проверить
Бесплатный скан проверит наличие sitemap, корректность lastmod и ссылку из
robots.txt. Вручную:
curl -sI https://example.com/sitemap.xml # 200 + application/xml
curl -s https://example.com/sitemap.xml | head -20
Также сабмитните sitemap в Google Search Console и Яндекс.Вебмастер — там видно статус индексации по нему.