llms.txt: что это и как настроить

Чем отличается от robots.txt, нужен ли вашему сайту, как составить и проверить.

llms.txt - это текстовый файл в корне сайта по адресу домен/llms.txt. Он дает нейросетям короткую карту самого важного контента в формате Markdown: без меню, баннеров и скриптов, которые мешают модели быстро прочитать страницу. Формат предложил Джереми Ховард в 2024 году. На позиции в Google и Яндексе файл не влияет, и обязательным его не назвать: на середину 2026 ни одна крупная нейросеть официально не подтвердила, что читает llms.txt с внешних сайтов. Ниже - что это за файл, чем он отличается от robots.txt, кому он нужен и как его собрать.

Что такое llms.txt простыми словами

llms.txt - один файл в корне домена, который собирает ссылки на ключевые страницы сайта с короткими описаниями. Нейросеть открывает его и сразу видит, где у вас главное: услуги, документация, важные статьи, контакты. Без такого файла модель разбирает обычную HTML-страницу со всем оформлением и тратит на это больше ресурса.

Файл лежит по фиксированному адресу - домен/llms.txt, как robots.txt. Внутри заголовок с названием сайта, короткое описание в одну-две строки и разделы со списком ссылок. Это чистый Markdown, без кода и стилей. Первую версию собирают за 20-30 минут.

Идея пришла из мира документации. Нейросети-помощнику, которая пишет код, удобнее получить выжимку из документации одним файлом, чем выкачивать десятки HTML-страниц. Оттуда формат пошел дальше, на корпоративные сайты и блоги. Это часть технической оптимизации под нейросети, направления, которое называют GEO. О самом подходе - в статье что такое GEO.

Чем llms.txt отличается от robots.txt и sitemap.xml

Три файла в корне сайта решают разные задачи:

  • robots.txt - доступ. Указывает, каким роботам разрешен обход сайта, а каким закрыт. Стандарт с 1994 года
  • sitemap.xml - обнаружение. Перечисляет все адреса, чтобы поисковик нашел каждую страницу. Появился в 2005 году
  • llms.txt - подсказка для нейросети. Короткий список самого важного контента, чтобы модель быстро поняла суть сайта. Предложен в 2024 году

Здесь частая ошибка: llms.txt путают с robots.txt и считают, что он закрывает контент от нейросетей. Это не так. Файл llms.txt ничего не блокирует и не открывает, управление доступом остается за robots.txt. llms.txt только направляет: вот главные страницы, начните с них.

Нужен ли llms.txt вашему сайту: когда да, когда нет

Для большинства сайтов llms.txt сейчас не первый приоритет. Крупные нейропоисковые системы не заявляют, что опираются на файл, а независимые исследования не нашли связи между его наличием и попаданием сайта в ответы. Польза есть в узких случаях, а вреда от файла почти нет, поэтому решение зависит от типа сайта и свободных рук в команде.

Когда llms.txt помогает:

  • Сайт документации, база знаний, описание API. Нейросети-помощники для кода (Cursor, GitHub Copilot, Claude) подтягивают документацию во время работы, и llms.txt экономит им токены при поиске нужных страниц
  • AI-агенты и ассистенты дают заметную долю трафика. Если пользователи приходят через таких помощников, файл упрощает им навигацию по сайту
  • Есть желание занять место раннего игрока. По времени формат дешевый, а часть веб-стандартов сначала набирает массу на стороне сайтов и только потом получает поддержку площадок

Когда можно отложить:

  • Команда занята более важными задачами по видимости в нейросетях. Сначала имеет смысл открыть доступ роботам в robots.txt, сделать разметку Schema.org и привести контент к формату прямого ответа - подход, который называют что такое AEO. llms.txt здесь оставляют на потом
  • llms.txt воспринимают как замену этой работы. Цитат сам по себе файл не приносит. Их дает контент с прямым ответом и корректная разметка Schema.org, плюс присутствие на площадках, которые нейросети уже цитируют, например VC.ru и Хабр. Что из этого добавить на сайт в первую очередь, разобрано в гайде как попасть в ответы ChatGPT

Перед llms.txt проверьте главное. Самая частая техническая ошибка - закрытый доступ роботам нейросетей в robots.txt. Если GPTBot, OAI-SearchBot, ClaudeBot, Google-Extended или PerplexityBot стоят под запретом, сайт невидим для соответствующей платформы, и никакой llms.txt это не исправит. Проверка robots.txt идет первой, llms.txt - намного позже.

Как составить llms.txt: структура и пример

Структура простая: название сайта, короткое описание, затем разделы со ссылками на главные страницы. Каждая ссылка - в формате Markdown с коротким пояснением. Файл собирают в обычном текстовом редакторе, не в Word.

Минимальный набор по спецификации с llmstxt.org:

  • H1 с названием сайта или компании
  • Короткое описание сайта в одну-две строки, оформленное как цитата Markdown
  • Один или несколько разделов с заголовком H2 и списком ссылок вида [Название страницы](адрес) с коротким описанием
  • Необязательный раздел Optional - ссылки, которые модель опускает, когда нужен компактный контекст

Пример - фрагмент рабочего файла с hitz.agency:

# HITZ Agency

> Первое GEO-агентство в Центральной Азии. HITZ помогает брендам в Казахстане и Узбекистане появляться в ответах ChatGPT, Алисы, Gemini, Perplexity и Claude.

## Главная страница
- [HITZ Agency - GEO-агентство](https://hitz.agency/): услуги, тарифы, кейсы, этапы работы

## Блог
- [Что такое GEO в 2026](https://hitz.agency/blog/chto-takoe-geo-2026): pillar-материал кластера GEO
- [Что такое AEO](https://hitz.agency/blog/chto-takoe-aeo): форматы контента и микроразметка

## Контакты
- Email: [email protected]
- Telegram: https://t.me/hitzmedia

Полный файл доступен по адресу https://hitz.agency/llms.txt.

После сборки держите в голове несколько правил:

  • Ссылки ведут на обычные HTML-страницы сайта. Не нужно плодить отдельные Markdown-копии каждой страницы: если они попадут в индекс, появятся дубли, а дубли размывают бюджет обхода и мешают исходным страницам ранжироваться
  • В файл берут 20-50 самых важных страниц, а не полную копию sitemap.xml
  • Описания держат короткими и по делу: что на странице и кому она полезна
  • Для сайтов с большим объемом документации есть расширенный вариант llms-full.txt - в него складывают полный текст ключевых страниц одним файлом
  • llms.txt не делается один раз навсегда. Вышла важная страница - добавьте ее в файл с описанием

Куда положить файл и как проверить

Файл кладут в корень домена: site.com/llms.txt. Расширенную версию туда же, site.com/llms-full.txt. После загрузки откройте адрес в режиме инкогнито - должен открыться чистый текст в формате Markdown, без оформления страницы, с кодом ответа 200.

Куда загружать, зависит от движка:

  • WordPress. Файл генерируют плагины Yoast SEO, Rank Math или All in One SEO: в настройках включают модуль llms.txt и выбирают страницы. Если включить такой модуль сразу в двух плагинах, они конфликтуют - оставьте один
  • Mintlify. Платформа документации собирает llms.txt автоматически для всех сайтов на ней
  • Конструктор или самописный сайт. Файл создают вручную в текстовом редакторе и загружают в корень

Что проверить после загрузки:

  • Адрес домен/llms.txt открывается и отдает Markdown, без HTML-обертки
  • Ссылки внутри файла рабочие и ведут на нужные страницы
  • В логах сервера видно, заходят ли AI-боты на файл. Пока такие визиты редки даже у крупных краулеров, так что их отсутствие не повод для тревоги

Какие платформы поддерживают llms.txt: текущий статус

На середину 2026 года крупные нейросети официально не признают, что обращаются к llms.txt сторонних сайтов при ответе. Файл публикуют у себя, но читают ли его роботы в момент ответа - открытый вопрос.

По площадкам:

  • Google. По официальному руководству Google для оптимизации под AI, обновленному в мае 2026 года, llms.txt не нужен для AI Overviews, AI Mode и других генеративных функций поиска. Джон Мюллер еще в 2025 году сравнил файл с устаревшим мета-тегом keywords, а Гэри Иллиес подтвердил, что Google не поддерживает llms.txt и не планирует. Свой llms.txt у документации Google появился в декабре 2025 года, но это автогенерация движка, не признание формата
  • OpenAI. Для цитат в ChatGPT официальной поддержки нет: GPTBot управляется через robots.txt, а в документации краулера llms.txt не упоминается. При этом OpenAI использует llms.txt в Agents SDK и протоколе Agentic Commerce - в инструментах для агентов и разработчиков
  • Anthropic. Компания публикует llms.txt и llms-full.txt для своей документации и советует файл в руководстве по работе с агентами, но не подтверждает, что Claude читает такие файлы с чужих сайтов при ответе
  • Perplexity. Публикует свой llms-full.txt, обязательств читать внешние файлы не давала
  • Яндекс и Алиса. Об использовании llms.txt при обходе или ранжировании официальных заявлений не было. В одном эксперименте осенью 2024 года отмечали трафик с Алисы после добавления файла, но это единичный сигнал. Часть специалистов добавляет llms.txt заранее, считая потенциальную пользу выше риска

Что говорят данные. Сервис Limy проанализировал около полумиллиарда обращений AI-краулеров: доля запросов к llms.txt у ботов, которые приносят цитаты, ничтожна. SE Ranking проверил почти 300 000 доменов и не нашел связи между наличием файла и упоминанием сайта в ответах нейросетей. К близкому выводу пришло контролируемое исследование Semrush.

Где формат работает уже сейчас. Польза подтверждена в инструментах для разработчиков и агентов. Нейросети-помощники для кода обращаются к документации в момент запроса, и с llms.txt они быстрее находят нужные страницы. В мае 2026 года аудит Lighthouse 13.3 в Chrome добавил категорию Agentic Browsing, которая проверяет наличие этого файла у сайта. Если веб-стандарт повторит привычный путь, сначала массовое внедрение на сайтах и затем официальная поддержка площадок, значение llms.txt вырастет. Пока его держат как дешевую подстройку под будущее, а не как фактор сегодняшней видимости.

Коротко

  • llms.txt - файл-подсказка в корне сайта со списком важных страниц для нейросетей
  • На позиции в поиске не влияет. На середину 2026 крупные нейросети официально не подтверждают, что читают его с внешних сайтов
  • Подтвержденная польза - документация, описания API и сайты, куда приходит трафик от AI-агентов и помощников для кода
  • Сначала robots.txt с доступом для AI-роботов, разметка Schema.org и структура контента. llms.txt - после этого
  • Делается за 20-30 минут, ссылки ведут на обычные страницы, отдельные Markdown-дубли не создают

Об авторе

Автор материала - Марат Аксанов, сооснователь GEO-агентства HITZ и автор блога. Ведет проекты по продвижению брендов в ответах нейросетей с 2024 года.

Об агентстве

HITZ - первое GEO-агентство в Центральной Азии. Помогаем брендам в Казахстане и Узбекистане появляться в ответах ChatGPT, Алисы, Gemini, Perplexity и Claude. Услуги: GEO, AEO, AI SEO, SEO, ASO, SERM, Local SEO. Нужна техническая база под ответы нейросетей или проверка доступа ботов к сайту - напишите: [email protected].

FAQ

Влияет ли llms.txt на позиции в Google или Яндексе?

Нет, llms.txt не фактор ранжирования. Google официально заявил, что не использует его в поиске и AI-функциях, Яндекс интеграцию не анонсировал. Файл работает на уровне подсказки нейросети, а не на уровне поисковых позиций.

Это то же самое, что robots.txt?

Нет. robots.txt управляет доступом роботов к сайту. llms.txt доступом не управляет и ничего не закрывает, он показывает нейросети список главных страниц. Это два файла с разными задачами.

Нужен ли llms.txt небольшому сайту?

Чаще нет. Сначала имеет смысл закрыть базу: открытый доступ AI-роботам в robots.txt, разметка Schema.org, структура контента под прямой ответ. llms.txt идет следующим шагом, когда основное сделано.

Может ли llms.txt навредить сайту?

Сам файл, если ссылки внутри указывают на обычные страницы сайта, не вредит. Проблема появляется, когда вместо этого создают отдельные индексируемые Markdown-копии всех страниц - тогда возникают дубли и страдает обычная выдача.

Как проверить, что llms.txt работает?

Откройте адрес домен/llms.txt в инкогнито: должен открыться чистый Markdown с кодом 200, без HTML-обертки. Дальше можно посмотреть в логах сервера обращения AI-ботов к файлу, хотя такие визиты пока редки.

Кому llms.txt нужен в первую очередь?

Сайтам документации, описаниям API и проектам с заметным трафиком от AI-агентов и нейросетей-помощников для кода. Для них файл дает понятную пользу. Остальным - по желанию и без спешки.

обсудить проект
+7 706 624 20 40