LLM-wiki против RAG: в чём разница и что выбрать

Когда компания хочет «подключить ИИ к своим документам», ей почти всегда предлагают RAG. Это рабочий подход, но не единственный. Разберём разницу без математики.

RAG: поиск по коробкам

RAG (retrieval-augmented generation) работает так: все документы нарезаются на куски и складываются в поисковый индекс. Когда вы задаёте вопрос, система находит куски, похожие на вопрос, и передаёт их нейросети вместе с вопросом. ИИ отвечает на основе найденного.

Аналогия: у вас склад коробок с бумагами. На каждый вопрос кладовщик очень быстро приносит десяток листов, которые показались ему подходящими. Иногда это именно то, что нужно. Иногда — три версии одного прайса за разные годы, и ИИ не знает, какая актуальная.

Главная особенность RAG: знания заново собираются на каждый вопрос. Система не помнит, что она находила вчера, и не делает выводов заранее.

LLM-wiki: библиотека с наведённым порядком

LLM-wiki работает иначе: знания уже прочитаны, осмыслены и разложены. Когда добавляется новый документ, ИИ встраивает его содержимое в существующие страницы: обновляет карточку клиента, дописывает историю решения, помечает устаревшее.

Аналогия: не склад с кладовщиком, а библиотека с каталогом и конспектами. На вопрос отвечают не «вот десять листов, разбирайтесь», а «вот страница, где это уже собрано и сверено, вот ссылки на оригиналы».

Wiki — накапливающийся артефакт: каждый новый документ делает базу лучше, а противоречия разрешаются один раз, а не при каждом вопросе.

Честное сравнение

	RAG	LLM-wiki
Подготовка	быстрая: проиндексировать и всё	требует настройки правил и первичного разбора
Объёмы	миллионы документов	сотни и тысячи страниц
Противоречия в данных	всплывают в каждом ответе	разрешаются при добавлении
Свежесть	индекс нужно обновлять	wiki нужно вести
Прозрачность	куски текста без общей картины	страницы со ссылками на источники
Накопление знаний	нет: каждый вопрос с нуля	да: база становится умнее

Когда что выбирать

RAG подходит, когда документов очень много, они однородные и меняются редко: архив тикетов поддержки, база нормативки, миллион страниц документации.

LLM-wiki подходит, когда знаний обозримое количество, но они живые и важна их достоверность: память компании, база решений, знания команды, личная база исследователя.

Куда дальше

Следующий урок: AGENTS.md — инструкция для ИИ.
Термины: RAG, embeddings, vector database.
Практика: быстрый старт — соберите wiki-ядро за вечер.