LLM-wiki против RAG: в чём разница и что выбрать
Когда компания хочет «подключить ИИ к своим документам», ей почти всегда предлагают RAG. Это рабочий подход, но не единственный. Разберём разницу без математики.
RAG: поиск по коробкам
RAG (retrieval-augmented generation) работает так: все документы нарезаются на куски и складываются в поисковый индекс. Когда вы задаёте вопрос, система находит куски, похожие на вопрос, и передаёт их нейросети вместе с вопросом. ИИ отвечает на основе найденного.
Аналогия: у вас склад коробок с бумагами. На каждый вопрос кладовщик очень быстро приносит десяток листов, которые показались ему подходящими. Иногда это именно то, что нужно. Иногда — три версии одного прайса за разные годы, и ИИ не знает, какая актуальная.
Главная особенность RAG: знания заново собираются на каждый вопрос. Система не помнит, что она находила вчера, и не делает выводов заранее.
LLM-wiki: библиотека с наведённым порядком
LLM-wiki работает иначе: знания уже прочитаны, осмыслены и разложены. Когда добавляется новый документ, ИИ встраивает его содержимое в существующие страницы: обновляет карточку клиента, дописывает историю решения, помечает устаревшее.
Аналогия: не склад с кладовщиком, а библиотека с каталогом и конспектами. На вопрос отвечают не «вот десять листов, разбирайтесь», а «вот страница, где это уже собрано и сверено, вот ссылки на оригиналы».
Wiki — накапливающийся артефакт: каждый новый документ делает базу лучше, а противоречия разрешаются один раз, а не при каждом вопросе.
Честное сравнение
| RAG | LLM-wiki | |
|---|---|---|
| Подготовка | быстрая: проиндексировать и всё | требует настройки правил и первичного разбора |
| Объёмы | миллионы документов | сотни и тысячи страниц |
| Противоречия в данных | всплывают в каждом ответе | разрешаются при добавлении |
| Свежесть | индекс нужно обновлять | wiki нужно вести |
| Прозрачность | куски текста без общей картины | страницы со ссылками на источники |
| Накопление знаний | нет: каждый вопрос с нуля | да: база становится умнее |
Когда что выбирать
RAG подходит, когда документов очень много, они однородные и меняются редко: архив тикетов поддержки, база нормативки, миллион страниц документации.
LLM-wiki подходит, когда знаний обозримое количество, но они живые и важна их достоверность: память компании, база решений, знания команды, личная база исследователя.
Куда дальше
- Следующий урок: AGENTS.md — инструкция для ИИ.
- Термины: RAG, embeddings, vector database.
- Практика: быстрый старт — соберите wiki-ядро за вечер.