LLM-wiki против RAG: в чём разница и что выбрать

Когда компания хочет «подключить ИИ к своим документам», ей почти всегда предлагают RAG. Это рабочий подход, но не единственный. Разберём разницу без математики.

RAG: поиск по коробкам

RAG (retrieval-augmented generation) работает так: все документы нарезаются на куски и складываются в поисковый индекс. Когда вы задаёте вопрос, система находит куски, похожие на вопрос, и передаёт их нейросети вместе с вопросом. ИИ отвечает на основе найденного.

Аналогия: у вас склад коробок с бумагами. На каждый вопрос кладовщик очень быстро приносит десяток листов, которые показались ему подходящими. Иногда это именно то, что нужно. Иногда — три версии одного прайса за разные годы, и ИИ не знает, какая актуальная.

Главная особенность RAG: знания заново собираются на каждый вопрос. Система не помнит, что она находила вчера, и не делает выводов заранее.

LLM-wiki: библиотека с наведённым порядком

LLM-wiki работает иначе: знания уже прочитаны, осмыслены и разложены. Когда добавляется новый документ, ИИ встраивает его содержимое в существующие страницы: обновляет карточку клиента, дописывает историю решения, помечает устаревшее.

Аналогия: не склад с кладовщиком, а библиотека с каталогом и конспектами. На вопрос отвечают не «вот десять листов, разбирайтесь», а «вот страница, где это уже собрано и сверено, вот ссылки на оригиналы».

Wiki — накапливающийся артефакт: каждый новый документ делает базу лучше, а противоречия разрешаются один раз, а не при каждом вопросе.

Честное сравнение

RAG LLM-wiki
Подготовка быстрая: проиндексировать и всё требует настройки правил и первичного разбора
Объёмы миллионы документов сотни и тысячи страниц
Противоречия в данных всплывают в каждом ответе разрешаются при добавлении
Свежесть индекс нужно обновлять wiki нужно вести
Прозрачность куски текста без общей картины страницы со ссылками на источники
Накопление знаний нет: каждый вопрос с нуля да: база становится умнее

Когда что выбирать

RAG подходит, когда документов очень много, они однородные и меняются редко: архив тикетов поддержки, база нормативки, миллион страниц документации.

LLM-wiki подходит, когда знаний обозримое количество, но они живые и важна их достоверность: память компании, база решений, знания команды, личная база исследователя.

Куда дальше