Первоисточники: от Memex до гиста Карпаты и стандарта OKF

Этот сайт не придумал идею LLM-wiki — он объясняет её на русском языке. Здесь собраны оригиналы, с которых всё началось. Мы честно ссылаемся на авторов, а наши тексты — пересказ, не перевод.

Откуда растёт идея: Memex, 1945

Оригинал: The Atlantic — «As We May Think», Vannevar Bush, июль 1945

Идее, которая стоит за LLM-wiki, восемьдесят лет. В июле 1945 года американский инженер Вэнивар Буш — руководитель научных программ США военного времени — опубликовал эссе «As We May Think» («Как мы можем мыслить»). В нём он описал memex: гипотетический рабочий стол, в котором человек хранит все свои книги, записи и переписку.

Главная мысль Буша в пересказе:

Информацию можно связывать не только по папкам и алфавиту, а по смыслу — «тропами» ассоциативных связей, как мыслит человек.

Каталоги и алфавитные указатели противоречат тому, как работает мышление: одна мысль тянет за собой другую.

Memex не был построен, но из этой идеи выросли гипертекст, Всемирная паутина и wiki. Не хватало одного: связи между знаниями приходилось создавать и поддерживать вручную, а на это не хватает ни времени, ни дисциплины. Спустя восемьдесят лет эту часть закрыли нейросети — появился «библиотекарь», который сам читает документы, связывает знания по смыслу и поддерживает порядок. Так идея машины памяти стала практикой.

Гист Андрея Карпаты «LLM Wiki»

Оригинал: gist.github.com/karpathy — llm-wiki.md

Андрей Карпаты — один из самых известных исследователей ИИ (OpenAI, Tesla). В коротком документе он описал паттерн работы с знаниями, который назвал LLM Wiki. Суть в пересказе:

Вместо того чтобы на каждый вопрос заново искать ответ по документам (как делает RAG), нейросеть ведёт wiki — накапливающийся артефакт. Когда добавляется новый источник, ИИ не просто индексирует его: он читает документ, извлекает главное и встраивает в существующую wiki — обновляет страницы, поддерживает перекрёстные ссылки.

Ключевые элементы паттерна:

Три слоя: неизменяемые исходники (raw sources) → wiki-слой из markdown-страниц, которым ИИ владеет полностью → схема-документ (например, CLAUDE.md или AGENTS.md), который делает ИИ «дисциплинированным хранителем wiki».
Служебные файлы: index.md — каталог содержимого по категориям; log.md — хронологический журнал добавлений и проверок.
Три процесса: ingest (добавить источник и встроить знания), query (спросить и получить ответ со ссылками), lint (регулярная проверка на противоречия, устаревшие утверждения и страницы-сироты).

Карпаты подчёркивает: описание намеренно абстрактное. Конкретная реализация зависит от области, предпочтений и выбранной нейросети — все элементы опциональны и модульны.

Open Knowledge Format (OKF) от Google Cloud

Оригинал: блог Google Cloud — How the Open Knowledge Format can improve data sharing · Репозиторий: GoogleCloudPlatform/knowledge-catalog

В июне 2026 года команда Google Cloud (авторы — технические лиды Sam McVeety и Amir Hormati) опубликовала Open Knowledge Format v0.1 — открытую спецификацию, которая формализует паттерн llm-wiki в переносимый, независимый от вендора стандарт. Google прямо ссылается на гист Карпаты как на источник вдохновения.

Суть OKF в пересказе:

знания оформляются как директории markdown-файлов — «концепты»: таблицы, метрики, инструкции, API;
каждый файл — это YAML frontmatter + markdown-текст: обязательное поле только type, остальное на усмотрение автора;
три принципа: минимум навязанных правил; независимость производителя знаний от потребителя (формат — это контракт); формат, а не платформа — никаких обязательных аккаунтов и SDK.

Почему это важно

Когда идею энтузиаста формализует Google — это сигнал, что паттерн становится индустриальным направлением, а не увлечением «людей из AI-твиттера». Порядок в знаниях, markdown-структуры и правила для ИИ — это то, во что индустрия вкладывается всерьёз.

Куда дальше

Что такое LLM-wiki простыми словами — наше объяснение паттерна.
Архитектура LLM-wiki — разбор слоёв подробно.
LLM-wiki против RAG — ключевое сравнение.
Memex и OKF в словаре.