Первоисточники: от Memex до гиста Карпаты и стандарта OKF
Этот сайт не придумал идею LLM-wiki — он объясняет её на русском языке. Здесь собраны оригиналы, с которых всё началось. Мы честно ссылаемся на авторов, а наши тексты — пересказ, не перевод.
Откуда растёт идея: Memex, 1945
Оригинал: The Atlantic — «As We May Think», Vannevar Bush, июль 1945
Идее, которая стоит за LLM-wiki, восемьдесят лет. В июле 1945 года американский инженер Вэнивар Буш — руководитель научных программ США военного времени — опубликовал эссе «As We May Think» («Как мы можем мыслить»). В нём он описал memex: гипотетический рабочий стол, в котором человек хранит все свои книги, записи и переписку.
Главная мысль Буша в пересказе:
Информацию можно связывать не только по папкам и алфавиту, а по смыслу — «тропами» ассоциативных связей, как мыслит человек.
Каталоги и алфавитные указатели противоречат тому, как работает мышление: одна мысль тянет за собой другую.
Memex не был построен, но из этой идеи выросли гипертекст, Всемирная паутина и wiki. Не хватало одного: связи между знаниями приходилось создавать и поддерживать вручную, а на это не хватает ни времени, ни дисциплины. Спустя восемьдесят лет эту часть закрыли нейросети — появился «библиотекарь», который сам читает документы, связывает знания по смыслу и поддерживает порядок. Так идея машины памяти стала практикой.
Гист Андрея Карпаты «LLM Wiki»
Оригинал: gist.github.com/karpathy — llm-wiki.md
Андрей Карпаты — один из самых известных исследователей ИИ (OpenAI, Tesla). В коротком документе он описал паттерн работы с знаниями, который назвал LLM Wiki. Суть в пересказе:
Вместо того чтобы на каждый вопрос заново искать ответ по документам (как делает RAG), нейросеть ведёт wiki — накапливающийся артефакт. Когда добавляется новый источник, ИИ не просто индексирует его: он читает документ, извлекает главное и встраивает в существующую wiki — обновляет страницы, поддерживает перекрёстные ссылки.
Ключевые элементы паттерна:
- Три слоя: неизменяемые исходники (raw sources) → wiki-слой из markdown-страниц, которым ИИ владеет полностью → схема-документ (например, CLAUDE.md или AGENTS.md), который делает ИИ «дисциплинированным хранителем wiki».
- Служебные файлы:
index.md— каталог содержимого по категориям;log.md— хронологический журнал добавлений и проверок. - Три процесса: ingest (добавить источник и встроить знания), query (спросить и получить ответ со ссылками), lint (регулярная проверка на противоречия, устаревшие утверждения и страницы-сироты).
Карпаты подчёркивает: описание намеренно абстрактное. Конкретная реализация зависит от области, предпочтений и выбранной нейросети — все элементы опциональны и модульны.
Open Knowledge Format (OKF) от Google Cloud
Оригинал: блог Google Cloud — How the Open Knowledge Format can improve data sharing · Репозиторий: GoogleCloudPlatform/knowledge-catalog
В июне 2026 года команда Google Cloud (авторы — технические лиды Sam McVeety и Amir Hormati) опубликовала Open Knowledge Format v0.1 — открытую спецификацию, которая формализует паттерн llm-wiki в переносимый, независимый от вендора стандарт. Google прямо ссылается на гист Карпаты как на источник вдохновения.
Суть OKF в пересказе:
- знания оформляются как директории markdown-файлов — «концепты»: таблицы, метрики, инструкции, API;
- каждый файл — это YAML frontmatter + markdown-текст: обязательное поле только
type, остальное на усмотрение автора; - три принципа: минимум навязанных правил; независимость производителя знаний от потребителя (формат — это контракт); формат, а не платформа — никаких обязательных аккаунтов и SDK.
Почему это важно
Когда идею энтузиаста формализует Google — это сигнал, что паттерн становится индустриальным направлением, а не увлечением «людей из AI-твиттера». Порядок в знаниях, markdown-структуры и правила для ИИ — это то, во что индустрия вкладывается всерьёз.
Куда дальше
- Что такое LLM-wiki простыми словами — наше объяснение паттерна.
- Архитектура LLM-wiki — разбор слоёв подробно.
- LLM-wiki против RAG — ключевое сравнение.
- Memex и OKF в словаре.