Что такое ИИ?

Схема системы

Рабочий контур

ИИ - это комплексная система, у которой есть вычислительное ядро: как правило, LLM, диффузионные модели или другие специализированные модели. Вокруг ядра собираются инструменты, память, агентная логика, интерфейсы и инфраструктурные обвязки, которые помогают системе решать реальные задачи.

Практически полезный ИИ появляется только тогда, когда модель встроена в рабочий контур: человек формулирует цель, система держит контекст и ограничения, агент координирует шаги, модель рассуждает, память сохраняет состояние, инструменты дают доступ к реальному миру, а вся архитектура остаётся наблюдаемой, управляемой и безопасной.

Инженерное определение

Искусственный интеллект

Искусственный интеллект в реальном продукте - это не один чат и не одна модель, а комплексная инженерная система из нескольких слоёв.

В её ядре находятся модели ИИ, а в современных продуктах этим ядром чаще всего выступают большие языковые модели, вокруг которых уже строятся интерфейс, оркестрация, память, инструменты, контроль и инфраструктура.

Что это

Это инженерная оболочка вокруг модели: интерфейсы, backend-логика, очереди, политика выполнения, хранение состояния, контроль доступа, мониторинг и отказоустойчивость.

Зачем нужно

Без этого слоя модель не становится надёжным сервисом. Нельзя контролировать качество, стоимость, безопасность, воспроизводимость и интеграцию с рабочими процессами.

Роль в общей системе

Система ИИ объединяет интерфейс, маршрутизацию, политику доступа, журналирование, наблюдаемость и все технические правила, без которых модель остаётся лишь вычислительным компонентом.

Какие задачи выполняет

  • принимает запрос из интерфейса или API и направляет его в нужный сценарий
  • собирает контекст, политики, настройки пользователя и рабочее состояние
  • обеспечивает безопасность, логирование, лимиты и наблюдаемость
  • связывает агента, модель, память, инструменты и внешние сервисы в один контур
Источник цели и ответственности

Человек

Система ИИ всегда начинается не с модели, а с человека.

Модель может предложить цель, юридическую рамку и критерий полезности, но ответственность за выбор, проверку и применение результата остаётся у человека.

Что это

Это инициатор и владелец смысла. Человек приносит в систему реальную потребность: что именно нужно сделать, для кого, в какие сроки и с какими ограничениями.

Зачем нужно

Даже если модель помогает подобрать цель, рамку и критерии качества, она не становится ответственным субъектом. Ответственность за решение, риск и последствия должен нести человек.

Роль в общей системе

Человек задаёт смысл всей системе и несёт ответственность за её применение: он принимает итоговое решение, выбирает допустимый вариант действия и отвечает за последствия.

Какие задачи выполняет

  • формулирует задачу, ожидаемый результат и ограничения
  • передаёт контекст: документы, примеры, терминологию, бизнес-рамку
  • оценивает итог, принимает решение и несёт ответственность за последствия
  • уточняет курс системы, если цель изменилась или ответ оказался неполным
Входной слой

Запрос

Хороший запрос - это не декоративный промпт, а инженерный контракт между человеком и системой.

Через него система понимает, что делать, над чем думать и где проходит граница допустимого.

Что это

Это оформленная постановка задачи: сообщение, форма, API-вызов, голосовая команда или цепочка параметров, с которой уже может работать система.

Зачем нужно

Если вход расплывчатый, модель и агент начинают тратить вычисление на угадывание намерения. Чем точнее запрос, тем устойчивее весь последующий контур.

Роль в общей системе

Запрос превращает человеческое намерение в формализованный вход для системы: в текст, структуру данных, набор параметров, приложенные файлы и уточняющие условия.

Какие задачи выполняет

  • фиксирует цель, ограничения, формат ответа и дополнительные материалы
  • снижает неоднозначность и убирает лишние трактовки
  • передаёт агенту структурированный контекст для исполнения
  • служит точкой повторяемости и аудита при разборе результата
Контур управления

Агент

Если модель - это вычислительное ядро, то агент - это операционный мозг выполнения.

Он превращает один вопрос в последовательность осмысленных действий, а не просто в одиночный ответ.

Что это

Это управляющий слой поверх модели. В зависимости от архитектуры он может быть реализован как оркестратор, planner, runtime цикла reasoning-action или набор правил исполнения.

Зачем нужно

Сама по себе модель чаще всего даёт один проход ответа. Для реальной работы нужен слой, который умеет планировать, переспрашивать, проверять и действовать по шагам.

Роль в общей системе

Агент отвечает за ход решения: он принимает задачу, разбивает её на шаги, выбирает порядок действий, решает, когда обращаться к модели, памяти, инструментам и субагентам.

Какие задачи выполняет

  • строит план и определяет следующий лучший шаг
  • решает, какие данные нужно достать и какими инструментами воспользоваться
  • запускает субагентов на параллельные или специализированные подзадачи
  • собирает промежуточные результаты и формирует финальный ответ
Ядро интеллекта

Модель ИИ

Это вычислительное ядро всей системы.

В современных универсальных AI-продуктах им чаще всего становится большая языковая модель, потому что именно она даёт наиболее общий интерфейс к рассуждению, письму, коду и работе с инструкциями.

Что это

Это обученная модель, которая преобразует входной контекст в вероятностный, но полезный следующий шаг: токен, действие, классификацию, план, резюме, код или иной результат.

Зачем нужно

Именно здесь возникает то, что пользователь воспринимает как интеллект системы: способность понимать формулировку, удерживать контекст и выдавать содержательный ответ.

Роль в общей системе

Модель ИИ выполняет основную когнитивную работу: интерпретирует контекст, строит внутренние представления, генерирует текст, код или решения и оценивает вероятные продолжения.

Какие задачи выполняет

  • анализирует контекст, намерение пользователя и доступные материалы
  • генерирует текст, код, извлечения, классификацию и промежуточные гипотезы
  • предлагает следующие действия и аргументирует ход решения
  • работает как общий слой представлений для разных интеллектуальных задач
Выход в реальный мир

Инструменты

Без инструментов даже сильная модель остаётся замкнутой внутри своего контекста.

Она умеет рассуждать, но не умеет сама получить свежие данные, открыть браузер, выполнить код или обновить CRM.

Что это

Это браузер, поиск, файловая система, базы данных, корпоративные сервисы, кодовые рантаймы, таблицы, почта, календари и любые другие внешние интерфейсы исполнения.

Зачем нужно

Реальная ценность ИИ появляется там, где ответ можно связать с внешним миром: подтвердить факт, достать документ, рассчитать сценарий или выполнить действие.

Роль в общей системе

Инструменты дают системе доступ к действию и проверяемым данным: они позволяют не только рассуждать, но и искать, считать, читать документы, вызывать API и менять состояние внешних систем.

Какие задачи выполняет

  • получают данные из API, документов, баз данных и рабочих сервисов
  • выполняют код, расчёты, поиск, автоматизацию и действия во внешних системах
  • дают агенту и модели доступ к актуальному состоянию мира
  • позволяют проверять гипотезы не только словами, но и операциями
Контекст и непрерывность

Память

Память нужна для того, чтобы система не начинала каждый шаг с нуля.

Она делает работу ИИ непрерывной, персонализированной и способной к длинным многошаговым сценариям.

Что это

Это все механизмы хранения и извлечения контекста: conversation state, retrieval, user profile, knowledge base, рабочая память агента и артефакты исполнения.

Зачем нужно

Если памяти нет, система видит только текущую реплику. Тогда она теряет непрерывность, забывает договорённости и хуже справляется со сложными задачами.

Роль в общей системе

Память удерживает состояние задачи во времени: историю диалога, предпочтения пользователя, прошлые решения, найденные документы, рабочие артефакты и промежуточные выводы.

Какие задачи выполняет

  • хранит историю взаимодействия, профили, документы и промежуточные результаты
  • возвращает релевантный контекст в нужный момент исполнения
  • поддерживает длинные сценарии, где важны прошлые решения и зависимости
  • уменьшает дублирование работы и улучшает персонализацию системы
Масштабирование исполнения

Субагент

Когда задача становится длинной, многосоставной или требует параллельных действий, один агент быстро упирается в предел контекста и скорости.

Субагенты дают системе масштабирование и специализацию.

Что это

Это вспомогательные исполнители внутри общей архитектуры: отдельные агенты, воркеры или процессы, которым делегируются специализированные или параллельные задачи.

Зачем нужно

Они нужны там, где одна модель или один агент уже не дают нужной скорости, глубины или организационной ясности при решении большой задачи.

Роль в общей системе

Субагенты позволяют распределять работу между несколькими исполнительными контурами: один ищет информацию, другой пишет код, третий проверяет результат или ведёт отдельный доменный трек.

Какие задачи выполняет

  • берут на себя отдельные подзадачи с собственным контекстом и ролью
  • позволяют распараллеливать исследование, реализацию и проверку
  • изолируют сложные ветки работы, чтобы не перегружать основной контур
  • возвращают агенту частичные результаты для финальной сборки

Что делает модель внутри

Модель не достаёт готовый ответ как файл из памяти. У неё есть внутренняя модель мира: она накопила опыт на огромном числе примеров, держит в уме связи между фактами и по контексту собирает наиболее подходящее продолжение.

Простой пример

Какой самый большой океан на Земле?

Ответ собирается по шагам

Этот5%
Самый91%
Один2%
глубокий4%
большой93%
широкий2%
материк3%
океан95%
залив1%
является7%
-88%
:3%
Атлантический3%
Тихий94%
Индийский2%
и4%
.92%
,3%

Токен - это маленький кусочек текста: слово, знак или часть слова. Но выбор токена опирается не только на соседние слова, а на всю внутреннюю карту связей, которую модель построила во время обучения.

Что делает модель на каждом шаге

  1. 01

    Читает весь предыдущий контекст, а не только последнее слово.

  2. 02

    Опирается на свою внутреннюю модель мира: связи, факты и типичные цепочки отношений.

  3. 03

    Выбирает следующий токен и сразу пересчитывает ответ заново с учётом всего уже сказанного.

Модель не выбирает слово один раз и навсегда: после каждого токена она заново пересчитывает следующее продолжение.

Как модель обучается

Чтобы модель была полезной, её сначала долго обучают на огромном количестве примеров, а затем донастраивают так, чтобы ответы были понятнее, безопаснее и полезнее людям.

  1. 01

    Данные и примеры

    Тексты, код, изображения, звук и таблицы дают материал, на котором система замечает связи и повторяющиеся структуры.

    Без хороших данных хорошей модели не получится.

  2. 02

    Предобучение

    Модель миллиарды раз угадывает следующий фрагмент. Так у неё появляется базовое понимание языка, кода, изображений и структуры задач.

    На этом этапе она уже многое умеет, но ещё не очень удобна человеку.

  3. 03

    Дообучение людьми

    Люди показывают, какой ответ полезный, понятный и уместный. Так появляются инструкции, стиль общения и ограничения.

    Здесь система становится похожей на ассистента, а не просто на сырую модель.

  4. 04

    Проверка и улучшение

    Тесты, обратная связь и проверки помогают находить ошибки, снижать вред и постепенно улучшать поведение модели.

    Поэтому хорошие модели постоянно перепроверяют и обновляют.

Хороший ИИ - это не просто много параметров. Это ещё и качественные данные, дообучение, ограничения и постоянная проверка.

Какие модели бывают

Слово «ИИ» слишком общее. Под ним скрываются разные семейства моделей: одни работают с текстом, другие понимают изображения, третьи слушают голос, четвёртые создают медиа.

LLM

Читает и пишет

Объясняет, переводит, суммирует, пишет текст и код.

Именно это люди чаще всего имеют в виду, когда говорят о чат-ИИ.

Типичные примеры: текст, код, диалог.

Vision

Смотрит

Понимает фотографии, документы, интерфейсы и видео.

Нужно для камер, роботов, медицины и визуального поиска.

Типичные примеры: фото, сканы, видео.

Speech

Слушает и говорит

Распознаёт речь, говорит вслух и переводит разговор в реальном времени.

Так работают голосовые ассистенты и звонки с переводом.

Типичные примеры: голос, транскрипция, перевод.

Generative

Генерирует медиа

Создаёт картинки, видео и аудио по описанию.

Полезно для творчества, прототипов и визуальных концептов.

Типичные примеры: картинки, видео, аудио.