Если у вас в портале висит «корпоративный GPT», который не знает оргструктуру компании, не понимает роли пользователей и не может сделать ничего, кроме генерации текста — это не корпоративный AI. Это ChatGPT с вашим логотипом сверху.
Корпоративный AI без контекста быстро превращается в красивую форму поиска. Он может написать текст, но не понимает, кто кому руководитель, какие ценности приняты в компании, какие процессы уже запущены и какие действия доступны конкретному пользователю.
Память корпоративного агента — это не «помнить все разговоры». Это безопасный контекст: оргструктура, роли, настройки доступа, история публичных действий в платформе и правила компании. Без этого агент не может давать полезные и безопасные рекомендации.
В 2026-м планка корпоративного AI поднялась. Реальный AI-агент в портале — это не одна модель за фасадом. Это шесть слоёв инфраструктуры, и без любого из них продукт скатывается обратно в «обёртку GPT». Расскажу про каждый слой и про то, что мы строим в TeamHero.
Один агент vs зоопарк специализированных ботов
Самый частый антипаттерн в корпоративном AI 2025-го — зоопарк ботов. Бот для онбординга, бот для FAQ, бот для подачи идей, бот для recognition (благодарностей), бот для опросов. Каждый — со своим интерфейсом, своей памятью, своим набором правил.
Проблема зоопарка: пользователю приходится заново учить каждый бот. Какой через какое поле что просить, какой что умеет, какой что забыл. Через два месяца человек запоминает только 1–2 из шести и ходит только туда.
Решение, которое мы выбрали: один агент со многими инструментами. Агент один и тот же, контекст у него один, память общая. А специализированные функции (поиск по компании, генерация благодарности, статистика по команде, помощь с онбордингом) — это инструменты, которые агент вызывает по необходимости.
С точки зрения пользователя — это одно окно чата. С точки зрения инфраструктуры — модульный набор возможностей, которые агент применяет в зависимости от запроса. Эта архитектура сложнее в реализации, но в разы проще в использовании. И через год становится очевидно, что зоопарк не масштабируется — а единый агент масштабируется естественно: добавить новый инструмент дешевле, чем построить ещё одного бота.
Multi-provider LLM — выбор модели per-space
Реальность 2026 года: нет одной модели, которая идеально подходит всем. И продукт, который жёстко зашит на одну модель, сильно проигрывает.
Разные клиенты приходят с разными требованиями:
- Privacy-критичные (государственные структуры, банки, оборонка, финтех) требуют локально размещённую модель в РФ или self-hosted, и не могут использовать зарубежных провайдеров вообще.
- Международные клиенты комфортно используют Claude или GPT-4, у них требования GDPR, не 152-ФЗ.
- Чувствительные к цене клиенты могут выбрать более дешёвую модель, особенно для рутинных задач (классификация тегов, генерация коротких текстов).
- Энтерпрайз часто требует контракта с конкретным провайдером, потому что у него уже есть DPA, прошедший их юридический департамент.
Архитектурное решение — per-space LLM gateway. Каждое пространство (= каждый клиент) выбирает свой набор моделей: «для recognition — модель A, для классификации — модель B, для конверсаций — модель C». Код продукта от этого не меняется. Меняется только конфигурация.
С точки зрения разработки это значит: единый интерфейс к LLM («сгенерируй текст по этому промпту, верни JSON по этой схеме»), и под этим интерфейсом — драйверы для разных провайдеров. Yandex GPT, OpenAI, Anthropic Claude, локальная модель через vLLM или Ollama — всё одинаковое для бизнес-логики.
Это не маркетинговый ход «multi-provider». Это операционная необходимость для комплаенса и экономии. И это именно тот слой, без которого нельзя серьёзно работать с энтерпрайзом в РФ в 2026-м.
Memory Palace — что агент помнит, что нет, как это контролируется
Самая недооценённая часть корпоративного AI. Большинство «AI-помощников» обращаются с каждой сессией как с изолированной — сегодня вы один человек, завтра другой, агент ничего не помнит. Для повседневного использования это убивает ценность.
Мы строим память как многоуровневую структуру, которую внутри называем Memory Palace. При этом память должна быть управляемой. Сотрудник должен понимать, какие данные используются, где они хранятся и какие действия агент может выполнить сам. Для HR-сценариев особенно важно правило: агент может рекомендовать, но не должен скрыто оценивать человека или принимать кадровое решение.
Слой 1 — текущий разговор. Самый простой и стандартный. Последние N реплик в текущей сессии. Это есть в любом чат-интерфейсе.
Слой 2 — память пользователя. То, что агент знает про вас лично: ваша роль, отдел, предпочтения, история взаимодействий. «Вы любите краткие ответы», «вы недавно повышены», «вы регулярно благодарите коллег из маркетинга». Эта память персонализирует общение и накапливается со временем.
Слой 3 — память команды. Кто в вашей команде, кто чем занят, какие события произошли в последние недели. Когда вы спрашиваете «помоги подготовиться к 1:1 с Анной», агент знает, что Анна — ваш подчинённый, что вы говорили с ней две недели назад, и что у неё на той встрече висел вопрос про развитие.
Слой 4 — память компании. Ценности, оргструктура, процессы, политики. Это общая память пространства, которую формирует и обновляет HR-команда. Эту память агент использует, когда нужен корпоративный контекст: «как у нас принято поощрять инициативу», «кто отвечает за комплаенс в российском контуре», «какие у нас правила отпуска».
Принципиальный момент — изоляция между слоями. Память команды одного руководителя не утекает в команду другого. Память пользователя видна только этому пользователю и не попадает в общую сводку. Память компании — общая, но обезличена. Это граница комплаенса, без которой Memory Palace превращается в риск утечки.
И второй принципиальный момент — прозрачность для пользователя. В настройках профиля каждый сотрудник может посмотреть, что агент про него помнит, и удалить любую запись. Это не «закулисная фича», это базовое требование GDPR и 152-ФЗ применительно к ML-системам.
Tool Store — что агент умеет делать, а не только говорить
Хороший AI-агент не просто отвечает текстом — он выполняет действия по вашей просьбе. Это и отличает «помощника» от «справочника».
Что мы называем инструментами:
- Поиск по компании. Агент может найти коллегу, документ, политику, идею.
- Чтение контекста. Агент знает оргструктуру, видит recognition gap (пробел в признании) по команде, читает последние взаимодействия.
- Запись действий. Может черновик отправить, может опубликовать (с вашим подтверждением), может создать событие в календаре.
- Внешние интеграции. Подключённый к ITSM, CRM, трекеру задач — может создать тикет, найти задачу.
Примеры реальных запросов, которые проходят через инструменты:
- «Помоги написать благодарность Анне за вчерашнее ревью.» — Агент читает контекст (кто такая Анна, что было вчера), генерирует черновик, показывает вам, ждёт подтверждения, отправляет.
- «Подними отчёт по engagement за последний квартал.» — Агент вызывает analytics API, форматирует результат.
- «Кому я давно не говорил спасибо?» — Агент читает дашборд руководителя, выдаёт список с слепыми зонами.
- «Найди коллегу из маркетинга, кто работает с продуктовой командой.» — Агент идёт в оргструктуру и граф взаимодействий по тегам.
Tool Store устроен так, что админ пространства может настраивать, какие инструменты доступны агенту. Можно отключить «запись действий» полностью (для режима «только чтение»). Можно подключить свой собственный инструмент через API (например, корпоративный CRM). Это даёт клиенту контроль над тем, что AI может, а что — нет.
И принципиальный пункт — каждое действие, влияющее на людей, требует подтверждения пользователя. Агент готовит благодарность — отправляет только после вашего «да». Агент создаёт пост в ленте — публикует только после подтверждения. Это не технический ограничитель, это этическая граница, которую мы держим осознанно.
Autonomous agents — куда мы идём
В 2026-м корпоративный AI работает в основном синхронно: вы спросили — он ответил, вы попросили — он сделал. Следующий шаг — автономные, асинхронные агенты, которые выполняют задачи в фоне.
Где это уже видно:
- «Подготовь черновик performance review для команды на следующий квартал.» — Агент собирает данные, форматирует черновик, через день кладёт вам в портал «вот, посмотрите».
- «Следи за слепыми зонами и напоминай мне еженедельно.» — Фоновая задача, которая раз в неделю шлёт вам компактную сводку.
- «Если у кого-то в команде возникает сигнал на тихий уход, сообщи мне сразу.» — Event-driven мониторинг (по событиям) с проактивным уведомлением.
Это и есть тот сдвиг, который происходит на наших глазах. От «AI как ответ» к «AI как выполнитель задач».
Принципиальная граница, которую мы держим осознанно: AI выполняет подготовительную работу, человек принимает финальные решения по людям. Performance review — AI готовит черновик, человек редактирует и публикует. Recognition — AI предлагает варианты, человек выбирает и подтверждает отправку. Никаких «AI уволил кого-то», «AI понизил зарплату», «AI решил про повышение».
Роадмап здесь — постепенное расширение доверия. Сначала AI делает простые подготовительные задачи. Если они оказываются надёжными — даём ему задачи побольше. Это не «дать AI всё сразу», это инкрементальный путь, в котором каждый шаг проверен.
Prompt Registry — как мы управляем тысячами промптов
Скрытая инфраструктура, без которой всё вышеперечисленное превращается в неуправляемый хаос.
В нашем продукте десятки AI-фич: AI Drafter, brainstorm-агент, сводка новостей, классификация тегов идей, классификация тем для engagement intelligence, поздравления с ДР, анализ тональности. Каждая использует свой промпт. Реально — несколько вариантов промпта на каждую фичу: для разных языков, для разных контекстов, для разных версий моделей.
Если хранить промпты в коде, у вас быстро появляется проблема:
- Промпт хочется поменять — нужен релиз кода.
- Промпт не локализован — приходится копировать и поддерживать вручную.
- Промпт даёт плохой ответ — невозможно быстро провести A/B-тест.
- Клиент хочет настроить тон под свою культуру — невозможно без форка.
Prompt Registry — внутренний сервис, который хранит все промпты в БД с версионированием, локализацией, JSON Schema для валидации ответа и возможностью переопределения для каждого пространства.
Как это работает на практике:
- Каждая AI-фича обращается к Registry: «дай мне промпт
recognition.draft.v1на языкеruдля пространства X». - Если у пространства X есть кастомное переопределение этого промпта — вернётся оно. Если нет — стандартное.
- При генерации ответа модели результат валидируется против JSON Schema — если ответ не соответствует, система автоматически перегенерирует или подставляет запасной вариант.
- Любое изменение промпта — это новая версия в Registry, не релиз кода. Можно откатить за 5 минут, если что-то сломалось.
Это незаметная для пользователя часть архитектуры, но именно она делает AI-фичи управляемыми в продакшене. Без Prompt Registry AI-продукт превращается в кашу из захардкоженных строк, которую страшно трогать.
Главное
Корпоративный AI-агент 2026-го — это не «обёртка над GPT». Это шесть слоёв инфраструктуры, каждый из которых важен:
- Один агент, не зоопарк ботов. Единое окно, общая память, инструменты вместо отдельных интерфейсов.
- Multi-provider LLM с выбором по пространству. Комплаенс и экономия для разных клиентов.
- Memory Palace. Память на четырёх уровнях (разговор / пользователь / команда / компания) с изоляцией и контролем пользователя.
- Tool Store. Не «отвечает», а делает — с обязательным подтверждением для действий, влияющих на людей.
- Autonomous agents. Постепенный переход от синхронного помощника к асинхронному исполнителю.
- Prompt Registry. Управление десятками тысяч промптов в проде без хаоса.
Большинство «AI в HR» продуктов 2025 года имели максимум 1–2 из этих слоёв. В 2026 это становится недостаточно. Если вы выбираете AI-инструмент для интранета, спросите вендора про каждый из шести — и вы быстро отделите серьёзные продукты от «обёрток над ChatGPT с логотипом сверху».
На следующей неделе — про опросы. Pulse vs annual, conversational survey, lifecycle-опросы, k≥5 анонимность как технология, не декларация.
Если хотите расширенное демо AI-агента с разбором всех шести слоёв на нашей реальной системе — переходите по ссылке в карточке.
Читать дальше
AI-онбординг — 14 дней, которые решают, останется человек на полгода или уйдёт
Классический корпоративный курс — это PDF, видео и тест, который никто не помнит через неделю. Разбираю, как мы строим адаптивную 14-дневную траекторию вместо очередной системы обучения.
Слушать сотрудников, а не считать опросы — переход на сигналы вовлечённости
Ежегодный опрос — это эхолот, который видит дно раз в год. Разбираю, как сигналы из шести источников складываются в живую картину вовлечённости, и почему «Что мы услышали» — самая важная страница в портале.
Опросы вовлечённости — почему годовой замер пора отправить на пенсию
Раз в год спрашивать у 800 человек «как дела» — это получить ответ через две недели после того, как им стало плохо. Разбираю, как пульс-опросы, AI-интервью и опросы по жизненному циклу заменяют ежегодный замер.

