Какие языковые модели поддерживаются?

Любая модель с HTTP API: OpenAI, Anthropic, Google, Mistral или ваша собственная — подключается изменением конфигурации.

Можно ли развернуть на нашей инфраструктуре?

Да. Для вашей инфраструктуры поставляем Terraform и Ansible для схемы из двух машин (прокси + GPU-сервер); киоск — автономное устройство, работающее в локальной сети заказчика.

Есть ли бесплатное демо?

Живое демо на этом сайте не требует регистрации: выберите аватара, нажмите «Начать» и говорите.

Платформа

AI-аватары в реальном времени для production-нагрузок.

Фотореалистичные лица, потоковый полнодуплексный голос и любой LLM — на сайтах, в мобильных приложениях и на физических киосках.

Открыть демо Смотреть тарифы

Real-time

От голоса до голоса

50+

Поддерживаемых языков

SaaS · On-prem · Kiosk

Варианты развёртывания

2022

Создаём цифровых людей

Архитектура

Из чего собрана платформа

Голос на входе, голос на выходе

Потоковый ASR захватывает речь, LLM генерирует ответ, TTS озвучивает — обычно около двух секунд end-to-end через voice-backend на co-located GPU.

Рендеринг аватара в реальном времени

2D-бэкенд использует Lipsync-2D с NVENC и WebRTC через WHIP. 3D-бэкенд рендерит персонажей в Unreal Engine 5 с кинематографическим качеством.

Любой LLM

OpenAI, Anthropic, Google, Mistral или собственная дообученная модель — через единый конфиг. Меняйте движок без переписывания архитектуры.

Развёртывание на ваших условиях

Центральный SaaS, on-prem GCP или изолированный киоск — один продукт, три варианта. Один клиент на стек, когда важна изоляция.

Как проходит пилот

От первого созвона до внедрения.

Обычный пилот занимает три недели — от знакомства до момента, когда с вашим аватаром говорят реальные пользователи.

Неделя 1

Аватар и сценарий

Выбираете аватара из каталога или заказываете собственного. Вместе фиксируем сценарий, канал и метрику успеха — например, долю вопросов, решённых с первого обращения.

Неделя 2

Интеграция

Подключаем вашу языковую модель (или используем нашу), загружаем базу знаний и встраиваем аватара туда, где он нужен: на сайт, в приложение или киоск.

Неделя 3+

Запуск

Выпускаем аватара к реальным пользователям и вместе следим за метриками. Если пилот удался — масштабируетесь без переделки интеграции.

Неделя 1

Аватар и сценарий

Неделя 2

Интеграция

Неделя 3+

Запуск

Возможности платформы

Создано для реального мира

Концепт-рендер

Проще один раз увидеть: аватар наверху страницы отвечает уже сейчас.

Синхронизация губ в реальном времени

Нейросетевой рендеринг генерирует мимику и движения губ покадрово, синхронизируя с речью.

Голос на входе, голос на выходе

Полный голосовой цикл: распознавание речи, ответ языковой модели, синтез голоса — обычно около двух секунд от конца вашей фразы до начала ответа.

50+ языков

Говорите с аватаром на арабском, китайском, испанском, русском или любом из 50+ поддерживаемых языков.

Любая языковая модель

OpenAI, Anthropic, Google, Mistral или ваша собственная модель — подключается изменением конфигурации.

2D и 3D аватары

Фотореалистичные видеоаватары или кинематографичные 3D-персонажи, отрендеренные в Unreal Engine 5.

Работает на киосках

Проверено в публичных пространствах: аэропорты, торговые центры, отели, клиники. Продолжает работать без интернета.

Поставка без сети

Аватар приезжает на накопителе

Для изолированных сетей весь цифровой человек — модель, голос, база знаний — записывается на один зашифрованный накопитель. Вставьте его в киоск, и аватар оживёт. По сути, конструкт из киберпанка — только настоящий.

Сценарии использования

AI-аватары в разных отраслях

Замените стойку информации на AI

Терминалы аэропортов, торговые центры, лобби отелей. Многоязычная помощь 24/7 — без персонала.

Решение с первого обращения

Возвраты, диагностика, инструкции. Стабильный сервис на каждом канале.

Наём и адаптация на автопилоте

Скрининг кандидатов, ответы на вопросы о политике, сопровождение первого дня. Ваш бренд, ваш тон, 24/7.

Образование, которое отвечает

Музейные гиды, обучающие модули, презентации продуктов. Персонаж, с которым хочется общаться.

FAQ по платформе

Обычно около двух секунд от конца фразы до начала ответа — в облаке с GPU-пулом в той же зоне. Задержку могут увеличить расстояние до сервера и выбранная языковая модель; локальные и киосковые развёртывания при правильном размещении укладываются в тот же диапазон.