المنصة
أفاتار ذكاء اصطناعي في الوقت الحقيقي، مبنية للإنتاج.
وجوه واقعية بصرياً، صوت متدفّق ثنائي الاتجاه، واختيارك من LLM — على الويب والجوّال والأكشاك الفعلية.
البنية
كيف تتكامل المنصة
صوت داخل، صوت خارج
ASR متدفق يلتقط الكلام، LLM يولّد الرد، TTS ينطقه — عادةً حوالي ثانيتين end-to-end عبر خط أنابيب voice-backend على GPU متجاور.
عرض أفاتار في الوقت الحقيقي
الواجهة الخلفية ثنائية الأبعاد تستخدم Lipsync-2D مع NVENC وتدفع إطارات WebRTC عبر WHIP. الواجهة الخلفية ثلاثية الأبعاد ترسم شخصيات Unreal Engine 5 بجودة سينمائية.
أي LLM
OpenAI أو Anthropic أو Google أو Mistral أو نموذجك المُدرَّب الخاص خلف إعداد واحد. غيّر المحرك دون إعادة بناء البنية.
نشر بشروطك
SaaS مركزي، on-prem على GCP، أو كشك معزول air-gapped — نفس المنتج، ثلاثة أشكال نشر. عميل واحد لكل stack حين يهم العزل.
الجدول الزمني للارتباط
من الانطلاق إلى أول محادثة.
كيف يبدو برنامجنا التجريبي عادةً — ثلاثة أسابيع من المكالمة الأولى إلى تحدّث المستخدمين الحقيقيين مع أفاتارك.
اختيار الأفاتار + النطاق
اختر أفاتاراً من الكتالوج المباشر أو اطلب تصميماً مخصصاً. نتفق على حالة الاستخدام والقناة والمقياس الذي يُحكم به على البرنامج — عادةً first-contact resolution أو completion rate.
التكامل
نوصّل LLM الخاص بك (أو نستخدم لدينا)، نحمّل قاعدة المعرفة، ونضع الأفاتار على السطح المهم: ويب أو جوّال أو كشك على جدارك.
الإنتاج
الانطلاق للمستخدمين الحقيقيين. نراقب المقاييس معك. إذا نجح البرنامج تنتقل إلى Growth أو Enterprise دون إعادة بناء.
اختيار الأفاتار + النطاق
اختر أفاتاراً من الكتالوج المباشر أو اطلب تصميماً مخصصاً. نتفق على حالة الاستخدام والقناة والمقياس الذي يُحكم به على البرنامج — عادةً first-contact resolution أو completion rate.
التكامل
نوصّل LLM الخاص بك (أو نستخدم لدينا)، نحمّل قاعدة المعرفة، ونضع الأفاتار على السطح المهم: ويب أو جوّال أو كشك على جدارك.
الإنتاج
الانطلاق للمستخدمين الحقيقيين. نراقب المقاييس معك. إذا نجح البرنامج تنتقل إلى Growth أو Enterprise دون إعادة بناء.
إمكانيات المنصة
مصمم للعالم الحقيقي
مزامنة شفاه في الوقت الحقيقي
عرض عصبي يولّد تعابير الوجه وحركات الشفاه إطاراً بإطار، متزامناً مع الكلام.
صوت داخل، صوت خارج
صوت مزدوج الاتجاه: التعرف على الكلام، توليد الاستجابة، تحويل النص لصوت — عادةً حوالي ثانيتين end-to-end على GPU متجاور.
+50 لغة
تحدث مع أفاتارك بالعربية أو الصينية أو الإسبانية أو الروسية أو أي من 50+ لغة مدعومة.
أي نموذج لغوي
OpenAI أو Anthropic أو Google أو Mistral أو نموذجك المخصص. التبديل بتغيير الإعدادات.
أفاتارات ثنائية وثلاثية الأبعاد
أفاتارات فيديو واقعية (Lipsync-2D / WAV2Lip) أو شخصيات سينمائية ثلاثية الأبعاد (Unreal Engine 5).
جاهز للأكشاك
مُختبر للنشر العام: مطارات ومراكز تجارية وفنادق ومستشفيات. وضع عدم الاتصال متضمن.
حالات الاستخدام
أفاتارات AI عبر القطاعات
استبدل مكتب المعلومات بالذكاء الاصطناعي
صالات المطارات والمراكز التجارية وبهو الفنادق. مساعدة متعددة اللغات 24/7 — بدون موظفين.
حل من أول تواصل، كل مرة
تعامل مع المرتجعات واستكشاف الأخطاء وتوجيه المستخدمين. خدمة متسقة عبر كل قناة.
توظيف وتأهيل تلقائي
فحص المرشحين والإجابة على أسئلة السياسات وإرشاد الموظفين الجدد. علامتك التجارية، نبرتك، 24/7.
تعليم يتحدث إليك
مرشدو متاحف ووحدات تدريبية وشرح منتجات. شخصية يرغب الناس فعلاً بالتحدث إليها.