Skip to content

خط أنابيب الصوت

🚧Coming Soon — This feature is planned but not yet implemented.

مزودو STT و TTS المدرجون أدناه هم واجهات فقط. النظام الكامل لمعالجة

الصوت في طور التطوير النشط. :::

البنية

خط أنابيب الصوت يتكون من:

  1. STT (تحويل الكلام إلى نص) -- يحول المدخلات الصوتية إلى نص
  2. معالجة الوكيل -- يعالج النص عبر حلقة الوكيل العادية
  3. TTS (تحويل النص إلى كلام) -- يحول استجابة الوكيل إلى صوت

مزودو STT

المزودالنوعملاحظات
Whisperمحليمفتوح المصدر، خاص
Deepgramسحابيسريع، دقة عالية
OpenAIسحابيWhisper API

مزودو TTS

المزودالنوعملاحظات
ElevenLabsسحابيأصوات واقعية
OpenAIسحابيTTS API

الأمان

إدخال الصوت يمر عبر نفس تنفيذ التصنيف والسياسات كالنص. تصعيد Taint يحدث بناءً على محتوى النص المُحول.