خط أنابيب الصوت
مزودو STT و TTS المدرجون أدناه هم واجهات فقط. النظام الكامل لمعالجة
الصوت في طور التطوير النشط. :::
البنية
خط أنابيب الصوت يتكون من:
- STT (تحويل الكلام إلى نص) -- يحول المدخلات الصوتية إلى نص
- معالجة الوكيل -- يعالج النص عبر حلقة الوكيل العادية
- TTS (تحويل النص إلى كلام) -- يحول استجابة الوكيل إلى صوت
مزودو STT
| المزود | النوع | ملاحظات |
|---|---|---|
| Whisper | محلي | مفتوح المصدر، خاص |
| Deepgram | سحابي | سريع، دقة عالية |
| OpenAI | سحابي | Whisper API |
مزودو TTS
| المزود | النوع | ملاحظات |
|---|---|---|
| ElevenLabs | سحابي | أصوات واقعية |
| OpenAI | سحابي | TTS API |
الأمان
إدخال الصوت يمر عبر نفس تنفيذ التصنيف والسياسات كالنص. تصعيد Taint يحدث بناءً على محتوى النص المُحول.
