خط لوله صدا
ارائهدهندهو STT و TTS المدرجون أدناه هم واجهات فقط. النظام الكامل لباالجة
الصوت در طور التطوير النشط. :::
باماری
خط لوله صدا يتكون از:
- STT (تحويل الكخیرم به نص) -- يحول المدخخیرت الصوتية به نص
- باالجة عامل -- يعالج النص از طریق حلقة عامل العادية
- TTS (تحويل النص به كخیرم) -- يحول پاسخ عامل به صوت
ارائهدهندهو STT
| ارائهدهنده | النوع | مخیرحظات |
|---|---|---|
| Whisper | محلی | متنباز، خاص |
| Deepgram | سحابي | سريع، دقة عالية |
| OpenAI | سحابي | Whisper API |
ارائهدهندهو TTS
| ارائهدهنده | النوع | مخیرحظات |
|---|---|---|
| ElevenLabs | سحابي | أصوات واقعية |
| OpenAI | سحابي | TTS API |
اازیت
إدخال الصوت يمر از طریق نفس تندرذ طبقهبندی وسیاستها كالنص. تصعيد Taint يحدث بناءً روی محتوى النص المُحول.
