تحلیل تصویر وبینایی
پشتیبانی میکند Triggerfish إدخال الصور از طریق تمام رابطها. میتوانید لصق الصور از حافظتك در CLI یا مرورگر، ويمكن للعامل تحليل ملفات الصور روی القرص. عندما خیر پشتیبانی میکند مدلك الرئيسي بینایی، يمكن لمدل رؤية ازفصل وصف الصور بهصورت خودکار.
إدخال الصور
CLI: لصق الحافظة (Ctrl+V)
اضغط Ctrl+V در مکالمه CLI للصق صورة از حافظة نظامك. تُقرأ الصورة وتُرمز بـ base64 وتُرسل للعامل ككتلة محتوى متعددة الوسائط.
Tidepool: لصق مرورگر
در واجهة Tidepool، الصق الصور مستقیماًً در إدخال مکالمه.
ابزار image_analyze
يمكن للعامل تحليل ملفات الصور روی القرص باستخدام ابزار image_analyze.
| الباامل | النوع | الزامی | الوصف |
|---|---|---|---|
path | string | بله | المسار المطلق لملف الصورة |
prompt | string | خیر | سؤال یا prompt عن الصورة |
الصيغ المدعومة: PNG, JPEG, GIF, WebP, BMP, SVG
مدل بینایی البديل
عندما خیر پشتیبانی میکند مدلك الرئيسي بینایی، میتوانید تكوين مدل رؤية ازفصل:
yaml
models:
vision: gemini-2.0-flashچگونه کار میکند
- تلصق صورة یا ترسل محتوى متعدد الوسائط
- الازسق يكتشف كتل محتوى الصورة
- مدل بینایی يصف هر صورة
- كتل الصور تُستبدل بیاصاف نصية
- مدل الرئيسي يعالج پیام با الیاصاف النصية
