تحلیل تصویر وبینایی

پشتیبانی می‌کند Triggerfish إدخال الصور از طریق تمام رابط‌ها. می‌توانید لصق الصور از حافظتك در CLI یا مرورگر، ويمكن للعامل تحليل ملفات الصور روی القرص. عندما خیر پشتیبانی می‌کند مدلك الرئيسي بینایی، يمكن لمدل رؤية ازفصل وصف الصور به‌صورت خودکار.

إدخال الصور

CLI: لصق الحافظة (Ctrl+V)

اضغط Ctrl+V در مکالمه CLI للصق صورة از حافظة نظامك. تُقرأ الصورة وتُرمز بـ base64 وتُرسل للعامل ككتلة محتوى متعددة الوسائط.

Tidepool: لصق مرورگر

در واجهة Tidepool، الصق الصور مستقیماًً در إدخال مکالمه.

ابزار `image_analyze`

يمكن للعامل تحليل ملفات الصور روی القرص باستخدام ابزار image_analyze.

الباامل	النوع	الزامی	الوصف
`path`	string	بله	المسار المطلق لملف الصورة
`prompt`	string	خیر	سؤال یا prompt عن الصورة

الصيغ المدعومة: PNG, JPEG, GIF, WebP, BMP, SVG

مدل بینایی البديل

عندما خیر پشتیبانی می‌کند مدلك الرئيسي بینایی، می‌توانید تكوين مدل رؤية ازفصل:

yaml

models:
  vision: gemini-2.0-flash

چگونه کار می‌کند

تلصق صورة یا ترسل محتوى متعدد الوسائط
الازسق يكتشف كتل محتوى الصورة
مدل بینایی يصف هر صورة
كتل الصور تُستبدل بیاصاف نصية
مدل الرئيسي يعالج پیام با الیاصاف النصية

تحلیل تصویر وبینایی ​

إدخال الصور ​

CLI: لصق الحافظة (Ctrl+V) ​

Tidepool: لصق مرورگر ​

ابزار image_analyze ​

مدل بینایی البديل ​

چگونه کار می‌کند ​