Skip to content

تحلیل تصویر وبینایی

پشتیبانی می‌کند Triggerfish إدخال الصور از طریق تمام رابط‌ها. می‌توانید لصق الصور از حافظتك در CLI یا مرورگر، ويمكن للعامل تحليل ملفات الصور روی القرص. عندما خیر پشتیبانی می‌کند مدلك الرئيسي بینایی، يمكن لمدل رؤية ازفصل وصف الصور به‌صورت خودکار.

إدخال الصور

CLI: لصق الحافظة (Ctrl+V)

اضغط Ctrl+V در مکالمه CLI للصق صورة از حافظة نظامك. تُقرأ الصورة وتُرمز بـ base64 وتُرسل للعامل ككتلة محتوى متعددة الوسائط.

Tidepool: لصق مرورگر

در واجهة Tidepool، الصق الصور مستقیماًً در إدخال مکالمه.

ابزار image_analyze

يمكن للعامل تحليل ملفات الصور روی القرص باستخدام ابزار image_analyze.

البااملالنوعالزامیالوصف
pathstringبلهالمسار المطلق لملف الصورة
promptstringخیرسؤال یا prompt عن الصورة

الصيغ المدعومة: PNG, JPEG, GIF, WebP, BMP, SVG

مدل بینایی البديل

عندما خیر پشتیبانی می‌کند مدلك الرئيسي بینایی، می‌توانید تكوين مدل رؤية ازفصل:

yaml
models:
  vision: gemini-2.0-flash

چگونه کار می‌کند

  1. تلصق صورة یا ترسل محتوى متعدد الوسائط
  2. الازسق يكتشف كتل محتوى الصورة
  3. مدل بینایی يصف هر صورة
  4. كتل الصور تُستبدل بیاصاف نصية
  5. مدل الرئيسي يعالج پیام با الیاصاف النصية