Skip to content

Rate Limiting

Triggerfish LLM provider API limits தாக்காமல் தடுக்கும் ஒரு sliding-window rate limiter சேர்க்கிறது. இது எந்த provider ஐயும் transparently wrap செய்கிறது -- agent loop rate limits பற்றி தெரிந்திருக்க தேவையில்லை. Capacity exhausted ஆகும்போது, window போதுமான capacity free செய்யும் வரை calls தானாக delayed ஆகின்றன.

எவ்வாறு செயல்படுகிறது

Rate limiter இரண்டு metrics track செய்ய ஒரு sliding window (default 60 வினாடிகள்) பயன்படுத்துகிறது:

  • Tokens per minute (TPM) -- window க்குள் total tokens consumed (prompt + completion)
  • Requests per minute (RPM) -- window க்குள் total API calls

ஒவ்வொரு LLM call க்கும் முன்பு, limiter இரண்டு limits க்கும் எதிராக available capacity சரிபார்க்கிறது. ஏதாவது exhausted ஆனால், oldest entries window இலிருந்து slide out ஆகி போதுமான capacity free செய்யும் வரை call காத்திருக்கிறது. ஒவ்வொரு call complete ஆன பிறகு, actual token usage பதிவு செய்யப்படுகிறது.

Streaming மற்றும் non-streaming calls இரண்டும் அதே budget இலிருந்து consume செய்கின்றன. Streaming calls க்கு, stream finish ஆகும்போது token usage பதிவு செய்யப்படுகிறது.

Rate limiter flow: Agent Loop → Rate Limiter → capacity check → forward to provider or wait

OpenAI Tier Limits

Rate limiter OpenAI இன் published tier limits க்கான built-in defaults ship செய்கிறது:

TierGPT-4o TPMGPT-4o RPMo1 TPMo1 RPM
Free30,00050030,000500
Tier 130,00050030,000500
Tier 2450,0005,000100,0001,000
Tier 3800,0005,000100,0001,000
Tier 42,000,00010,000200,00010,000
Tier 530,000,00010,000200,00010,000

இவை OpenAI இன் published limits அடிப்படையிலான defaults. உங்கள் actual limits உங்கள் OpenAI account tier மற்றும் usage history ஐ பொறுத்தது. மற்ற providers (Anthropic, Google) server-side தங்கள் சொந்த rate limits manage செய்கின்றன -- limiter OpenAI க்கு மிகவும் பயனுள்ளது, client-side throttling 429 errors தடுக்கும். :::

கட்டமைப்பு

Wrapped provider பயன்படுத்தும்போது Rate limiting automatic. Default நடத்தைக்கு user configuration தேவையில்லை. Limiter உங்கள் provider கண்டறிந்து பொருத்தமான limits apply செய்கிறது.

Advanced பயனர்கள் triggerfish.yaml இல் provider config மூலம் limits customize செய்யலாம்:

yaml
models:
  providers:
    openai:
      model: gpt-4o
      rate_limit:
        tpm: 450000 # Tokens per minute
        rpm: 5000 # Requests per minute
        window_ms: 60000 # Window size (default 60s)

Rate limiting 429 errors மற்றும் unexpected bills இலிருந்து பாதுகாக்கிறது. இது failover chain உடன் சேர்ந்து வேலை செய்கிறது -- rate limits hit ஆகி limiter காத்திருக்க முடியாவிட்டால் (timeout), failover activate ஆகி அடுத்த provider முயற்சிக்கிறது. :::

Usage Monitor செய்யவும்

Rate limiter current usage இன் live snapshot expose செய்கிறது:

{tokensUsed, requestsUsed, tpmLimit, rpmLimit, windowMs}

CLI மற்றும் Tide Pool இல் context progress bar context usage காட்டுகிறது. Debug logs இல் rate limit status visible:

[DEBUG] [provider] Rate limiter: 12,450/30,000 TPM, 8/500 RPM (window: 60s)

Limiter ஒரு call delay செய்யும்போது, wait time log செய்கிறது:

[INFO] [provider] Rate limited: waiting 4.2s for TPM capacity

Channel Rate Limiting

LLM provider rate limiting கூடுதலாக, Triggerfish messaging platforms ஐ flooding தடுக்க per-channel message rate limits enforce செய்கிறது. ஒவ்வொரு channel adapter உம் outbound message frequency track செய்கிறது மற்றும் limits நெருங்கும்போது sends delay செய்கிறது.

இது பாதுகாக்கிறது:

  • Excessive message volume இலிருந்து Platform API bans
  • Runaway agent loops இலிருந்து Accidental spam
  • Webhook-triggered message storms

Channel rate limits channel router மூலம் transparently enforce ஆகின்றன. Agent channel allow செய்வதை விட வேகமாக output generate செய்தால், செய்திகள் queue ஆகி அதிகபட்ச permitted rate இல் deliver ஆகின்றன.

தொடர்புடையவை