開発者ティア (Developer Tier)
開発者向けティアでのレート制限は以下の通りです。アカウントに支払い方法が登録されている場合は「支払いおよびクレジット」の制限が適用され、支払い方法が登録されていない場合は「クレジットのみ」の制限が適用されます。詳細は請求 (Billing) ページをご覧ください。
プレビューモデル
SambaCloudのプレビューモデルは、主に評価目的のための早期アクセス提供として利用可能です。プレビュー段階では、利用可能な容量に制限がありますが、精度とパフォーマンスの面では本番同様に機能します。開発元 | モデルID | 1分あたりのリクエスト数 (RPM) | 1時間あたりのリクエスト数 (RPH) | 1日あたりのリクエスト数 (RPD) |
---|---|---|---|---|
DeepSeek | ||||
DeepSeek-V3-0324 | 10 | 50 | 600 | |
OpenAI | ||||
Whisper-Large-v3 | 300 | 1500 | 18000 | |
Meta | ||||
Llama-4-Scout-17B-16E-Instruct | 40 | 200 | 2400 | |
Llama-4-Maverick-17B-128E-Instruct | 40 | 200 | 2400 | |
Qwen | ||||
Qwen2-Audio-7B-Instruct | 10 | 50 | 600 | |
Qwen3-32B | 20 | 100 | 1,200 |
本番 (Production) モデル
本番モデルは、速度と品質に関する高い基準を満たし、本番環境での利用に適しています。開発元 | モデルID | 1分あたりのリクエスト数 (RPM) | 1時間あたりのリクエスト数 (RPH) | 1日あたりのリクエスト数 (RPD) |
---|---|---|---|---|
DeepSeek | ||||
DeepSeek-R1 | 20 | 100 | 1200 | |
DeepSeek-R1-Distill-Llama-70B | 80 | 400 | 4800 | |
DeepSeek-V3-0324 | 10 | 50 | 600 | |
Meta | ||||
Meta-Llama-3.3-70B-Instruct | 80 | 400 | 4800 | |
Meta-Llama-3.2-3B-Instruct | 120 | 600 | 7200 | |
Meta-Llama-3.2-1B-Instruct | 120 | 600 | 7200 | |
Meta-Llama-3.1-405B-Instruct | 30 | 150 | 1800 | |
Meta-Llama-3.1-8B-Instruct | 480 | 2400 | 28800 | |
Meta-Llama-Guard-3-8B | 60 | 300 | 3600 | |
Qwen | ||||
QwQ-32B | 20 | 100 | 1200 | |
東京科学大学 | ||||
Llama-3.3-Swallow-70B-Instruct-v0.4 | 60 | 300 | 3600 | |
その他 | ||||
E5-Mistral-7B-Instruct | 30 | 150 | 1800 |
その他のティアについて
Managed SubscriptionやDedicatedティアにおけるレート制限については、営業担当までお問い合わせいただくか、コミュニティページよりご相談ください。お客様のプロジェクトに合わせて調整いたします。レート制限レスポンスヘッダー
レスポンスに含まれるこれらのヘッダーは、現在のレート制限の利用状況に関する情報を提供します。デフォルトのレート制限ヘッダーはRPMです。 RPM (1分あたりのリクエスト数):x-ratelimit-limit-requests
- 1分あたりに許可される最大リクエスト数
x-ratelimit-remaining-requests
- 現在の分 (minute) 枠内で、レート制限に達するまでに残っているリクエスト数
x-ratelimit-reset-requests
- 1分あたりのリクエストクォータがリセットされるまでのエポック時間
x-ratelimit-limit-requests-hour
- 1時間あたりに許可される最大リクエスト数
x-ratelimit-remaining-requests-hour
- 現在の時間 (hour) 枠内で、レート制限に達するまでに残っているリクエスト数
x-ratelimit-reset-requests-hour
- 1時間ごとのリクエストクォータがリセットされるまでのエポック時間
x-ratelimit-limit-requests-day
- 1日あたりに許可される最大リクエスト数
x-ratelimit-remaining-requests-day
- 現在の日次枠で、レート制限に達するまでに残っているリクエスト数
x-ratelimit-reset-requests-day
- 日次クォータがリセットされるまでのエポック時間