هزینه استفاده از مدلهای زبانی بزرگ (LLM)، مانند GPT-4 و سایر مدلهای مشابه، بر اساس تعداد توکنهایی که در یک درخواست ارسال میشود، محاسبه میشود. توکنها نمایانگر کلمات یا بخشهایی از کلمات یا کاراکترها هستند و هم ورودی (متنی که ارسال میکنید) و هم خروجی (پاسخ مدل) به صورت توکن اندازهگیری میشوند.
توکنها
توکنها میتوانند به کوتاهی یک کاراکتر یا به بلندی یک کلمه (یا بخشی از یک کلمه) باشند. برای مثال:
– کلمه “فیل” ممکن است به عنوان یک توکن محاسبه شود.
– جمله “این GPT-4 است!” میتواند شامل شش توکن باشد: (“این”، “است”، “GPT”، “-“, “۴”، “!”).
به طور کلی، در متنهای انگلیسی، یک توکن بهطور تقریبی معادل ۴ کاراکتر یا ¾ کلمه است.
توکنهای ورودی
این توکنها همان توکنهایی هستند که شما هنگام ارسال درخواست به مدل ارسال میکنید. برای مثال، اگر شما یک درخواست مانند “یک شعر درباره هوش مصنوعی بنویس” ارسال کنید، هر کلمه (یا بخشی از یک کلمه) به عنوان یک توکن ورودی محاسبه میشود.
توکنهای خروجی
این توکنها، توکنهایی هستند که مدل به عنوان پاسخ به درخواست شما تولید میکند. اگر مدل با یک پاراگراف طولانی پاسخ دهد، هر کلمه (یا بخشی از یک کلمه) به عنوان یک توکن خروجی محسوب میشود.
تفاوت قیمت توکنهای ورودی و خروجی
در بسیاری از مدلهای زبانی، قیمت توکنهای ورودی و خروجی با هم متفاوت است. دلیل این تفاوت معمولاً به منابع محاسباتی برمیگردد که برای پردازش درخواست و تولید پاسخ مصرف میشود. تولید خروجی پیچیدهتر است و به محاسبات بیشتری نیاز دارد، بنابراین هزینه توکنهای خروجی معمولاً بالاتر است.
مثال
اگر هزینه هر ۱ میلیون توکن ورودی ۲۰ دلار و هر ۱ میلیون توکن خروجی ۴۰ دلار باشد و شما یک درخواست با ۲۰۰ توکن ورودی ارسال کنید و مدل با ۵۰۰ توکن خروجی پاسخ دهد، هزینه شما به صورت زیر محاسبه میشود:
قیمت توکن های وروردی : ۰.۰۰۴ = 100000/(۲۰*۲۰۰)
قیمت توکن های خروجی : ۰.۰۲۰ = 100000/(۴۰*۵۰۰)
قیمت کل به دلار : $ ۰.۰۲۴ = 0.۰۰۴+۰.۰۲۰
قیمت کل به ریال : قیمت کل به دلار ×قیمت دلار به ریال
لیست قیمت مدلهای زبانی بزرگ
این جدول شامل لیست قیمت مدلهای مختلف است و شما میتوانید برای بررسی دقیقتر هزینهها به لینک مربوط به هر مدل مراجعه کنید.
لینک بررسی قیمت | قیمت توکن خروجی
(برای هر ۱ میلیون توکن) |
قیمت توکن ورودی
(برای هر ۱ میلیون توکن) |
مدل زبانی |
https://openai.com/api/pricing/ | ۶۰ $ | ۳۰ $ | Chat GPT 4 |
۳۰ $ | ۱۰ $ | Chat GPT 4 Turbo | |
۱۵ $ | ۵ $ | Chat GPT 4O | |
۰.۶ $ | ۰.۱۵ $ | Chat GPT 4O mini | |
۱۲ $ | ۳ $ | Chat GPT O1 mini | |
https://www.anthropic.com/pricing | ۱۵ $ | ۳ $ | Claude 3.5 Sonnet |
۷۵ $ | ۱۵ $ | Claude 3 Opus | |
۱.۲۵ $ | ۰.۲۵ $ | Claude 3 Haiku | |
https://ai.google.dev/pricing | ۱۰ $ | ۲.۵ $ | Gemini 1.5 pro |
۰.۶ $ | ۰.۱۵ $ | Gemini 1.5 Flash | |
https://www.together.ai/pricing | ۰.۱۸ $ | ۰.۱۸ $ | LLAMA ۳.۱ 8B |
۰.۸۸ $ | ۰.۸۸ $ | LLAMA ۳.۱ 70B | |
۳.۵ $ | ۳.۵ $ | LLAMA ۳.۱ 405B | |
https://groq.com/pricing/ | ۰.۷۹ $ | ۰.۵۹ $ | LLAMA ۳ 70B |
در این پست، نحوه محاسبه هزینه استفاده از مدلهای زبانی بزرگ (LLM) را توضیح دادیم. هزینهها بر اساس تعداد توکنهای ورودی و خروجی محاسبه میشوند، و هر مدل زبانی ممکن است هزینههای متفاوتی برای توکنهای ورودی و خروجی داشته باشد. همچنین جدول قیمت مدلهای مختلف ارائه شد. لازم به ذکر است که تمامی قیمتها به دلار بوده و نرخ تبدیل دلار به ریال به نرخ روز بستگی دارد.
به دلیل پیچیدگیهای مرتبط با محاسبه هزینه ساخت دستیارهای هوشمند، این موضوع را بهطور مفصل در مقاله جداگانهای بررسی کردهایم. برای جزئیات بیشتر به لینک زیر مراجعه کنید: