O acesso a grandes modelos de linguagem (LLMs) geralmente é feito por meio de interfaces de chat, como ChatGPT ou Copilot (anteriormente Bing Chat). Até mesmo navegadores como o Brave integraram LLMs em seus sistemas, como o Leo, que pode ser acessado em dispositivos Android. Este método envolve digitar manualmente uma consulta e aguardar que o sistema a processe.
No entanto, outra forma significativa de acessar LLMs é por meio de uma API de programação. Dependendo da sua preferência, você pode se comunicar com o modelo programaticamente usando linguagens como Python ou C e receber uma resposta. Você pode até acessar o ChatGPT via Python usando este método. No entanto, é importante observar que muitas dessas APIs não são gratuitas e exigem pagamento com base no uso.
Neste artigo, aprofundo a estrutura de custos dessas APIs, com foco no conceito de tokens, na diferença entre tokens de entrada e saída e nos LLMs mais econômicos para usar por meio de uma API.
Usando LLMs por meio de APIs
Por que você deseja acessar LLMs por meio de uma API em vez de uma interface de chat na web ou um aplicativo móvel? Existem inúmeras razões. Por exemplo, se você possui um sistema existente e deseja integrar recursos LLM, uma API permite que você faça isso. Você pode aplicar a tecnologia LLM aos seus bancos de dados ou sistemas de informação existentes chamando Python ou C para o LLM e recebendo uma resposta. Isso também é benéfico para a automação, que eu pessoalmente uso para tarefas como análise de texto, resumo, tradução ou geração de conteúdo.
Como são cobrados os preços das APIs de IA
Calvin Wankhede / Autoridade Android
O preço das APIs é por token. Um token não é uma palavra, mas uma parte de uma palavra. Isso ocorre porque os LLMs aprendem com o texto que recebem e podem identificar palavras raiz e suas variações. Para usuários de inglês, um token tem cerca de quatro caracteres ou três quartos de uma palavra. Para se ter uma ideia, 100 tokens equivalem a cerca de 75 palavras, uma ou duas frases equivalem a cerca de 30 tokens, um parágrafo equivale a cerca de 100 tokens e 1.500 palavras equivalem a cerca de 2.048 tokens.
O uso da API é cotado por milhão de tokens, com dois tipos de tokens: tokens de entrada e tokens de saída. Os tokens de entrada são os prompts e quaisquer dados que você fornece, enquanto os tokens de saída são responsáveis pelo conteúdo gerado pelo LLM.
O preço do token de entrada é crucial se o seu caso de uso exigir muitas entradas, como resumir grandes quantidades de texto ou analisar dados. O número de tokens de saída será grande se o seu caso de uso tiver muitos resultados, como criação de conteúdo, geração em massa, resumo ou tradução de idioma.
As APIs de IA mais acessíveis
O preço varia significativamente entre os diferentes LLMs. Por exemplo, Claude 3 Haiku é a API mais barata, custando US$ 0,25 por um milhão de tokens de entrada. Por outro lado, o ChatGPT 4 custa US$ 30 por um milhão de tokens de entrada, enquanto o ChatGPT 4 Turbo cobra US$ 10 por um milhão de tokens de entrada.
O preço do token de saída também varia, mas uma coisa permanece a mesma: Claude 3 Haiku ainda é o mais barato, custando US$ 1,25 por um milhão de tokens. Claude 3 OPA é o mais caro, exigindo US$ 75 por um milhão de tokens.
Veja a tabela abaixo para uma visão completa das APIs de IA mais baratas.
Modelo | Preço de entrada por milhão de tokens ($) | Preço de saída por milhão de tokens ($) |
---|---|---|
Modelo Claude 3 Haiku | Preço de entrada por milhão de tokens ($) 0,25 | Preço de saída por milhão de tokens ($) 1,25 |
Modelo Bate-papoGPT 3.5 | Preço de entrada por milhão de tokens ($) 0,5 | Preço de saída por milhão de tokens ($) 1,5 |
Modelo Mistral pequeno | Preço de entrada por milhão de tokens ($) 2 | Preço de saída por milhão de tokens ($) 6 |
Modelo Mistral Médio | Preço de entrada por milhão de tokens ($) 2.7 | Preço de saída por milhão de tokens ($) 8.1 |
Modelo Soneto de Cláudio 3 | Preço de entrada por milhão de tokens ($) 3 | Preço de saída por milhão de tokens ($) 15 |
Modelo Mistral Grande | Preço de entrada por milhão de tokens ($) 8 | Preço de saída por milhão de tokens ($) 24 |
Modelo Bate-papoGPT 4 Turbo | Preço de entrada por milhão de tokens ($) 10 | Preço de saída por milhão de tokens ($) 10 |
Modelo Fechar 3 trabalhos | Preço de entrada por milhão de tokens ($) 15 | Preço de saída por milhão de tokens ($) 75 |
Modelo Bate-papoGPT 4 | Preço de entrada por milhão de tokens ($) 30 | Preço de saída por milhão de tokens ($) 60 |
Concluindo, a escolha do LLM depende não só do preço, mas também da funcionalidade. Você precisa garantir que o LLM escolhido possa executar com eficácia as tarefas necessárias. Para informações ainda mais detalhadas sobre o assunto, confira o vídeo acima.