TEG6
  • Início
  • Notícias
  • Review
  • Como fazer
Nenhum resultado
Exibir todos os resultados
TEG6
  • Início
  • Notícias
  • Review
  • Como fazer
Nenhum resultado
Exibir todos os resultados
TEG6
Nenhum resultado
Exibir todos os resultados

Quando se trata de modelos de linguagem grandes, você deve construir ou comprar?

por Redação
25 de janeiro de 2023
em Notícias
Quando se trata de modelos de linguagem grandes, você deve construir ou comprar?
9
Visualizações
CompartilharCompartilharCompartilhar

Tanmay Chopra
Contribuinte

Tanmay Chopra trabalha com aprendizado de máquina na startup de pesquisa de IA Neeva, onde ele organiza modelos de linguagem grandes e pequenos. Anteriormente, ele supervisionou o desenvolvimento de sistemas de ML globalmente para combater a violência e o extremismo no TikTok.

verão passado poderia só pode ser descrito como um “verão de IA”, especialmente com grandes modelos de linguagem fazendo uma entrada explosiva. Vimos enormes redes neurais treinadas em um enorme corpora de dados que podem realizar tarefas extremamente impressionantes, nada mais famoso do que o GPT-3 da OpenAI e seu mais novo e sensacional produto, o ChatGPT.

Empresas de todas as formas e tamanhos em todos os setores estão correndo para descobrir como incorporar e extrair valor dessa nova tecnologia. Mas o modelo de negócios da OpenAI não foi menos transformador do que suas contribuições para o processamento de linguagem natural. Ao contrário de quase todas as versões anteriores de um modelo principal, este não vem com pesos pré-treinados de código aberto – ou seja, as equipes de aprendizado de máquina não podem simplesmente baixar os modelos e ajustá-los para seus próprios casos de uso.

Em vez disso, eles devem pagar para usá-los como estão ou pagar para ajustar os modelos e depois pagar quatro vezes a taxa de uso como estão para empregá-los. Claro, as empresas ainda podem escolher outros modelos de código aberto.

Isso deu origem a uma antiga questão corporativa – mas totalmente nova para o ML: seria melhor comprar ou construir essa tecnologia?

É importante observar que não há uma resposta única para essa pergunta; Não estou tentando fornecer uma resposta abrangente. Pretendo destacar os prós e contras de ambas as rotas e oferecer uma estrutura que possa ajudar as empresas a avaliar o que funciona para elas, além de fornecer alguns caminhos intermediários que tentam incluir componentes de ambos os mundos.

Compra: rápido, mas com armadilhas claras

Embora a construção pareça atraente a longo prazo, ela requer liderança com forte apetite por risco, bem como cofres profundos para respaldar esse apetite.

Vamos começar com a compra. Há toda uma série de provedores de modelo como serviço que oferecem modelos personalizados como APIs, cobrando por solicitação. Essa abordagem é rápida, confiável e requer pouco ou nenhum gasto inicial de capital. Efetivamente, essa abordagem reduz os riscos dos projetos de aprendizado de máquina, especialmente para empresas que estão entrando no domínio, e requer conhecimento interno limitado além dos engenheiros de software.

Os projetos podem ser iniciados sem a necessidade de pessoal experiente em aprendizado de máquina, e os resultados do modelo podem ser razoavelmente previsíveis, visto que o componente ML está sendo adquirido com um conjunto de garantias em relação à saída.

Infelizmente, essa abordagem vem com armadilhas muito claras, principalmente entre as quais está a defensibilidade limitada do produto. Se você está comprando um modelo que qualquer um pode comprar e integrá-lo em seus sistemas, não é exagero supor que seus concorrentes podem alcançar a paridade de produtos com a mesma rapidez e confiabilidade. Isso será verdade, a menos que você possa criar um fosso upstream por meio de técnicas de coleta de dados não replicáveis ​​ou um fosso downstream por meio de integrações.

Além disso, para soluções de alto rendimento, essa abordagem pode ser extremamente cara em escala. Para contextualizar, o DaVinci da OpenAI custa US$ 0,02 por mil tokens. Presumindo de forma conservadora 250 tokens por solicitação e respostas de tamanho semelhante, você está pagando US$ 0,01 por solicitação. Para um produto com 100.000 solicitações por dia, você pagaria mais de US$ 300.000 por ano. Obviamente, aplicativos com muito texto (tentativa de gerar um artigo ou participar de um bate-papo) levariam a custos ainda maiores.

Você também deve levar em conta a flexibilidade limitada vinculada a essa abordagem: você usa os modelos como estão ou paga significativamente mais para ajustá-los. Vale lembrar que a última abordagem envolveria um período de “bloqueio” tácito com o provedor, pois os modelos ajustados serão mantidos sob custódia digital deles, não sua.

Construção: flexível e defensável, mas cara e arriscada

Por outro lado, construir sua própria tecnologia permite contornar alguns desses desafios.

Tags: comprarconstruirdevegrandeslinguagemmodelosQuandotratavocê

Gostaríamos de lhe enviar notificações com novidades, você pode cancelar a qualquer momento.

Você está inscrito.
  • Contato
  • Início
  • Política de privacidade
  • Sobre

© 2022 TEG6 - Tecnologia mobile de ponta a ponta TEG6.

Nenhum resultado
Exibir todos os resultados
  • Início
  • Notícias
  • Review
  • Como fazer

© 2022 TEG6 - Tecnologia mobile de ponta a ponta TEG6.

Este site usa cookies. Ao continuar a usar este site, você concorda com o uso de cookies.