OpenAI está trazendo o1seu modelo de IA de “raciocínio”, até sua API, mas, para começar, apenas para determinados desenvolvedores.
A partir de terça-feira, o1 começará a ser implementado para desenvolvedores na categoria de uso “nível 5” da OpenAI, a empresa ditado. Para se qualificar para o Nível 5, os desenvolvedores devem gastar pelo menos US$ 1.000 com OpenAI e ter uma conta com mais de 30 dias desde o primeiro pagamento bem-sucedido.
O1 substitui o modelo de visualização o1 que já estava disponível na API.
Ao contrário da maioria da IA, os chamados modelos de raciocínio como o1 verificam-se efetivamente, o que os ajuda a evitar alguns dos erros que normalmente atrapalham os modelos. Como desvantagem, normalmente demoram mais para chegar a soluções.
Eles também são bastante caros, em parte porque exigem muitos recursos de computação para funcionar. OpenAI cobra US$ 15 para cada aproximadamente 750.000 palavras de análise e US$ 60 para cada aproximadamente 750.000 palavras que o modelo gera. Aquilo é 6x o custo do mais recente modelo “irracional” da OpenAI, GPT-4o.
O1 na API OpenAI é muito mais personalizável do que o1-preview, graças a novos recursos como chamadas de função (que permitem que o modelo se conecte a dados externos), mensagens do desenvolvedor (que permitem aos desenvolvedores instruir o modelo sobre o tom e estilo) e análise de imagem. Além de passeios estruturadoso1 também possui um parâmetro de API, “reasoning_effort”, que permite controlar quanto tempo o modelo “pensa” antes de responder a uma consulta.
OpenAI disse que a versão o1 na API e, em breve, a plataforma AI chatbot da empresa, Bate-papoGPT – é uma versão “nova pós-treinada” do o1. Comparado com o modelo o1 lançado No ChatGPT há duas semanas, este, “o1-2024-12-17”, melhora “áreas de comportamento do modelo com base no feedback”, disse OpenAI vagamente.
“Estamos implementando o acesso de forma incremental enquanto trabalhamos para expandir o acesso a níveis de uso adicionais e aumentar os limites de taxas”, escreveu a empresa em um comunicado. postagem no blog.
em um observação Em seu site, a OpenAI disse que o novo o1 deve fornecer “respostas mais completas e precisas”, especialmente para questões relacionadas a programação e negócios, e tem menos probabilidade de rejeitar solicitações incorretamente.
Em outras notícias relacionadas ao desenvolvimento na terça-feira, a OpenAI anunciou novas versões de seus mini modelos GPT-4o e GPT-4o como parte do API em tempo realAPI OpenAI para criar aplicativos com respostas de voz geradas por IA de baixa latência. Os novos modelos (“gpt-4o-realtime-preview-2024-12-17” e “gpt-4o-mini-realtime-preview-2024-12-17”), que possuem maior eficiência e confiabilidade de dados, também são mais barato. usar, disse OpenAI.
Falando em API em tempo real (sem trocadilhos), ela continua em beta, mas ganhou diversas novas capacidades, como respostas simultâneas fora de banda, que permitem a execução de tarefas em segundo plano, como moderação de conteúdo, sem interromper as interações. A API agora também oferece suporte a WebRTC, o padrão aberto para a construção de aplicativos de voz em tempo real para clientes baseados em navegador, smartphones e dispositivos de Internet das Coisas.
No que certamente não é coincidência, a OpenAI contratou o criador do WebRTC, Justin Uberti, no início de dezembro.
“Nossa integração WebRTC foi projetada para permitir interações contínuas e responsivas em condições do mundo real, mesmo com qualidade de rede variável”, escreveu OpenAI no blog. “Ele lida com codificação de áudio, streaming, supressão de ruído e controle de congestionamento.”
Na última atualização de terça-feira, a OpenAI ajustou as preferências de sua API de ajuste; A correspondência de preferências compara pares de respostas de um modelo para “ensinar” um modelo a distinguir entre respostas preferidas e “não preferenciais” às perguntas. E a empresa lançou uma versão beta de “acesso antecipado” para kits oficiais de desenvolvimento de software em Go e Java.