Início Tecnologia Modelos de IA de ‘raciocínio’ tornaram-se uma tendência, para melhor ou para...

Modelos de IA de ‘raciocínio’ tornaram-se uma tendência, para melhor ou para pior

37
0

Chame isso de renascimento do raciocínio.

Nele após o lançamento do o1 da OpenAINo chamado modelo de raciocínio, houve uma explosão de modelos de raciocínio de laboratórios rivais de IA. No início de novembro, a DeepSeek, uma empresa de pesquisa de IA financiada por traders quantitativos, lançou uma prévia de seu primeiro algoritmo de raciocínio. DeepSeek-R1. Naquele mesmo mês, a equipe Qwen do Alibaba sem dormir o que ele afirma ser o primeiro desafiante “aberto” ao o1.

Então, o que abriu as comportas? Bem, por um lado, a busca por novas abordagens para aperfeiçoar a tecnologia de IA generativa. Como disse recentemente o meu colega Max Zeff relatadoAs técnicas de “força bruta” para expansão de modelos já não produzem as melhorias que produziam anteriormente.

Existe uma intensa pressão competitiva sobre as empresas de IA para manterem o atual ritmo de inovação. De acordo com De acordo com uma estimativa, o mercado global de IA atingirá 196,63 mil milhões de dólares em 2023 e poderá valer 1,81 biliões de dólares até 2030.

A OpenAI, por exemplo, afirmou que os modelos de raciocínio podem “resolver problemas mais difíceis” do que os modelos anteriores e representam uma mudança radical no desenvolvimento da IA ​​generativa. Mas nem todos estão convencidos de que os modelos de raciocínio são o melhor caminho a percorrer.

Ameet Talwalkar, professor associado de aprendizado de máquina na A Carnegie Mellon diz que considera a colheita inicial de modelos de raciocínio “bastante impressionante”. Ao mesmo tempo, porém, ele disse-me que iria “questionar os motivos” de qualquer pessoa que afirmasse com certeza saber até onde os modelos de raciocínio levarão a indústria.

“As empresas de IA têm incentivos financeiros para oferecer projeções otimistas sobre as capacidades das versões futuras da sua tecnologia”, disse Talwalkar. “Corremos o risco de focar míope em um único paradigma, e é por isso que é crucial que a comunidade de pesquisa em IA em geral evite acreditar cegamente no hype e nos esforços de marketing dessas empresas e, em vez disso, concentre-se em resultados concretos”.

Duas desvantagens dos modelos de raciocínio são que eles são (1) caros e (2) intensivos em energia.

Por exemplo, na API OpenAI, a empresa cobra US$ 15 para cada aproximadamente 750.000 palavras de análise e US$ 60 para cada aproximadamente 750.000 palavras que o modelo gera. Isso é 3 a 4 vezes o custo do mais recente modelo “sem raciocínio” da OpenAI. GPT-4o.

O1 está disponível na plataforma de chatbot baseada em IA da OpenAI, Bate-papoGPTgrátis e com limites. Mas no início deste mês, OpenAI inserido um nível o1 mais avançado, modo o1 pro, que custa impressionantes US$ 2.400 por ano.

“O custo geral do raciocínio (modelo de linguagem grande) certamente não está diminuindo”, disse Guy Van Den Broeck, professor de ciência da computação na UCLA, ao TechCrunch.

Uma das razões pelas quais os modelos de raciocínio custam tanto é porque eles exigem muitos recursos computacionais para serem executados. Ao contrário da maioria das IAs, o1 e outros modelos de raciocínio tentam verificar seu próprio trabalho à medida que o fazem. Isso os ajuda a evitar alguns dos armadilhas que geralmente atrapalham os modelos, com a desvantagem de que muitas vezes demoram mais para chegar a soluções.

A OpenAI imagina modelos de raciocínio futuros que “pensarão” por horas, dias ou até semanas. Os custos de utilização serão mais elevados, reconhece a empresa, mas os benefícios (de de baterias inovadoras a novos medicamentos contra o câncer – pode valer a pena.

A proposta de valor dos modelos de raciocínio atuais é menos óbvia. Costa Huang, pesquisador de aprendizado de máquina e engenheiro da organização sem fins lucrativos Ai2, observa que o1 Não é uma calculadora muito confiável.. E pesquisas superficiais nas redes sociais geram um número do modo pro o1 erros.

“Esses modelos de raciocínio são especializados e podem ter desempenho inferior em domínios gerais”, disse Huang ao TechCrunch. “Algumas limitações serão superadas mais cedo do que outras.”

Van den Broeck afirma que os modelos de raciocínio não funcionam atual raciocínio e, portanto, são limitados nos tipos de tarefas que podem realizar com sucesso. “O verdadeiro raciocínio funciona em todos os problemas, não apenas naqueles que são prováveis ​​(nos dados de treinamento de um modelo)”, disse ele. “Esse é o principal desafio que ainda precisa ser superado.”

Dado o forte incentivo do mercado para impulsionar os modelos de raciocínio, estes certamente melhorarão com o tempo. Afinal, não são apenas OpenAI, DeepSeek e Alibaba que estão investindo nesta nova linha de pesquisa em IA. Os capitalistas de risco e os fundadores de indústrias adjacentes são fundindo em torno da ideia de um futuro dominado pela IA racional.

No entanto, Talwalkar teme que grandes laboratórios controlem essas melhorias.

“Compreensivelmente, os grandes laboratórios têm razões competitivas para permanecerem secretos, mas esta falta de transparência prejudica gravemente a capacidade da comunidade científica de se envolver com estas ideias”, disse ele. “À medida que mais pessoas trabalham nesta direção, espero que (os modelos de raciocínio) avancem rapidamente. Mas embora algumas das ideias venham da academia, dados os incentivos financeiros aqui, eu esperaria que a maioria, se não todos, dos modelos fossem oferecidos por grandes laboratórios industriais como o OpenAI.”

Fuente

LEAVE A REPLY

Please enter your comment!
Please enter your name here