Início Tecnologia Nvidia lança marca própria de modelos globais

Nvidia lança marca própria de modelos globais

17
0

Nvidia está se envolvendo modelos mundiais – Modelos de IA inspirados nos modelos mentais do mundo que os humanos desenvolvem naturalmente.

Na CES 2025 em Las Vegas, a empresa anunciou que está disponibilizando abertamente uma família de modelos globais que podem prever e gerar vídeos “conscientes da física”. A Nvidia chama essa família de Cosmos World Foundation Models, ou Cosmos WFM, para abreviar.

Os modelos, que podem ser ajustados para aplicações específicas, estão disponíveis nos catálogos API e NGC da Nvidia, no GitHub e na plataforma de desenvolvimento de IA Hugging Face.

“A Nvidia está disponibilizando a primeira onda de Cosmos WFM para simulação baseada em física e geração de dados sintéticos”, escreveu a empresa em uma postagem de blog fornecida ao TechCrunch. “Pesquisadores e desenvolvedores, independentemente do tamanho de sua empresa, podem usar livremente os modelos Cosmos sob a licença permissiva de modelo aberto da Nvidia que permite o uso comercial.”

Saída de um dos modelos Cosmos World Foundation da Nvidia.Créditos da imagem:NVIDIA

Existem vários modelos na família Cosmos WFM, divididos em três categorias: Nano para aplicações de baixa latência e em tempo real, Super para modelos “básicos de alto desempenho” e Ultra para resultados de máxima qualidade e fidelidade.

Os modelos variam em tamanho de 4 bilhões a 14 bilhões de parâmetros, sendo o Nano o menor e o Ultra o maior. Os parâmetros correspondem aproximadamente às habilidades de resolução de problemas de um modelo, e modelos com mais parâmetros geralmente têm melhor desempenho do que aqueles com menos parâmetros.

Como parte do Cosmos WFM, a Nvidia também está lançando um “modelo de upsampling”, um decodificador de vídeo otimizado para realidade aumentada e modelos de guardrail para garantir o uso responsável, bem como modelos ajustados para aplicações como a geração de dados de sensores para o desenvolvimento de veículos autônomos. . Estes, assim como os outros modelos Cosmos WFM, foram treinados em 9.000 trilhões de tokens de 20 milhões de horas de interações humanas, ambientais, industriais, robóticas e de direção do mundo real, disse a Nvidia. (Na IA, “tokens” representam bits de dados brutos; neste caso, sequências de vídeo.)

A Nvidia não disse de onde vieram esses dados de treinamento, mas pelo menos um relatório, e ação judicialalega que a empresa treinou vídeos do YouTube protegidos por direitos autorais sem permissão.

Quando contatado para comentar, um porta-voz da Nvidia disse ao TechCrunch que o Cosmos “não foi projetado para copiar ou infringir qualquer trabalho protegido”.

“O cosmos aprende assim como as pessoas aprendem”, disse o porta-voz. “Para ajudar a Cosmos a aprender, recolhemos dados de uma variedade de fontes públicas e privadas e estamos confiantes de que a nossa utilização de dados é consistente tanto com a letra como com o espírito da lei. Os dados sobre como o mundo funciona (que é o que os modelos do Cosmos aprendem) não são protegidos por direitos autorais nem estão sujeitos ao controle de qualquer autor ou empresa individual.”

Deixando de lado o fato de que modelos como o Cosmos Você realmente não aprende como as pessoas aprendem.dizem especialistas em direitos autorais, afirmações como as da Nvidia, que são apoiadas por doutrina jurídica do uso justo, pode não resistir ao escrutínio judicial. A vitória destas empresas dependerá em grande parte da forma como os tribunais decidirem sobre a utilização justa, que permite a utilização de obras protegidas por direitos de autor para criar algo novo, desde que seja transformador, e se aplique à formação em IA.

A Nvidia disse que os modelos Cosmos WFM, com quadros de texto ou vídeo, podem gerar dados sintéticos controláveis ​​​​e de “alta qualidade” para iniciar o treinamento de modelos para robótica, carros autônomos e muito mais.

Modelos Nvidia Cosmos WFM
O Cosmos pode simular ambientes realistas, como chão de fábrica, de acordo com a Nvidia.Créditos da imagem:NVIDIA

“O conjunto de modelos abertos do Nvidia Cosmos significa que os desenvolvedores podem personalizar WFMs com conjuntos de dados, como gravações de vídeo de viagens de veículos autônomos ou robôs navegando em um armazém”, escreveu a Nvidia em um comunicado à imprensa. “O Cosmos WFM foi projetado especificamente para pesquisa e desenvolvimento de IA em física e pode gerar vídeos baseados em física a partir de uma combinação de entradas, como texto, imagens e vídeo, bem como sensores de robôs ou dados de movimento”.

A Nvidia disse que empresas como Waabi, Wayve, Fortellix e Uber já se comprometeram a testar o WFM Cosmos para vários casos de uso, desde pesquisa e curadoria de vídeos até a construção de modelos de IA para veículos autônomos.

“A IA generativa impulsionará o futuro da mobilidade, exigindo dados ricos e computação muito poderosa”, disse o CEO da Uber, Dara Khosrowshahi, em comunicado. “Ao trabalhar com a Nvidia, estamos confiantes de que podemos ajudar a acelerar o cronograma para soluções de direção autônoma seguras e escaláveis ​​para a indústria”.

É importante notar que os modelos globais da Nvidia não são “código aberto” no sentido mais estrito. Para conhecer um definição amplamente aceita No caso de IA de “código aberto”, um modelo de IA deve fornecer informações suficientes sobre seu design para que uma pessoa possa recriá-lo “substancialmente” e revelar quaisquer detalhes relevantes sobre seus dados de treinamento, incluindo de onde vieram e como podem ser usado. licenciado.

A Nvidia não publicou os detalhes dos dados de treinamento do Cosmos WFM nem disponibilizou todas as ferramentas necessárias para recriar os modelos do zero. É provavelmente por isso que a gigante da tecnologia se refere aos modelos como “abertos” em vez de código aberto.

“Realmente esperamos que (Cosmos) faça pelo mundo da robótica e da IA ​​​​industrial o que Llama… fez pelas empresas”, disse o CEO da Nvidia, Jensen Huang, no palco durante um evento para a imprensa na segunda-feira.

Fuente

LEAVE A REPLY

Please enter your comment!
Please enter your name here