Início Tecnologia Parece que a OpenAI treinou Sora no conteúdo do jogo, e especialistas...

Parece que a OpenAI treinou Sora no conteúdo do jogo, e especialistas jurídicos dizem que isso pode ser um problema.

37
0

A OpenAI nunca revelou exatamente quais dados usou para treinar Sora, sua IA geradora de vídeo. Mas pelo que parece, pelo menos alguns dos dados podem vir de streams do Twitch e tutoriais de jogos.

Sora foi lançado na segunda-feira e tenho brincado um pouco com ele (na medida em que as questões de capacidade permitam). A partir de uma mensagem de texto ou imagem, Sora pode gerar vídeos de até 20 segundos em diversas proporções e resoluções.

Quando OpenAI primeiro revelado Sora em fevereiro aludiu ao treinamento da modelo em vídeos do Minecraft. Então, eu me perguntei, que outros jogos de videogame poderiam estar escondidos no conjunto de treinamento?

Muitos, ao que parece.

Sora pode gerar um vídeo do que é essencialmente um clone de Super Mario Bros. (se houver falhas):

Créditos da imagem:OpenAI

Você pode criar cenas de jogo de um jogo de tiro em primeira pessoa inspirado em Call of Duty e Counter-Strike:

Videogame OpenAI Sora
Créditos da imagem:OpenAI

E você pode mostrar um clipe mostrando um lutador de arcade no estilo de um jogo Teenage Mutant Ninja Turtle dos anos 90:

Videogame OpenAI Sora
Créditos da imagem:OpenAI

Sora também parece entender como deveria ser uma transmissão do Twitch, o que implica que ele viu alguns. Dê uma olhada na captura de tela abaixo, que está amplamente correta:

Videogame OpenAI Sora
Uma captura de tela de um vídeo gerado com Sora.Créditos da imagem:OpenAI

Outra coisa que vale a pena mencionar sobre a captura de tela: ela mostra a imagem do popular streamer do Twitch Raúl Álvarez Genes, que atende pelo nome de Auronplay, até a tatuagem no antebraço esquerdo de Genes.

Auronplay não é o único streamer do Twitch que Sora parece “conhecer”. Ele gerou um vídeo de um personagem de aparência semelhante (com algumas liberdades artísticas) a Imane Anys, mais conhecido como Pokimane.

Videogame OpenAI Sora
Créditos da imagem:OpenAI

Claro, tive que ser criativo com algumas das instruções (por exemplo, “Jogo do encanador italiano”). A OpenAI implementou filtros para tentar evitar que Sora gere clipes representando personagens de marca registrada. Se você digitar algo como “Jogo Mortal Kombat 1”, por exemplo, não obterá nada próximo ao título.

Mas meus testes sugerem que o conteúdo do jogo pode ter chegado aos dados de treinamento de Sora.

A OpenAI tem sido cautelosa sobre de onde obtém os dados de treinamento. em um entrevista Falando ao The Wall Street Journal em março, a então CTO da OpenAI, Mira Murati, não negaria abertamente que Sora recebeu treinamento em conteúdo do YouTube, Instagram e Facebook. e no especificações técnicas Para Sora, a OpenAI reconheceu que usou dados “disponíveis publicamente”, juntamente com dados licenciados de bibliotecas de mídia como a Shutterstock, para desenvolver o Sora.

A OpenAI também não respondeu a um pedido de comentário.

Se o conteúdo do jogo estiver realmente no conjunto de treinamento do Sora, isso poderá ter implicações legais, especialmente se a OpenAI construir experiências mais interativas em cima do Sora.

“As empresas que treinam com imagens de videogame não licenciadas correm muitos riscos”, disse Joshua Weigensberg, advogado de propriedade intelectual da Pryor Cashman, ao TechCrunch. “Treinar um modelo generativo de IA normalmente envolve copiar os dados de treinamento. “Se esses dados forem reprodução de vídeo de jogos, há uma boa chance de que materiais protegidos por direitos autorais sejam incluídos no conjunto de treinamento.”

Modelos probabilísticos

Modelos generativos de IA como Sora são probabilísticos. Treinados com uma grande quantidade de dados, eles aprendem padrões nesses dados para fazer previsões; por exemplo, que uma pessoa que morde um hambúrguer deixará uma marca de mordida.

Esta é uma propriedade útil. Permite que os modelos “aprendam” como o mundo funciona, até certo ponto, observando-o. Mas também pode ser um calcanhar de Aquiles. Quando solicitados de forma específica, os modelos (muitos dos quais são treinados em dados públicos da web) produzem quase cópias de seus exemplos de treinamento.

Videogame OpenAI Sora
Uma amostra de Sora. Créditos da imagem:OpenAI

Isso incomodou compreensivelmente os criadores cujos trabalhos foram incluídos na programação sem sua permissão. Um número crescente procura soluções através do sistema judicial.

Microsoft e OpenAI estão atualmente sendo réu por supostamente permitir que suas ferramentas de IA regurgitassem código licenciado. Três empresas por trás dos populares aplicativos artísticos de IA, Midjourney, Runway e Stability AI, estão no mercado. mira de um caso que os acusa de violar os direitos dos artistas. E as grandes gravadoras têm ação movida contra duas startups que desenvolvem geradores de música com tecnologia de IA, Udio e Suno, por infração.

Muitas empresas de IA há muito reivindicam proteções de uso justo, alegando que seus modelos criam um trabalho transformador, e não plágio. Suno argumenta, por exemplo, que o treinamento indiscriminado não é diferente de “uma criança escrever suas próprias canções de rock depois de ouvir o gênero”.

Mas há certas considerações únicas em relação ao conteúdo do jogo, diz Evan Everist, advogado de direitos autorais da Dorsey & Whitney.

“Os vídeos de jogo envolvem pelo menos duas camadas de proteção de direitos autorais: o conteúdo do jogo como propriedade do desenvolvedor do jogo e o vídeo exclusivo criado pelo jogador ou cinegrafista que captura a experiência do jogador”, disse Everist ao TechCrunch por e-mail. “E para alguns jogos, existe uma potencial terceira camada de direitos na forma de conteúdo gerado pelo usuário que aparece no software.”

Everist deu o exemplo da Epic quinze diasque permite aos jogadores criar seus próprios mapas de jogo e compartilhá-los para outros usarem. Uma renderização em vídeo de um desses mapas afetaria nada menos que três detentores de direitos autorais, disse ele: (1) Epic, (2) a pessoa que usa o mapa e (3) o criador do mapa.

Videogame OpenAI Sora
Uma amostra de Sora. Créditos da imagem:OpenAI

“Se os tribunais declararem responsabilidade de direitos autorais para o treinamento de modelos de IA, cada um desses detentores de direitos autorais seriam potenciais demandantes ou licenciantes”, disse Everist. “Para qualquer desenvolvedor que treine IA nesses tipos de vídeos, a exposição ao risco é exponencial.”

Weigensberg observou que os próprios jogos têm muitos elementos “protegíveis”, como texturas proprietárias, que um juiz poderia considerar em um processo de propriedade intelectual. “A menos que essas obras sejam devidamente licenciadas”, disse ele, “o treinamento nelas pode violar os regulamentos”.

O TechCrunch entrou em contato com vários estúdios e editores de jogos para comentar, incluindo Epic, Microsoft (proprietária do Minecraft), Ubisoft, Nintendo, Roblox e o desenvolvedor Cyberpunk CD Projekt Red. Poucos responderam e nenhum quis dar uma declaração oficial.

“Não poderemos participar de uma entrevista neste momento”, disse um porta-voz da CD Projekt Red à EA ao TechCrunch que “não tinha comentários neste momento”.

Passeios arriscados

É possível que as empresas de IA vençam estas disputas legais. Os tribunais podem decidir que a IA generativa tem um “propósito transformador altamente convincente”, seguindo o precedente ambientado há cerca de uma década no processo da indústria editorial contra o Google.

Nesse caso, um tribunal decidiu que a cópia de milhões de livros pelo Google para o Google Books, um tipo de arquivo digital, era permitida. Autores e editores tentaram argumentar que a reprodução da sua propriedade intelectual online constituía uma violação.

Mas uma decisão a favor das empresas de IA não protegeria necessariamente os utilizadores de acusações de irregularidades. Se um modelo generativo regurgitasse uma obra protegida por direitos de autor, uma pessoa que depois publicasse essa obra (ou a incorporasse noutro projecto) ainda poderia ser responsabilizada por violação de propriedade intelectual.

“Os sistemas generativos de IA muitas vezes resultam em ativos de propriedade intelectual reconhecíveis e protegíveis”, disse Weigensberg. “Sistemas mais simples que geram texto ou imagens estáticas muitas vezes têm problemas em evitar a geração de material protegido por direitos autorais em sua produção, portanto sistemas mais complexos podem ter o mesmo problema independentemente das intenções dos programadores”.

Videogame OpenAI Sora
Uma amostra de Sora. Créditos da imagem:OpenAI

Algumas empresas de IA têm cláusulas de compensação para cobrir essas situações, caso elas surjam. Mas as cláusulas muitas vezes contêm exceções. Por exemplo, OpenAI Aplica-se apenas a clientes corporativos. – não usuários individuais.

Há também outros riscos além dos direitos autorais a serem considerados, diz Weigensberg, como a violação de direitos de marca registrada.

“O resultado também poderia incluir ativos que são usados ​​em conexão com marketing e branding, incluindo personagens de jogos reconhecíveis, criando risco de marca”, disse ele. “Ou o resultado pode criar riscos aos direitos de nome, imagem e semelhança”.

O crescente interesse em modelos mundiais poderia complicar tudo isso ainda mais. Uma aplicação dos modelos mundiais, que a OpenAI considera Sora, é essencialmente gerar videogames em tempo real. Se esses jogos “sintéticos” se assemelharem ao conteúdo no qual o modelo foi treinado, isso pode ser legalmente problemático.

“Treinar uma plataforma de IA com vozes, movimentos, personagens, músicas, diálogos e arte de um videogame constitui violação de direitos autorais, assim como aconteceria se esses elementos fossem usados ​​em outros contextos”, disse Avery Williams, advogado de litígios de propriedade intelectual da McKool. . Smith disse. “As questões de uso justo que surgiram em tantos processos judiciais contra empresas de IA generativa afetarão a indústria de videogames tanto quanto qualquer outro mercado criativo”.

Fuente

LEAVE A REPLY

Please enter your comment!
Please enter your name here