
A OpenAI introduziu uma nova funcionalidade ao ChatGPT, permitindo que os usuários criem imagens diretamente na plataforma. Esta integração, conhecida como “Imagens no ChatGPT”, incorpora o Sora, um gerador de imagens por inteligência artificial, que anteriormente era acessível apenas por meio de um site separado. Agora, usuários dos planos ChatGPT Plus, Pro, Team e Free podem acessar essa ferramenta, embora com algumas restrições para usuários do plano gratuito.
Inicialmente, o Sora foi desenvolvido para gerar vídeos, mas nesta fase, está focado exclusivamente na criação de imagens. A OpenAI não especificou o limite exato de uso para usuários gratuitos, mas indicou que será semelhante ao do DALL-E, com ajustes possíveis conforme a demanda.
Quais são os avanços técnicos na geração de imagens?
O modelo GPT-4o serve como base para o novo sistema de geração de imagens do ChatGPT. Este modelo oferece melhorias significativas na precisão dos detalhes visuais, especialmente na capacidade de manter relações corretas entre diferentes elementos da imagem. Este conceito, conhecido como “binding”, permite que o sistema produza imagens precisas mesmo quando solicitado a incluir múltiplos elementos com características distintas.
Outro avanço importante é a capacidade de renderizar textos dentro das imagens de forma mais coerente. Anteriormente, ferramentas de IA enfrentavam dificuldades para inserir palavras legíveis em criações visuais, mas a OpenAI aprimorou essa funcionalidade, garantindo que os textos gerados sejam mais claros e utilizáveis.
Como o Sora se diferencia de outros modelos de geração de imagens?
O método de geração de imagens do Sora difere dos modelos tradicionais, como o DALL-E, que utiliza um processo baseado em difusão. Em vez disso, o Sora adota um processo autoregressivo, criando imagens de forma sequencial. Este método pode ser responsável pela maior precisão na representação de elementos visuais e textuais.
Quais são as aplicações práticas do Sora no ChatGPT?

A OpenAI demonstrou várias aplicações práticas do Sora antes de seu lançamento. Entre os exemplos, estão diagramas científicos, histórias em quadrinhos com personagens consistentes e pôsteres informativos. A ferramenta também é útil para criar imagens com fundo transparente, como adesivos e logotipos, ampliando as possibilidades de uso para designers e criadores de conteúdo.
O conhecimento de mundo embutido na IA do ChatGPT permite que os usuários obtenham imagens precisas sem a necessidade de fornecer descrições detalhadas. Embora o tempo de geração de imagens seja maior em comparação com versões anteriores, a OpenAI considera essa troca benéfica devido à qualidade aprimorada das imagens.
Como a OpenAI está lidando com questões de segurança e uso indevido?
Para abordar preocupações relacionadas ao uso indevido de imagens geradas por IA, a OpenAI implementou medidas de segurança rigorosas. O sistema impede a criação de deepfakes sexuais e a remoção de marcas d’água, além de bloquear a geração de conteúdo ilegal. Todas as imagens geradas incluem metadados C2PA, um padrão que ajuda a identificar sua origem.
A OpenAI está desenvolvendo ferramentas para rastrear a proveniência das imagens, garantindo que os usuários possam utilizá-las de acordo com as políticas da empresa. A propriedade das imagens geradas é dos usuários, e a OpenAI continua a aprimorar suas salvaguardas para garantir um uso seguro e responsável da tecnologia.
O post OpenAI integra Sora ao ChatGPT! Imagens com qualidade superior apareceu primeiro em BM&C NEWS.