
OpenAI disponibiliza seu gerador de imagens aprimorado para desenvolvedores
A OpenAI disponibilizou a tecnologia por trás do seu novo recurso de geração de imagens aprimorado para o ChatGPT em sua API, permitindo que os desenvolvedores a integrem em seus aplicativos e serviços. O novo gerador de imagens da OpenAI, que foi lançado para a maioria dos usuários do ChatGPT no final de março, viralizou por sua capacidade de criar fotos realistas no estilo Ghibli e “bonecos de ação” de IA.
OpenAI torna seu gerador de imagens aprimorado disponível para desenvolvedores
A OpenAI anunciou na quarta-feira que trouxe a tecnologia por trás do novo recurso de geração de imagens aprimorado de seu ChatGPT para sua API, permitindo que os desenvolvedores integrem essa funcionalidade em seus aplicativos e serviços. O novo gerador de imagens da OpenAI, que foi lançado para a maioria dos usuários do ChatGPT no final de março, chamou a atenção por sua capacidade de criar fotos realistas no estilo Ghibli e “bonecos de ação” de IA.
O recurso de geração de imagens na API da OpenAI é alimentado por um modelo de IA chamado “gpt-image-1”. Este modelo multimodal nativo oferece a capacidade de criar imagens em diferentes estilos, seguir diretrizes personalizadas, aproveitar o conhecimento mundial e renderizar texto. Os desenvolvedores podem gerar várias imagens de uma vez usando o gpt-image-1 e controlar a qualidade da geração – e, portanto, a velocidade.
De acordo com a OpenAI, gpt-image-1 emprega as mesmas salvaguardas de segurança que a geração de imagem no ChatGPT, incluindo restrições que impedem o modelo de gerar conteúdo que viole as políticas da empresa. Os desenvolvedores podem controlar a sensibilidade da moderação, que pode ser definida como “automática” para filtragem padrão ou “baixa” para filtragem menos restritiva.
OpenAI destaca que todas as imagens criadas com gpt-image-1 são marcadas com metadados do C2PA para que possam ser identificadas como criadas por IA por plataformas e aplicativos compatíveis. O preço é de $5 por milhão de tokens de entrada para texto e $10 por milhão de tokens de entrada para imagens, além de $40 por milhão de tokens de saída para imagens.
Várias empresas, incluindo Adobe, Airtable, Wix, Instacart, GoDaddy, Canva e Figma, já estão utilizando ou experimentando o uso do gpt-image-1. O Figma Design da Figma, por exemplo, agora permite que os usuários gerem e editem imagens via gpt-image-1, enquanto a Instacart está testando o modelo para imagens de receitas e listas de compras.
Essa novidade da OpenAI abre portas para uma variedade de possibilidades em termos de criação de conteúdo visual com IA, destacando a importância crescente da integração de tecnologias de geração de imagens avançadas em aplicativos e serviços digitais.