A Microsoft começou a lançar o Image Creator do Microsoft Bing em uma prévia para selecionar mercados, preparando o gerador de arte de IA para um lançamento mais amplo no Microsoft Edge ainda este mês. Em uma postagem no blog e um vídeo relacionado, a empresa mostrou como o Image Creator funcionará e explicou com mais detalhes quais limitações ele colocará nos prompts gerados pelos usuários.
A Microsoft disse na semana passada que traria arte de IA para Bing e Edge, usando o algoritmo DALL-E 2 mais avançado para gerar a arte. Parece que o Image Creator estará acessível no Bing.com e uma versão relacionada estará disponível no Edge logo depois. A empresa exibiu o Image Creator trabalhando na barra lateral do Edge, que pode criar uma pequena coluna vertical para exibir resultados de pesquisa e outras informações, além de alguns utilitários úteis. É aqui que você poderá acessar o novo criador de imagens.
Em um vídeo, a Microsoft mostrou como os usuários podem gerar um prompt, usando termos convencionais como estilos de arte. No vídeo abaixo, você pode ver o Image Creator retornar quatro pequenos resultados em questão de apenas alguns segundos. Não está claro se isso será representativo do desempenho geral. Também não está claro se haverá algum tipo de sistema de crédito ou outro medidor para limitar a geração imediata.
Da mesma forma, a Microsoft também exibiu o Image Creator em execução no Edge.
Aqui, a abordagem da Microsoft é mais social: o exemplo mostrado é de um usuário conceitualizando uma “casa dos sonhos” usando as ferramentas de criação de conteúdo do Image Creator e depois compartilhando nas mídias sociais. Novamente, a imagem apareceu em questão de segundos e quatro imagens foram geradas.
A postagem no blog da Microsoft implicava que as ferramentas de geração de arte de IA funcionariam de maneira semelhante a outros serviços, como Midjourney ou DreamStudio, executados na nuvem do Azure. “Descobrimos que, geralmente, o Image Creator funciona melhor quando você digita uma descrição de algo, com contexto adicional, como localização ou o estilo de arte que você gostaria de imitar, em oposição a uma descrição mais limitada”, disse a Microsoft.
A Microsoft também usará IA para filtrar consultas, aplicando o mesmo tipo de sinal que ajuda o Microsoft Defender a filtrar sites problemáticos, por exemplo. Essas listas de bloqueio e classificadores serão usados para “reduzir o risco de uso de prompts ofensivos”, disse a Microsoft.
Curiosamente, a Microsoft também está aplicando tecnologia adicional para lidar com os vieses encontrados na geração de imagens de IA. (A Microsoft não esclareceu o que isso significa, embora, de forma anedótica, certos prompts genéricos pareçam favorecer resultados com certas cores de pele.)
“Levamos a sério nosso compromisso com a IA responsável”, disse a Microsoft. “Para ajudar a evitar a entrega de resultados inadequados no aplicativo Designer e no Image Creator, estamos trabalhando em conjunto com nosso parceiro OpenAI, que desenvolveu o DALL∙E 2, para tomar as medidas necessárias e continuar a evoluir nossa abordagem. Receberemos regularmente o feedback que temos e compartilharemos isso com a OpenAI para melhorar o modelo e aplicar em nosso próprio trabalho de mitigação.”
A Microsoft disse que suas gerações de imagens seriam regidas por sua política de conteúdo, que impede imagens de abuso sexual infantil, atividade íntima não consensual, suicídio, terrorismo, discurso de ódio e muito mais.
Link do Autor
