Google desenvolve Parti, um gerador de imagem de texto para fotorealismo

Além do Imagen, o Google tem outro gerador de imagem de texto chamado Parti, que também se esforça pelo fotorealismo, mas usando uma família diferente de modelos generativos.

O Pathways Autoregressive Text-to-Image (Parti) usa um modelo autorregressivo que pode “se beneficiar dos avanços em grandes modelos de linguagem”.

Em comparação, o Imagen usa a Diffusion, onde o modelo aprende a converter um padrão de pontos aleatórios em imagens.

A abordagem do Parti converte primeiro uma coleção de imagens em uma sequência de entradas de código, semelhante a peças de quebra-cabeça.

Um prompt de texto dado é então traduzido para essas entradas de código e uma nova imagem é criada.

Essa abordagem aproveita pesquisas e infraestrutura existentes para grandes modelos de linguagem, como o PaLM, e é fundamental para lidar com prompts de texto longos e complexos e produzir imagens de alta qualidade.

O Google descobriu que o Parti pode “gerenciar prompts longos e complexos” que:

  • Refletem com precisão o conhecimento do mundo;
  • São compostos por muitos participantes e objetos, com detalhes finos e interações;
  • Adere a um formato e estilo de imagem específicos.

O Google está explorando essa área e acredita que ferramentas como essas “podem desbloquear a criatividade conjunta humano/computador”.

O objetivo é trazer experiências de usuário baseadas nesses modelos para o mundo de maneira segura e responsável que inspire a criatividade.

O Google optou por não divulgar os “modelos, código ou dados do Parti para uso público sem mais salvaguardas em vigor”.

Todas as imagens são marcadas com uma marca d’água no canto inferior direito.

Via: 9to5Google

Comente!

You May Also Like