bukib
0 bukibs
Columbus, Ohio
Hora local: 17:33
Temperatura: °C
Probabilidade de chuva: %

Introdução ao Z-Image: Modelo de IA Chinesa de Código Aberto

O Z-Image é um modelo de IA de código aberto desenvolvido pela equipe Tongyi MAI do Alibaba Group, que consegue gerar imagens extremamente realistas com apenas 6 bilhões de parâmetros. Isso indica que o modelo tem uma “quantidade de conhecimento” impressionante, permitindo que ele entregue imagens de alta qualidade semelhantes às de modelos comerciais.

Características do Z-Image

O Z-Image é capaz de gerar imagens hiper-realistas com iluminação e textura refinadas, além de interpretar contexto cultural e semântico para representar desde lugares históricos até conceitos abstratos. Além disso, o modelo conta com um aprimorador de prompts que ajuda a lidar com comandos complexos e funciona em GPUs de consumo com menos de 16 GB de VRAM, tornando a tecnologia mais acessível.

Modelos do Z-Image

O projeto tem dois modelos: o Z-Image-Turbo e o Z-Image-Edit. O Z-Image-Turbo é focado na criação rápida e fiel de imagens a partir de texto, com suporte para palavras em chinês e inglês. Já o Z-Image-Edit é indicado para alterações em imagens já existentes, desde ajustes simples até mudanças completas de estilo.

  • O Z-Image-Turbo tem uma renderização bilíngue de textos em chinês e inglês, entregando resultados comparáveis a modelos fechados.
  • O Z-Image-Edit executa instruções complexas com precisão, como mudar expressão e pose de um personagem enquanto adiciona texto, mantendo consistência mesmo em grandes transformações.

Acessando o Z-Image

A forma mais simples de testar o modelo é pelo Hugging Face. Basta acessar o espaço oficial do Z-Image, aguardar a interface carregar, inserir o prompt em inglês no campo de texto, ajustar parâmetros de geração se necessário e clicar em “Generate” para gerar a imagem.

Este conteúdo pode conter links de compra.

Fonte: link