
Um modelo neural chamado LaMa (grande mascara em Pintura) que remove parte da imagem selecionada por máscaras irregulares. Usando Robusta e rápidas convolução de Fourier, um princípio computacional que obtêm a percepção do campo para ser preenchido com uma consistência visual incrível.
O resultado é surpreendente, pois o modelo interpreta e cria um novo campo preenchido pro predição visual. Este modelo pula as previsões intermediarias para obter os resultados em apenas uma única etapa. A técnica adquire todo o contexto da imagem utilizando Rápida Convolução de Fourier, assim utilizando informações de todas as partes da imagem para preencher a mascara sob a imagem.
Sistemas modernos similares sofrem com grandes áreas ausentes, estruturas complexas e alta resolução. Esta técnica propões um novo método, baseado em uma nova arquitetura de rede de pintura com Rápida Convolução de Fourier. Esta rede se encontra no estado da arte e alcança um desempenho formidável mesmo em cenários desafiadores.
Paper: https://arxiv.org/abs/2109.07161
Fontes: https://github.com/cabelo/lama
