Logotipo do Site Inovação Tecnológica





Informática

Novo algoritmo reconhece imagens diminuindo sua resolução

Redação do Site Inovação Tecnológica - 06/06/2008

Novo algoritmo reconhece imagens diminuindo sua resolução

[Imagem: Antonio Torralba]

Pesquisadores do MIT demonstraram que é necessário uma quantidade incrivelmente pequena de pixels para informar exatamente qual é o conteúdo de uma imagem.

A descoberta do novo algoritmo impactará diretamente áreas como a visão artificial e a identificação de imagens online por conteúdo, abrindo caminho também para que os robôs possam ter sistemas de visão mais parecidos com o sistema visual dos humanos.

Percepção contextual

Observe, por exemplo, a imagem ao lado. Dentro dos círculos vermelhos, você consegue ver uma garrafa, um telefone celular, uma pessoa e um sapato?

Na verdade, em todas elas, o que está dentro do círculo vermelho é o mesmo sapato. Os pesquisadores utilizaram esta imagem para demonstrar como o contexto afeta nossa percepção dos objetos. Algo com que o novo algoritmo consegue lidar.

Descrição minimalista

O trabalho de Antonio Torralba e seus colegas consiste em encontrar um conjunto de pixels em cada imagem que possa ser descrito pela menor representação numérica possível.

"Nós estamos tentando descobrir códigos muito curtos para [identificar] as imagens, de forma que, se duas imagens tiverem uma seqüência similar [de números], elas serão provavelmente similares - compostas aproximadamente do mesmo objeto, aproximadamente na mesma configuração," explica ele.

Para descobrir a menor quantidade de pixels necessários para identificar o que está representado em uma imagem, Torralba e seus colegas utilizaram uma técnica simples: eles foram reduzindo a resolução da imagem pouco a pouco e vendo quais objetos ainda era possível identificar à medida que a resolução caía.

"A quantidade de informação que você precisa para identificar a maioria das imagens é de cerca de 32 por 32 [pixels]," diz ele. Para comparação, a maioria dos chamados thumbnails, pequenas imagens mostradas em mecanismos de busca e índices de sites em geral, têm uma resolução de 100 por 100 pixels.

Utilização em robôs

Imagens comuns, como fotos tiradas por câmeras digitais, têm vários megapixels, sendo cada pixel representado por 24 bits. A enorme redução que os pesquisadores fizeram significa que milhões de imagens poderão ser procuradas em uma base de dados utilizando uma capacidade de processamento de um PC comum.

Ao contrário dos métodos similares, que quebram cada imagem em várias partes, a seguir analisadas individualmente, o novo algoritmo desenvolvido por Torralba e seus colegas usa a imagem inteira, sem qualquer pré-processamento, tornando-o mais adequado tanto para aplicação em grandes bases de dados, quanto para processar imagens utilizando baixo poder de processamento, como é comum em robôs.

Seguir Site Inovação Tecnológica no Google Notícias





Outras notícias sobre:
  • Visão Artificial
  • Software e Programação
  • Imagens 3-D
  • Armazenamento de Dados

Mais tópicos