<<

Descanonização

09 de setembro de 2022



Meaning boxes (caixas de significados). É assim que programadores e engenheiros costumam chamar as áreas com marcações das imagens que treinam a chamada visão computacional. No artigo oficial do projeto Visual Genome, seus criadores chamam esse processo de selecionar regiões específicas de imagens de “canonização”. Isso me interessa, pois cria relações com a própria História da Arte e, no sentido mais estreito do termo, com a ideia de que estamos falando de um grupo de fiéis diante de materiais que foram beatificados.

Em 2021, o amigo/programador Bernardo Fontes e eu pensamos em uma maneira de “descanonizar” essas mesmas imagens. Com a ajuda fundamental da amiga/filósofa Caroline Carrion, escrevemos um ensaio para a revista Rosa sobre como essa experiência nos ajuda a entender o modo de “ver” de máquinas. Leia o texto completo aqui.

Alguns trechos:
“Quando o programador Bernardo Fontes propôs uma experiência em programação que invertesse o jogo da visão computacional, logo pensamos nos processos de engenharia reversa. Mas também numa imagem de um olho capaz de se movimentar em 180 graus, de modo que ele não enxergue mais o que está a sua frente, mas o interior daquela estrutura que faz o sujeito ver.

O código em Python utilizado nas imagens desse ensaio visual é capaz de identificar as seleções das áreas específicas das imagens que contenham rotulações — pequenas delimitações na imagem chamadas, por engenheiros e programadores, de “caixas de significados” (meaning boxes). Feita essa identificação, o comando criado por Fontes é realizar o inverso do que uma IA comercial faria: em vez de destacar essas regiões mais nobres das imagens, apagá-las por completo.

Os resultados são as sobras de imagens que não são importantes para a visão computacional — as carcaças, que podem ser entendidas, também, como as regiões onde essas imagens não receberam o trabalho humano (ou seja, onde o tagueamento não foi realizado pelos turkers). Essas carcaças podem não ser mesmo úteis para quem quer apenas entender o que se passa nas cenas. Mas, ao excluir o que se considera importante e destacar tudo aquilo que foi desconsiderado, essa experiência nos ajuda a entender algo para além das situações específicas ali retratadas.

A visão computacional é muito menos o processo complexo de ver e suas mediações múltiplas, e muito mais o processo de extrair, segmentar e descontextualizar. Nas imagens deste ensaio, vemos aquilo que profissionais envolvidos no processo de criação de conhecimento científico — dos programadores aos turkers e engenheiros computacionais — consideram sobressalente, excessivo, desnecessário.”



Falso Espelho/René Magritte/meaning box.