Cámaras que sustituirán al fotógrafo están en camino

Por: Confidencial Colombia | Julio 7, 2014

Hubiese sido difícil imaginar hace 10 años que hoy haríamos fotos con cámaras que reconocen por su nombre a las personas que fotografiamos, sin embargo, hoy no parece descabellado pensar que en unos años la cámara podrá identificar los elementos de una escena para ayudarnos a mejorar la foto o el vídeo que deseamos captar.

Incluso es posible que aparezcan cámaras que logren ser lo suficientemente listas como para hacer alguna que otra foto por sí mismas. Parece ciencia ficción pero ya hay científicos que trabajan para que algo así sea realidad.

 

Para conocer las tecnologías que logran que una máquina entienda lo que aparece en una imagen, dos especialistas hablaron con El Confidencial sobre el tema. 

 

Cámaras que reconocen más que caras

 

¿Para qué sirve algo así? Es difícil decirlo, pero hallazgos como ese pueden son los que pueden terminar cambiando completamente nuestros hábitos a la hora de crear y ver imágenes.

 

Florent Perronnin, quien trabaja en el departamento Computer Vision del centro de desarrollo de Xerox en Europa, comentó que entre las investigaciones en las que participa se encuentra una iniciada hace años que busca determinar lo qué nos resulta atractivo de una imagen.

 

Para ello “se utiliza una base de datos y tecnología de seguimiento ocular con un gran número de personas que han visto muchas imágenes. Con esta base de datos hemos entrenado a Machine Learning, un algoritmo para distinguir entre los elementos de la imagen que llaman la atención y los que no lo hacen”. Para entender el alcance de esta investigación basta con decir que han tenido que usar una supercomputadora con 20.000 procesadores para imitar la estructura del sistema nervioso humano.

 

Entre las aplicaciones prácticas de esta tecnología están la robótica, la videovigilancia, la clasificación de los elementos que aparecen en vídeos y la comprensión de escenas por parte de una máquina. Al preguntarle si también puede ser útil en cámaras fotográficas Perronnin afirma que sí: “Las cámaras a menudo contienen algoritmos que se centran de forma automática en los rostros. Las del futuro podrían hacer algo similar con elementos de imagen más complejos. Podría sugerir modificaciones tales como atenuar el contraste con el fin de hacer un elemento de imagen determinada destaque para llamar la atención”.

 

Relacionar imágenes con palabras clave

 

Eleonora Vig, una científica que trabaja en el mismo centro que Florent Perronnin, estudia de que forma un ordenador puede ser capaz de analizar los elementos de una imagen para clasificarla en función de palabras clave. Estos son para ella los retos a los que se enfrenta una investigación de ese tipo.

 

“Los humanos son muy buenos en la comprensión de las imágenes representadas como matrices de píxeles RGB, pero este no es el caso de las computadoras. Para entender las imágenes, las computadoras necesitan una representación que es más semántica. Esta representación debe describir fielmente el rico contenido de las imágenes. Debe ser muy precisa en el sentido de que no debe variar pese a factores tales como el punto de vista o de las condiciones de iluminación”.

 

Los humanos son muy buenos en la comprensión de las imágenes representadas como matrices de píxeles RGB, pero este no es el caso de las computadoras. Para entender las imágenes, las computadoras necesitan una representación que es más semántica.

 

¿Cómo puede lograrse algo así? “Desarrollamos tecnologías de alta precisión que pueden describir exhaustivamente el contenido de las imágenes usando miles de palabras clave. Por lo tanto, nuestra tecnología es complementaria a los metadatos proporcionados por las cámaras (...) Utilizamos una tecnología patentada que llamamos vectores de Fisher. En pocas palabras esto implica primero modelar lo que es el contenido típico de cualquier imagen y ver que es lo que hace diferente a una imagen concreta”.

 

Las aplicaciones prácticas de esta investigación de momento se limitan al terreno industrial. Vig cita como ejemplos la clasificación de documentos en función de su contenido al escanearlos, en el sector del transporte diferenciar diferentes clases de vehículos y en el comercio para saber si un determinado producto está agotado en un estante.

 

El lado oscuro de las tecnologías de reconocimiento de objetos son que estas pueden usarse para que empresas y gobiernos se entrometan aún más en nuestra privacidad. Así que quizá los robots nos den en el futuro clases de fotografía, pero también es posible que algún día sea difícil dar un paseo por la calle sin que una cámara sepa dónde estamos para controlarnos o vendernos la moto a la carta, como sucedía en la película Minority Report.

 

 

Con información de El confidencial


Tags

Comentarios