viernes, 8 de abril de 2011

Como se el procesamiento visual

La retina humana (la parte del ojo que convierte la luz recibida en señales electroquímicas) tiene alrededor de 100 millones de células sensibles a la luz. Por tanto, las imágenes de la retina contienen una enorme cantidad de información. En las tareas de procesamiento visual de alto nivel, como por ejemplo reconocer objetos, estimar tamaños y distancias, o calcular la trayectoria de un objeto en movimiento, el cerebro probablemente no usa todos los datos disponibles, ya que no parece tener suficientes neuronas dedicadas a ello. Así que los científicos han asumido durante mucho tiempo que el cerebro debe resumir de alguna manera el contenido de las imágenes de la retina, reduciendo así la cantidad de información de éstas antes de transferirlas a procesos mentales de mayor nivel.

La mayoría de los modelos sobre el reconocimiento humano de objetos asumen que lo primero que hace el cerebro con una imagen de la retina es identificar los bordes, es decir los límites entre las regiones con diferentes propiedades de reflexión de la luz, y ordenarlos de acuerdo con su alineación básica: horizontal, vertical y diagonal. A continuación, según esas teorías, el cerebro comienza a ensamblar estos rasgos en formas primitivas, registrando, por ejemplo, que en alguna parte del campo visual aparece un rasgo horizontal por encima de un rasgo vertical, o dos diagonales que se cruzan entre sí.

Después, a partir de estas formas primitivas, se construyen formas más complejas; por ejemplo cuatro elementos con forma de "L" y orientaciones diferentes pueden formar un cuadrado, y así sucesivamente, hasta que las formas construidas ya resultan identificables como rasgos de objetos conocidos.

[Img #1845]
(Foto: Christine Daniloff)
A pesar de que esto podría ser un buen modelo de lo que sucede en el centro del campo visual, probablemente sea menos aplicable a la periferia, donde la discriminación humana de los objetos es notablemente débil.

Ruth Rosenholtz, investigadora en el Departamento de Ciencias Cognitivas y del Cerebro del MIT (Instituto Tecnológico de Massachusetts), en Estados Unidos, ha creado un nuevo modelo matemático de cómo el cerebro realiza el citado resumen de datos. El modelo predice con exactitud que el sistema visual no puede realizar determinados tipos de tareas de procesamiento de imágenes, un buen indicio de que el modelo recrea con acierto algunos aspectos de la cognición humana y que también reproduce más fielmente que los modelos tradicionales el procesamiento cerebral de datos visuales.

El modelo de Rosenholtz incluye cálculos sobre muchas más cosas que la orientación de los rasgos; también tiene en cuenta las mediciones o estimaciones de parámetros tales como el tamaño, el brillo, el color y otros.