Ingeniería inversa del cerebro de la inspiración biológica a sistemas de visión, en un chip

Oct 2014

César Torres Huitzil

Inicio 


A pesar de los avances logrados en la construcción de computadoras sofisticadas y máquinas inteligentes, éstas no son competidoras reales —al menos, por ahora— para el cerebro humano en ciertas tareas de la vida cotidiana, tales como las relacionadas con percepción visual y auditiva o reconocimiento de patrones y aprendizaje.

Aunque no todos los sistemas inteligentes se basan en principios biológicos, la eficiencia, robustez y precisión observadas en ellos ha motivado una investigación profunda para elucidar estos mecanismos.

Si bien la comprensión del cerebro es aún uno de los desafíos más grandes, su organización y principios de representación, comunicación y procesamiento de información son una fuente de inspiración para el diseño de tecnologías emergentes y futuras.


Se sabe que el cerebro está organizado y procesa la información de una forma radicalmente diferente de una computadora, pues éste no ejecuta secuencialmente instrucciones codificadas en una unidad central de procesamiento; en cambio, activa concurrentemente conexiones o sinapsis entre una miríada de neuronas, como respuesta a los estímulos recibidos. Dado que cada activación puede considerarse equivalente a la ejecución de una instrucción y que el cerebro humano contiene alrededor de 100 mil millones de neuronas, cada una recibiendo conexiones de miles de otras neuronas, su capacidad computacional es excepcional.

Ingeniería neuromórfica



Fisiología, neurobiología, neurociencias computacionales y otras disciplinas afines han convergido en el desarrollo de modelos sofisticados para describir, tanto mecanismos neuronales elementales (escala microscópica) como comportamientos emergentes en el cerebro (escala macroscópica). Por otro lado, la ingeniería neuromórfica —término acuñado por el profesor Carver Mead, del Instituto Tecnológico de California (Caltech, EUA)— aplica este conocimiento al diseño dehardware especializado que imita, tanto la funcionalidad como la organización neuronal, a fin de realizar una gran cantidad de cómputos en intervalos de tiempo cortos y con un consumo de energía reducido.1 La figura 1muestra un diagrama conceptual del paradigma de la ingeniería neuromórfica, la cual desarrolla sistemas electrónicos y computacionales para resolver problemas específicos que, usualmente, implican una tarea sensomotora.


En un principio, las implementaciones de modelos neuronales se hacían en circuitos analógicos, los cuales manipulan señales continuas con un reducido consumo de energía; sin embargo, recientemente se han incorporado circuitos digitales, basados en señales discretas, a fin de proporcionar flexibilidad y escalabilidad a las implementaciones puramente analógicas. La capacidad de implementación digital está relacionada con el acceso a dispositivos reconfigurables; circuitos que integran miles de módulos de lógica digital con interconexiones configurables, cuya funcionalidad se define mediante metodologías de desarrollo de software.
El hardware reconfigurable es una buena opción para hacer prototipos e implementar sistemas neuromórficos, ya que permite definir arquitecturas de gran complejidad (paralelismo masivo, procesamiento jerárquico…), así como mecanismos de adaptación, plasticidad y aprendizaje —operaciones difíciles de lograr en una implementación puramente analógica—, en un chip.


Neuronas y potenciales de acción


Las neuronas tienen características fisiológicas muy complejas, pero se ha mostrado que éstas representan, comunican y procesan la información mediante pequeños pulsos eléctricos en el tiempo, conocidos como potenciales de acción. La figura 2 muestra el diagrama conceptual de una neurona y el perfil temporal típico de un pulso al ser disparado por ésta.


Los estímulos externos recibidos por una neurona son acumulados en el llamado potencial de membrana, el cual, al alcanzar un umbral, provoca que la neurona genere un pulso transmisible a otras neuronas en forma de mensajes o información procesada.

Al emitir el pulso, la neurona se polariza bruscamente; es decir, el potencial de membrana retorna a un valor mínimo y, en este estado, la neurona es incapaz de responder a los estímulos recibidos. Las sinapsis entre las neuronas permiten que los potenciales de acción pasen (y, en tal caso, esto ocurre por tratarse de sinapsis excitadoras) o no (sinapsis inhibidoras), de unas neuronas a otras. Las sinapsis permiten a las neuronas del sistema nervioso conectarse y formar circuitos o redes, para estimularse unas a otras; así, la suma de procesos de todos los microcircuitos neuronales genera el funcionamiento cerebral. La representación y comunicación de la información mediante pulsos es extremadamente eficiente, desde una perspectiva de hardware, pues reduce la cantidad de canales de comunicación necesarios para transmitir los pulsos, no satura los canales y permite lograr altas tasas de conectividad entre las neuronas. Este último aspecto es relevante, dado que es tanto el número de neuronas como la conectividad entre ellas lo que hace del cerebro una estructura enormemente eficiente y difícil de replicar a nivel de hardware.


Chips con visión neuromórfica


De entre todos los sentidos, la visión es uno de los más importantes para la supervivencia humana, por lo que una gran porción de nuestro cerebro se dedica al procesamiento de la información visual. En consecuencia, la ingeniería neuromórfica ha concentrado sus esfuerzos en el desarrollo de chips de percepción visual.2 

En nuestro equipo de trabajo —adscrito al Cinvestav, Tamaulipas, bajo el paradigma de la ingeniería neuromórfica— desarrollamos algunos proyectos, cuyo objetivo es la implementación compacta de módulos de control de locomoción, percepción visual y aprendizaje, que puedan ser integrados en un robot, a fin de proporcionarle autonomía e inteligencia. Si bien estos proyectos son parte de los esfuerzos de una comunidad de investigación a nivel mundial, el desarrollo propuesto aquí es innovador, pues busca que el hardware neuronal —sistema masivamente paralelo— sea flexible y capaz de reprogramarse, a fin de emular el proceso de aprendizaje.

En estos proyectos consideramos diferentes aspectos de percepción visual que permiten el análisis, en tiempo real, del ambiente visual del robot, tales como la estimación de movimiento3 y la segmentación e identificación de objetos,4 a partir de imágenes. En particular, se ha diseñado un circuito neuromórfico para la segmentación de objetos en una imagen, derivados de modelos que se basan en la codificación temporal y la sincronización de oscilaciones neuronales observadas en la corteza visual.


Segmentación de objetos, un caso de estudio



Un atributo fundamental de la percepción visual en el ser humano es la habilidad de agrupar elementos de una escena en objetos coherentes, también conocida como segmentación de objetos, de forma rápida y sin esfuerzo considerable. Si bien los mecanismos de organización de las percepciones en el cerebro son aún un misterio, estudios experimentales y teóricos han mostrado que neuronas presentes en regiones específicas de la corteza visual tienden a sincronizar su actividad (emisión de pulsos), al recibir estímulos con características similares en una imagen; esto es, las neuronas asociadas a pixeles de un mismo objeto tienden a sincronizarse.5

Uno de los modelos propuestos, basado en esta teoría de sincronización temporal, es la denominada red de osciladores de excitación local e inhibición global (LEGION, por sus siglas en inglés).6 LEGION, conceptualmente, consiste en una matriz de osciladores neuronales que, en términos simples, pueden considerarse como pares de neuronas mutuamente acopladas, donde cada oscilador recibe, como estímulo externo, un pixel de la imagen (figura 3). Los osciladores se agrupan mediante la sincronización de sus actividades gracias a conexiones locales con sus vecinos, y un grupo se diferencia de otros mediante inhibición global (objetos mostrados en colores diferentes en lafigura 3). 


En términos de implementación en hardware, una neurona es modelada como un circuito acumulador —que integra o acumula los estímulos de otras neuronas—, y como un comparador que genera un pulso, cuando el potencial de membrana alcanza un umbral determinado. El empleo de circuitos aritméticos relativamente simples, para modelar una neurona, da como resultado una implementación completamente paralela, en un mismo dispositivo reconfigurable, capaz de procesar secuencias de imágenes de baja resolución. 

La implementación del modelo LEGION puede usarse en diversas aplicaciones de visión por computadora y, gracias a su velocidad de procesamiento y área reducida, resulta atractivo para ser aplicado en sistemas de robótica móvil, particularmente, en tareas de navegación autónoma (figura 4). Más aún, esta implementación podría emplearse en proyectos prometedores, como los vehículos no tripulados y automóviles autónomos que se conduzcan solos de forma fiable en ambientes no controlados, o como parte esencial de un sistema de vigilancia, a partir del análisis de secuencias de imágenes.

En última instancia, la ingeniería neuromórfica intenta construir computación, como la del cerebro, para lograr otras implicaciones prácticas importantes, tales como el desarrollo de retinas artificiales orientadas, por ejemplo, a lograr que los ciegos recuperen parcialmente su visión, o el diseño de sistemas robóticos antropomórficos controlados por la actividad cerebral, para apoyar la rehabilitación de parapléjicos.

Los sistemas neuromórficos proporcionan nuevas perspectivas para el diseño de máquinas inteligentes, por lo que impulsan el análisis y la proyección de circuitos, capaces de modular funciones básicas del cerebro biológico, y replicar el proceso de percepción visual de modelos simplificados.

A pesar de los resultados alentadores, los chips descritos están aún muy lejos de la complejidad del cerebro humano, y lo más probable es que éstos se usen en colaboración con computadoras convencionales, para llevar a cabo tareas concretas; no obstante, sus alcances e implicaciones, en un futuro, se deben debatir e investigar, dado que la aplicación de este tipo de tecnologías en el mundo real, por ejemplo, en cuestiones militares, puede ser un tema sensible.

Curriculum

César Torres Huitzil es Maestro en Electrónica y Doctor en Ciencias computacionales, por el Instituto Nacional de Astrofísica, Óptica y Electrónica (INAOE) y realizó una estancia posdoctoral en Neurociencias computacionales en LORIA-INRIA, Grand Est, Francia. Ha sido docente e investigador en la BUAP, el INAOE y, actualmente, en el Cinvestav-Tamaulipas. Sus líneas de investigación son: visión por computadora, cómputo reconfigurable y sistemas biológicamente inspirados.




Referencias
1. C. A. Mead (1989). “Analog VLSI and Neural Systems”. Reading, MA: Addison-Wesley.

2. K. A. Boahen (2005). “Neuromorphic Microchips”. Sci. Am. 292, 56–63.

3. César Torres-Huitzil, Bernard Girau, Claudio Castellanos Sánchez (2005). “On-Chip Visual Perception of Motion: A Bio-Inspired Connectionist Model on FPGA”. Neural Networks (5-6): 557-565.

4. Bernard Girau, César Torres-Huitzil (2007). “Massively Distributed Digital Implementation of an Integrate-And-Fire LEGION Network for Visual Scene Segmentation”. Neurocomputing 70(7-9): 1186-1197.

5. DeLiang Wang (2005). “The Time Dimension for Scene Analysis”. Trans. Neur. Netw. 16, 6, noviembre, 1401-1426.

6. D. L. Wang y D. Terman (1995). “Locally Excitatory Globally Inhibitory Oscillator Networks”. IEEE Trans. Neural Net. 6: 283-286.



Fuente: CONACYT





Compartir en Google Plus

    Comentario Blogger
    Comentario Facebook

0 comentarios:

Publicar un comentario