Acelerador de IA para modelos ligeros de IA y tecnología de procesador embebido para permitir el procesamiento en tiempo real
Renesas Electronics Corporation ha anunciado el desarrollo de tecnología de procesador embebido que permite mayores velocidades y menor consumo de energía en unidades de microprocesador (MPU) que implementan IA de visión avanzada. Las tecnologías desarrolladas son las siguientes:
(1) un acelerador de IA basado en un procesador dinámicamente reconfigurable (DRP) que procesa de manera eficiente modelos de IA livianos y (2) tecnología de arquitectura heterogénea que permite el procesamiento en tiempo real mediante IP de procesador que operan de manera cooperativa, como el UPC. Renesas produjo un prototipo de AI-MPU integrada con estas tecnologías y confirmó su funcionamiento de alta velocidad y bajo consumo de energía. Logró un procesamiento hasta 16 veces más rápido (130 TOPS) que antes de la introducción de estas nuevas tecnologías, y una eficiencia energética de clase mundial (hasta 23,9 TOPS/W con un suministro de 0,8 V).
En medio de la reciente proliferación de robots en fábricas, logística, servicios médicos y tiendas, existe una necesidad creciente de sistemas que puedan funcionar de forma autónoma en tiempo real detectando el entorno mediante IA de visión avanzada. Dado que existen severas restricciones en la generación de calor, particularmente para dispositivos embebidos, en los chips de IA se requieren tanto un mayor rendimiento como un menor consumo de energía.
Las tecnologías desarrolladas por Renesas son las siguientes:
Un acelerador de IA que procesa eficientemente modelos de IA ligeros
Como tecnología típica para mejorar la eficiencia del procesamiento de IA, la poda está disponible para omitir cálculos que no afectan la precisión del reconocimiento. Sin embargo, es común que en los modelos de IA existan cálculos que no afectan la precisión del reconocimiento de forma aleatoria. Esto provoca una diferencia entre el paralelismo del procesamiento del hardware y la aleatoriedad de la poda, lo que hace que el procesamiento sea ineficiente.
Para resolver este problema, Renesas optimizó su exclusivo acelerador de IA basado en DRP (DRP-AI) para la poda. Al analizar cómo las características del patrón de poda y un método de poda se relacionan con la precisión del reconocimiento en modelos típicos de IA de reconocimiento de imágenes (modelos CNN), identificamos la estructura de hardware de un acelerador de IA que puede lograr tanto una alta precisión de reconocimiento como una tasa de poda eficiente, y aplicamos al diseño DRP-AI. Además, se desarrolló un software para reducir el peso de los modelos de IA optimizados para este DRP-AI. Este software convierte la configuración del modelo de poda aleatoria en computación paralela altamente eficiente, lo que resulta en un procesamiento de IA de mayor velocidad. En particular, la tecnología de soporte de poda altamente flexible de Renesas (tecnología de poda flexible N:M), que puede cambiar dinámicamente el número de ciclos en respuesta a cambios en la tasa de poda local en los modelos de IA, permite un control preciso de la tasa de poda según el consumo de energía, la velocidad de funcionamiento y la precisión de reconocimiento requeridos por los usuarios.
Esta tecnología reduce la cantidad de ciclos de procesamiento de modelos de IA a tan solo una decimosexta parte de la poda de modelos incompatibles y consume menos de una octava parte de la energía.
Tecnología de arquitectura heterogénea que permite el procesamiento en tiempo real para el control de robots
Las aplicaciones robóticas requieren un procesamiento avanzado de IA de visión para el reconocimiento del entorno circundante. Mientras tanto, el juicio y el control del movimiento del robot requieren una programación detallada de las condiciones en respuesta a los cambios en el entorno, por lo que el procesamiento de software basado en CPU es más adecuado que el procesamiento basado en IA. El desafío ha sido que las CPU con procesadores integrados actuales no son completamente capaces de controlar robots en tiempo real. Es por eso que Renesas introdujo un procesador dinámicamente reconfigurable (DRP), que maneja procesamiento complejo, además de la CPU y el acelerador de IA (DRP-AI). Esto llevó al desarrollo de una tecnología de arquitectura heterogénea que permite mayores velocidades y un menor consumo de energía en las AI-MPU mediante la distribución y paralelización de procesos de manera adecuada.
Un DRP ejecuta una aplicación mientras cambia dinámicamente la configuración de conexión del circuito entre las unidades aritméticas dentro del chip para cada reloj de operación de acuerdo con los detalles del procesamiento. Dado que, incluso en procesos complejos, sólo funcionan los circuitos aritméticos necesarios, es posible un menor consumo de energía y mayores velocidades. Por ejemplo, SLAM (localización y mapeo simultáneos), una de las aplicaciones robóticas típicas, es una configuración compleja que requiere múltiples procesos de programación para el reconocimiento de la posición del robot en paralelo con el reconocimiento del entorno mediante el procesamiento de IA visual. Renesas demostró el funcionamiento de este SLAM mediante la conmutación instantánea de programas con el DRP y el funcionamiento paralelo del acelerador de IA y la CPU, lo que da como resultado velocidades de funcionamiento aproximadamente 17 veces más rápidas y aproximadamente 12 veces mayor eficiencia energética operativa que la CPU integrada sola.
Verificación de operación
Renesas creó un prototipo de chip de prueba con estas tecnologías y confirmó que logró la eficiencia energética más alta de clase mundial de 23,9 TOPS por vatio con un voltaje de alimentación normal de 0,8 V para el acelerador de IA y una eficiencia energética operativa de 10 TOPS por vatio. para los principales modelos de IA. También demostró que el procesamiento de IA es posible sin ventilador ni disipador de calor.
La utilización de estos resultados ayuda a resolver la generación de calor debido al mayor consumo de energía, que ha sido uno de los desafíos asociados con la implementación de chips de IA en una variedad de dispositivos integrados, como robots de servicio y vehículos guiados automáticamente. Reducir significativamente la generación de calor contribuirá a la expansión de la automatización en diversas industrias, como los mercados de la robótica y la tecnología inteligente. Estas tecnologías se aplicarán a la serie RZ/V de Renesas: MPU para aplicaciones de visión artificial.
Articulos Electrónica Relacionados
- Módulo TFT de 9,0 pulgadas par... Hitachi Display Products Group (DPG) ofrece un nuevo módulo display TFT IPS (In-Plane Switching) de 9,0 pulgadas denominado TX23D86VM0BAA.La pantalla WXGA...
- Componentes y soluciones para ... Mouser Electronics, Inc. amplía su completa cartera de soluciones de domótica de una amplia variedad de fabricantes, como productos de NXP Semiconductors, Finge...
- LEDs y drivers de Rohm Semicon... Rohm Semiconductor anuncia su nueva familia SMLx de chips LED de alto brillo y baja corriente que se encuentra disponible en varios tamaños de encapsulado y gam...
- Compilador Microchip MPLAB® XC... El rápido crecimiento de los mercados de vehículos industriales y autónomos ha generado una creciente demanda de herramientas de software que permiten una codif...
- Nueva gama de 5 nuevos modelos... ROHM ha desarrollado MOSFET duales que integran dos chips de 100 V en un solo encapsulado, ideales para el accionamiento de motores de ventiladores utilizados e...
- Regulador de conmutación de 2A... La serie RECOM R-78K-2.0 es un económico y popular sustituto de los reguladores lineales de tres terminales con orificio pasante de la «serie 78». Estas piezas ...
- IGBT de 1350 V para aplicacion... Toshiba Electronics Europe GmbH ha anunciado un nuevo IGBT (insulated gate bipolar transistor) discreto de 1350 V para su uso en aplicaciones de electrodoméstic...
- El chip Gen2 UHF EM4124 de EM ... EM Microelectronic, empresa de semiconductores del Grupo Swatch y proveedor líder global de circuitos RFID, ha anunciado que EPCglobal®, Inc. ha concedido la ce...
- Transductores de corriente ais... LEM presenta la serie GHS: transductores en circuito integrado de tamaño miniatura para medida de corriente aislada CA y CC hasta 100 KHz.Estos nuevos co...
- Optoacopladores de accionamien... Avago Technologies ha anunciado dos nuevas series de dispositivos optoacopladores de accionamiento de puertas de alta velocidad: ACPL-P/W347 y ACPL-P/W349.Estos...
- Módulo gráfico rápido y comple... El EA-DIP180B 5NLWTP es un módulo de visualización de Electronic Assembly GmbH diseñado para su uso en controladores industriales. Ya que está equipado con una ...
- MOSFET super-junction de 600 V... ROHM ha añadido tres nuevos modelos, la serie R60xxRNx, a su gama PrestoMOS™ de MOSFET super-junction de 600 V. Estos dispositivos están optimizados para accion...