Unité de décalage et d’accumulateur à économie de surface et d’énergie pour la détection d’objets dans les applications IoT

Les réseaux de neurones convolutifs (CNN) présentent des améliorations significatives des performances dans plusieurs tâches d’apprentissage automatique telles que la surveillance, le transport intelligent, les réseaux intelligents et les systèmes de santé. Avec la prolifération des objets physiques connectés à Internet et dotés de capacités sensorielles pour former un réseau Internet des objets (IoT), il est de plus en plus important d’exécuter l’inférence CNN, une application à forte intensité de calcul, sur les appareils IoT aux ressources limitées.

La détection d’objets est un problème fondamental de vision par ordinateur qui fournit des informations pour la compréhension d’images dans plusieurs applications d’intelligence artificielle (IA) dans les villes intelligentes. Parmi les différents algorithmes de détection d’objets, CNN est apparu comme un nouveau paradigme pour améliorer les performances globales. Les opérations Multiply-accumulate (MAC), qui sont utilisées à plusieurs reprises dans les couches de convolution de CNN, ont une complexité de calcul extrême. Par conséquent, les charges de travail de calcul globales et leur consommation d’énergie respective de toutes les applications CNN sont à la hausse. Pour surmonter ces défis croissants, le mécanisme de calcul approximatif a joué un rôle essentiel dans la réduction de la puissance et de la zone des applications CNN à forte intensité de calcul. Dans cet article, nous avons conçu une architecture MAC approximative, appelée Shift and Accumulator Unit (SAC), pour l’algorithme de détection d’objets CNN résistant aux erreurs ciblant les plates-formes embarquées.

L’unité de calcul proposée échange délibérément la précision pour réduire la complexité de la conception et la consommation d’énergie, s’adaptant ainsi aux appareils IoT aux ressources limitées. L’architecture de pipeline de l’unité SAC permet d’économiser environ 1,8 × cycles d’horloge que l’architecture SAC sans pipeline. L’évaluation du rendement montre que l’unité de calcul proposée présente une meilleure efficacité énergétique et une meilleure utilisation des ressources que le multiplicateur précis et les multiplicateurs approximatifs de pointe sans détérioration notable de la performance globale.