Industrialfairs News

Nouvelles

Cause we are living in an embodied AI world

19-03-2026

Auteur: Karl D’haveloose

 

 

 

 

Indusruptiv, votre rédacteur dévoué, s'est récemment penché sur un rapport de McKinsey publié à la fin de l'année dernière. Je tenais donc à le partager avec vous, en version condensée, pour que nos 51.000 abonnés issus du secteur industriel du Benelux puissent eux aussi en profiter.

 

Au cours de ces cinquante dernières années, les robots ont transformé de multiples secteurs, allant de la construction automobile, où ils sont utilisés dans les ateliers de pressage, de carrosserie et de peinture, à la grande distribution, où ils peuvent se déplacer dans les allées des magasins pour contrôler les niveaux de stock. Alors que les robots étaient traditionnellement très spécialisés et conçus pour effectuer une seule tâche spécifique, une nouvelle génération de robots à usage général fait aujourd'hui son apparition. Ces robots disposent de capacités plus avancées que leurs prédécesseurs et peuvent effectuer une grande variété de tâches, sans rapport les unes avec les autres, et dans différents environnements. Mais si les récents progrès technologiques ont ravivé l'intérêt pour la robotique générale (comme vous l'avez peut-être déjà lu dans l'article intitulé 'Will embodied AI create robotic coworkers?'), des défis subsistent toutefois, tant au niveau du matériel que des logiciels des robots.

 

Le paradoxe du robot

Lorsqu'il s'agit d'analyser des données complexes, les robots surpassent largement les humains en termes de rapidité et de précision, mais ils ont souvent du mal à se repérer dans le monde réel. Ce contraste est au cœur du paradoxe de Moravec (ou paradoxe du robot), qui met en avant un constat tout à fait objectif : les ordinateurs excellent dans les tâches cognitives complexes, comme le calcul, mais ont du mal à accomplir des tâches physiques qui ne posent aucun problème aux humains, comme par exemple cueillir une myrtille sans l'abîmer.

 

 

Par le passé, toutes ces contraintes physiques ont toujours représenté un défi de taille pour les programmeurs, les obligeant à élaborer des instructions minutieuses et détaillées, précisant les mouvements de chaque actionneur du robot dans le bon ordre. Pour mieux comprendre l'ampleur de la tâche, imaginez que vous deviez écrire un programme servant à la cueillette des myrtilles, qui indique à chaque muscle de votre bras, de votre poignet, de votre main et de vos doigts jusqu'où, à quelle vitesse et avec quelle force ils doivent bouger (le tout basé sur un retour d'information multimodal et en temps réel provenant du système nerveux). Le programme devrait en outre prendre en compte les innombrables variations de forme, de fermeté et de position des myrtilles. Étant donné que le cueilleur évolue dans un environnement en constante évolution, le programme devrait de surcroît tenir compte d'éléments dynamiques, tels que le déplacement des branches pendant la cueillette, ainsi que la présence éventuelle de vent ou de pluie.

 

Peu de robots à usage général ont été déployés à grande échelle, en partie en raison de la programmation intensive nécessaire à la gestion de plusieurs tâches physiques. Mais grâce aux avancées réalisées dans le domaine des logiciels, les robots à usage général deviennent à présent une option envisageable, dans la mesure où ils sont capables d'apprendre, de s'adapter et d'agir en temps réel, sans intervention humaine. Dans le même temps, les améliorations apportées au matériel permettent d'optimiser la dextérité, les capacités sensorielles, mais aussi la consommation d'énergie des robots.

 

Les logiciels évoluent de manière exponentielle

L'IA a permis de passer de robots spécialisés, conçus pour exécuter une seule fonction, comme le soudage par points, à des robots destinés à un usage général. Cette technologie est généralement désignée sous le nom d'IA physique ou d'IA intégrée lorsqu'il s'agit des capacités des robots, afin de la distinguer des programmes d'IA utilisés pour créer de nouveaux contenus, tels que des vidéos, des œuvres d'art et de la fiction.

 

L'IA intégrée vient compléter deux autres technologies que les chercheurs utilisent depuis longtemps déjà dans le domaine de la robotique : l'IA classique et l'apprentissage automatique traditionnel. L'IA incarnée propulse l'apprentissage automatique traditionnel à un niveau supérieur en permettant aux robots d'analyser des données d'entrée, dont celles provenant de capteurs, puis d'ajuster ou d'affiner leurs mouvements physiques, leur positionnement et leur comportement en temps réel.

 

Au fur et à mesure que les chercheurs s'efforceront d'améliorer les capacités des robots, ils finiront très certainement par se rendre compte que les modèles de base constituent la piste la plus évidente. À terme, ces modèles pourraient devenir si sophistiqués que les robots pourraient être capables de faire preuve de compétences comparables, voire supérieures, à celles des humains. Pour l'instant, elles restent toutefois bien en deçà des capacités humaines, et ce à tous les égards.

 


La mesure dans laquelle les modèles de base peuvent optimiser les capacités des robots varie également, et ces limites persisteront probablement à long terme (voir figure 1). En matière de perception, ils peuvent p. ex. considérablement améliorer les capacités visuelles et haptiques (c'est-à-dire celles liées au sens du toucher), mais ils n'améliorent pas de manière significative la capacité d'un robot à déterminer sa proximité par rapport à d'autres objets. La plupart des modèles de base permettent déjà aux robots d'analyser et de comprendre des signaux visuels, tels que les motifs essentiels à la reconnaissance d'objets. Les chercheurs sont également en train de mettre au point des modèles de base multimodaux qui permettent aux robots d'exécuter des actions sur la base d'entrées à la fois visuelles et linguistiques, telles que des commandes vocales.

 

Des modèles de base sophistiqués, complétés par des applications robotiques polyvalentes sur mesure

 

Les modèles de base sont mieux entraînés et associés à des compétences spécifiques pilotées par l'IA :

 

Clonage comportemental. Les robots sont désormais capables d'apprendre en observant des humains – dans des conditions réelles ou à partir de vidéos – dans différents contextes. Les données visuelles sont traitées à l'aide de modèles qui permettent aux robots de reproduire leurs actions, même dans le cas d'activités complexes comportant plusieurs étapes. L'apprentissage par imitation est particulièrement adapté à l'entraînement de la mobilité et de l'agilité.

 

Modèles de raisonnement. Comme leur nom l'indique, ces grands modèles de langage peuvent servir à résoudre des problèmes, à effectuer des raisonnements logiques et à tirer des conclusions (tout comme les modèles de base, ils constituent une forme d'IA). Les modèles de raisonnement décomposent les problèmes ou les questions en plusieurs parties, puis envisagent différentes solutions avant de les perfectionner. Pour créer de nouveaux modèles de raisonnement, les chercheurs ont souvent recours à des modèles de base.

 

Amélioration de la vision par ordinateur et de la perception machine. Les robots sont équipés de plusieurs capteurs, parmi lesquels des gyroscopes qui permettent de détecter les mouvements, des caméras qui analysent la lumière et les données visuelles, ainsi que des capteurs tactiles qui mesurent la pression et identifient les textures. L'introduction de capacités sensorielles supplémentaires, dont notamment des capteurs capables d'interpréter la force exercée par un objet, permettra d'élargir considérablement les fonctionnalités des robots.

 

Imaginez comment ces avancées pourraient contribuer à rendre un robot à usage général plus utile dans un environnement de production. De nos jours, les usines utilisent des mécanismes et des dispositifs de serrage pour maintenir les objets dans la bonne orientation pendant leur usinage. Mais si les robots étaient dotés de capacités d'IA intégrées, ils pourraient utiliser des capteurs pour 'voir' l'objet et ajuster son orientation en temps réel. Alors que les robots multifonctionnels actuels ne sont programmés pour effectuer des ajustements que dans les limites de paramètres contrôlés, les futurs robots à usage général pourraient être capables de s'autoprogrammer, ce qui leur permettrait de s'adapter automatiquement en fonction des expériences 'vécues' dans différents environnements. De tels robots pourraient effectuer un grand nombre de tâches au lieu d'être limités à un petit nombre de comportements prédéfinis.

 

Pour vous faire une idée de la complexité des logiciels utilisés dans un robot à usage général, vous pouvez examiner les différentes techniques employées pour leur programmation (Figure 2). La perception, par exemple, nécessite l'apprentissage par renforcement, des modèles fondamentaux et des réseaux de neurones convolutifs (un type d'algorithme d'apprentissage profond particulièrement adapté au traitement des données d'images et de vidéos).

 

 

Autres axes d'amélioration des logiciels

Malgré les progrès technologiques considérables, les chercheurs doivent encore surmonter un certain nombre de défis liés aux logiciels pour optimiser la manière dont les robots à usage général apprennent de leurs expériences, s'adaptent avec un temps de latence minimal et exécutent plusieurs tâches dans des conditions imprévisibles. Bon nombre de ces difficultés proviennent du fait que les modèles de base qui pilotent les actions des robots nécessitent des milliards de points de données, et que les chercheurs doivent créer beaucoup plus d'environnements de simulation pour collecter toutes les informations nécessaires.

 

Compte tenu des limites des modèles de base actuels, certains robots à usage général ont encore du mal à se déplacer dans des environnements non structurés ou changeants. Il arrive que cette limite ne soit mise en évidence que lorsqu'ils passent de simulations, où leur environnement est relativement stable, au monde réel, où les collaborateurs peuvent – sans le vouloir – désorienter les robots, p. ex. lorsqu'ils déplacent des tables de travail, laissent des cartons vides sur des étagères ou placent accidentellement des vis dans un bac à boulons. Pour cette même raison, la précision des performances peut diminuer lorsqu'un robot à usage général se déplace de son emplacement habituel vers un nouvel environnement. Si les chercheurs parviennent à coordonner les fonctions des robots de manière plus harmonieuse, p. ex. en associant la mobilité à la manipulation d'objets, le taux d'erreur pourrait baisser.

 

Le traitement des données provenant des capteurs, notamment ceux capables de 'voir' des objets, des systèmes haptiques qui analysent les données tactiles et des systèmes auditifs capables d'entendre des sons et de reconnaître des commandes vocales, peut lui aussi être amélioré. De plus, les robots ont du mal à analyser simultanément les données provenant de plusieurs capteurs et à considérer ces données comme un tout. Ainsi, les robots sont p. ex. incapables de faire cuire une omelette, car cela nécessite de traiter simultanément des données visuelles et haptiques et de manipuler plusieurs objets, tels que des poêles, des spatules et des œufs.

 

Un logiciel plus performant pourrait améliorer la coordination entre plusieurs robots, une situation appelée à se produire de plus en plus souvent. Lorsque de nombreux robots multifonctionnels effectuent la même tâche ou des activités connexes, comme le réapprovisionnement des rayons ou la conduite d'opérations de recherche et de sauvetage, ils doivent être conscients de la présence des autres robots autour d'eux afin d'éviter tout risque de collision ou d'autres complications encore.

 

Des avancées révolutionnaires, mais aussi des défis persistants dans le domaine du matériel

Les progrès réalisés dans le domaine de l'edge computing, qui englobe à la fois le matériel et les logiciels, ont permis de réduire la latence des robots et de rendre possible la prise de décision en temps réel. Dans le même temps, d'autres améliorations matérielles ont permis d'améliorer la mobilité, les capacités de détection et l'alimentation électrique des robots. Cela étant, d'autres améliorations demeurent indispensables. Les chercheurs tentent notamment de mettre au point une main robotique dotée de doigts flexibles et d'une plus grande mobilité, ce qui faciliterait la préhension d'objets de forme irrégulière.

 

 

Des défis subsistent également au niveau de l'alimentation électrique. Bien que les batteries permettent aux robots de se déplacer librement, leur autonomie est relativement courte (environ 3 à 5 heures pour les robots humanoïdes). Les robots à usage général peuvent nécessiter des recharges fréquentes, en particulier lorsqu'ils effectuent des tâches très énergivores, telles que le levage d'objets lourds ou des mouvements nécessitant un couple élevé. Une vitesse de recharge lente – un problème qui est devenu de plus en plus critique avec l'essor des véhicules électriques – peut également prolonger les temps d'arrêt des robots et ainsi réduire la productivité.

Une autre possibilité d'amélioration concerne la conception. Les chercheurs préfèrent souvent utiliser des composants aussi petits que possible afin de réduire au maximum la taille du robot, mais cette approche peut faire grimper les coûts et nuire aux performances. Trouver le juste équilibre entre ces différents éléments s'avère encore difficile.

 

À première vue, les défis qui se posent à nous – que ce soit en matière de logiciels ou de matériel – peuvent sembler quelque peu décourageants, mais les récentes avancées laissent penser que les robots à usage général pourraient propulser l'automatisation sur le lieu de travail à un niveau supérieur. Reste simplement à savoir à quel rythme ces progrès seront réalisés et si les entreprises adopteront rapidement ces changements ou si elles hésiteront à le faire. Compte tenu des perspectives très prometteuses offertes par les robots à usage général, les entreprises qui agiront rapidement seront sans nul doute les mieux placées pour créer de la valeur. À ce sujet, je vous invite à écouter la conversation que Filip Tuypens (CEO de FANUC BENELUX) et moi-même avons eue lors du salon Indumation dans ce podcast  (Spotify).

Actualités connexes

Ce site web utilise des cookies pour vous offrir une meilleure expérience lorsque vous visitez ce site. En savoir plus sur les cookies