Cette semaine, nous allons voir comment un programme peut apprendre à créer des images réalistes de personnes à partir de gribouillages ! En réalité, c’est un peu l’inverse, mais ça vaut le coup d’oeil ! Ensuite, nous allons parler du paradoxe de Moravec… enfin, si paradoxe il y a ! L’idée c’est que les choses simples pour les humains semblent difficiles pour les programmes et vice et versa. Mais est-ce que tout ne tient pas dans le « semble simple » ? Enfin, nous parlerons de Sony Blabla... bon, c’est pas exactement ça… mais en gros, eux aussi s’y mettent aux DNN et en Open Source ! Enfin, nous parlerons rapidement des assistants intelligents et de la sortie imminente de Google Home !
Fotogenerator
Quand des réseaux de neurones sont utilisés pour générer des portraits à partir de gribouillages ou de dessins, ça donne ça: http://fotogenerator.npocloud.nl/ – Impressionnant non ?
Comment cela fonctionne t-il ? A mon avis, on a dû montrer à un Réseau de Neurones Profonds (DNN) des photos de personnes, et on a du appliquer une série de filtres pour obtenir des dessins. En entrée, on a mis les dessins et en sortie les images. Bon, c’est jamais aussi simple que ça, car cela demande plusieurs réseaux spécialisés et un tas de réglage, mais je pense que le principe est là. De fait, le réseau sait à quoi ressemble une personne dans la vraie vie. Et à partir de dessins, il peut reformer une image « réaliste », une sorte de transposition, une prédiction de la personne d’origine. Vous imaginez ce que cela peut donner coté « personnes recherchées » par la police ?
Moravec
Le paradoxe de Moravec : Hans Moravec et d’autres informaticiens ont fait remarquer dans les années 1980 que ce qui est simple pour nous est difficile pour l’IA, même la plus sophistiquée; à l’inverse, l’IA peut souvent faire facilement ce que nous considérons comme difficile. Ça vous faisait penser à Syberia ? Mais non, c’est Voralberg !
Bon, je ne sais pas en quoi c’est un paradoxe personnellement. Est-ce qu’il est paradoxal qu’un littéraire ait plus de difficultés en maths qu’un Scientifique et qu’un scientifique soit moins à l’aise en langues qu’un littéraire ? Un paradoxe, c’est quand « cela semble défier la logique parce que cela présente des aspects contradictoires« … Ah, c’est parce que je ne suis pas un littéraire. En fait, il y a une autre définition à paradoxe: « contraire à l’opinion commune« . Alors, oui, c’est vrai que cela nous parait, par exemple, facile de conduire une voiture, alors que cela l’est beaucoup moins pour un robot. D’ailleurs, j’aimerais attirer votre attention sur un point. Ne vous êtes vous jamais demandé comment votre imbécile de voisin et ses 3 neurones mal connectés qui se cogne partout et qui n’arrive pas à aligner 3 mots – oui, j’ai des voisins qui ont ce profil et encore, je ne suis gentil – comment celui-là même arrive à sortir sa voiture en marche arrière, faire un quart de tour sur la route, et avancer jusqu’au bout de la rue sans renverser les poubelles, défoncer les poteaux télécoms (s’ils défoncent les poteaux en béton d’EDF, il a un tank) ? Bref, comment un arriéré mental comme on en croise souvent (consanguinité oblige) arrive t-il à conduire ? Bon, en fait, je suis ignoble, mais j’assume – et en plus je suis sérieux. On peut penser que conduire demande une concentration forte, il faut avoir une simulation mentale de ce qui se passe à l’extérieur, simulation complétée en temps réel par des coups d’œil dans les rétros. Il faut passer les vitesses en fonction des efforts du moteur, et là il faut être à l’écoute un minimum. Il faut… bon, je ne vais pas tout lister, mais, en théorie, c’est vachement dur. Et en pratique… pas du tout ! Pourquoi ? C’est parce qu’une bonne partie de nos gestes sont inconscients – ils sont automatiques. Dans le traité des 5 roues, on aurait dit : »ce que l’esprit ignore, la main le découvre« . Et c’est vrai pour beaucoup de gestes au quotidien. Nous avons dû apprendre ces gestes… difficilement le plus souvent. Quand nous étions très jeune, cela prenait la forme d’un jeu peut-être… Mais nous rappelons-nous nos difficultés pour tenir debout, marcher… tout en ayant un corps qui change et dont le centre de gravité bouge constamment ? Puis, maintenant, nous marchons sans y penser…Pour une IA, sous la forme d’un robot ou juste un programme dans la machine, c’est pareil, il lui faut apprendre. Et avec beaucoup moins de Neurones (plus que mon voisin, j’en conviens). Et bien souvent, nous trichons, nous et tous les êtres vivants ! C’est tout le débat de l’inné et de l’acquis. A quel point nous avons hérité d’un bagage génétique sous la forme d’un programme de ce type ? Respirer par exemple… on y pense pas, pourtant c’est bien le cerveau qui donne des ordres. Et comment a-t-il appris cela ? Et ne parlons même pas de notre système immunitaire…
Alors oui, les robots ont du mal à faire des choses que nous estimons simples, mais le sont-elles réellement ?
Sony Blabla
Sony lance ses outils de Deep learning en open source : Baptisée NNabla (oui, pas blabla, mais c’était pour le mnémotechnique), la librairie, écrite en C++ 11 est compatible avec l’ensemble des plateformes Microsoft et Linux et supporte l’optimisation des traitements grâce aux GPUs NVIDIA (Cuda quoi). La librairie propose une API C++ ainsi qu’une API Python. La documentation semble assez bien réalisée et l’API simplifiée au max.
Assistants Intelligents
Sortie du Google Home en France le 3 Août prochain, 149€.
« Ok Google, c’est quoi mon programme aujourd’hui ? »: « Avec l’état de ton pied et tes médocs, va coucher… » – Non mais, je ne vais pas me laisser faire !
Toujours rien coté Alexa d’Amazon et l’Apple HomePod c’est fin 2017.
Fotogenerator est fermé
Oui, je sais, j’ai pu faire joujou avec, mais la vidéo donne une idée du concept