Vision artificielle

Les robots du futur auront des yeux suisses

| mise à jour

Des géants de la tech US jettent tour à tour leur dévolu sur l’innovation suisse en matière de vision par ordinateur, à coup d’acquisitions de spin-off, d’ouvertures de laboratoire et de collaboration avec les EPF. La Suisse se profile-t-elle comme le pôle leader dans le domaine?

(Source: Ociacia / iStock.com)
(Source: Ociacia / iStock.com)

Novembre 2015, Apple confirmait avoir mis la main sur la start-up zurichoise Faceshift, à l’origine d’une technologie de motion capture aujourd’hui probablement au cœur du système d’emojis animés de l’iPhone X. Cette acquisition ressort comme la plus emblématique d’une série de rachats récents de start-up suisses actives dans la vision par ordinateur. Du côté de Zurich (Kooaba/Qualcomm, Skybotix/GoPro, Zurich Eye/Facebook Oculus, Dacuda/Magic Leap). Mais aussi en Suisse romande: deux technologies nées au CSEM sont récemment passées en mains américaines (Snap Sensor/Analog Devices, ViDi Systems/Cognex).

Ces rachats ne sont-ils que pure coïncidence ou est-ce que la Suisse possède des atouts particuliers en matière de vision par ordinateur? Pour Michael Born, co-fondateur de Dacuda qui vient de créer sa nouvelle société PXL Vision, l’intérêt que manifeste le secteur tech US pour les innovations suisses dans ce domaine prouve que le pays se positionne à la pointe. L’entrepreneur explique qu’une poignée de chercheurs, de renommée mondiale, attire à Zurich étudiants et scientifiques passionnés par cette discipline.

Un concentré d’experts et de talents

Parmi ces professeurs «stars» présents outre-Sarine, Michael Born mentionne en premier lieu Luc Van Gool et Davide Scaramuzza. Le premier dirige le Computer Vision Lab de l’EPFZ. Le second, aux commandes du Robotics and Perception Group de l’Université de Zurich, a entre autres co-initié et supervisé le projet de recherche à l’origine de Zurich Eye (spin-off rachetée fin 2016 par Oculus, filiale de Facebook). Pour Davide Scaramuzza, il n’y a pas l’ombre d’un doute: «La Suisse est un leader en vision par ordinateur. Le pays profite de l’une des plus importantes concentrations d’experts, d’entreprises et de start-up dans ce domaine.» Une concentration à laquelle participe aussi l’EPFL sous l’égide de Pascal Fua, qui dirige le Laboratoire de vision par ordinateur, et de Sabine Süsstrunk. La responsable du Laboratoire d’images et représentation visuelle souligne que l’actuel président de l’école polytechnique romande, Martin Vetterli, est lui aussi considéré comme un pionnier: il est à l’origine de Dartfish, éditeur fribourgeois de logiciels d’analyse vidéo pour le sport, créé en 1998 déjà.

Le rayonnement de la vision artificielle made in Switzerland a un impact positif sur les start-up de la région. Spin-off de l’institut Idiap de Martigny, KeyLemon propose une solution de reconnaissance faciale pour mobile. Pour son CEO Gilles Florey, être basé en Suisse tout en étant actif dans ce domaine constitue clairement un plus: «Cette excellente réputation nous a permis d’attirer l’attention d’acheteurs potentiels. C’est aussi en Suisse que nous trouvons des talents, les membres de notre équipe R&D viennent en effet tous de l’EPFL et de l’EPFZ.»

La présence accrue des Gafam

Selon Sabine Süsstrunk, si la Suisse se positionne effectivement en tant que leader dans le domaine, c’est avant tout sur le plan de la recherche académique: «En comparaison des autres pays, le nombre d’études publiées dans le domaine par des équipes basées en Suisse est très élevé.» La chercheuse de l’EPFL ajoute qu’en revanche, pour une question de taille et de nombre de scientifiques investis dans le domaine, la Suisse peut difficilement se mesurer aux initiatives R&D privées des acteurs de la tech américaine. Et les Gafam savent désormais où dénicher des talents: les actifs issus des acquisitions de Facebook et Apple ont servi de base à l’ouverture de labs à Zurich. Des structures qui viennent s’ajouter à celles de Disney et Nvidia, déjà présents sur les bords de la Limmat depuis plusieurs années. Sans oublier Google, qui a fait de ses sites zurichois (entre autres dédiés à la vision par ordinateur et au machine learning) son plus grand centre de recherche et de développement hors des Etats-Unis. La firme de Mountain View explique ce choix en partie par la proximité des deux EPF et les opportunités de collaboration qui en découlent.

Changement d’attitude et cercle vertueux

L’intérêt de ces firmes pour les recherches menées en Suisse enthousiasme Luc Van Gool. Pour le Professeur de l’EPFZ le leadership helvétique en vision artificielle prend source dans plusieurs facteurs: «Un changement d’attitude des chercheurs a participé à l’introduction sur le marché d’innovations dans le domaine. La création de spin-off est désormais considérée positivement par le milieu académique, notamment pour sa capacité à créer des emplois. En parallèle, le marché potentiel d’applications basées sur la vision par ordinateur est devenu plus tangible.»

Christoph Strecha, CEO et fondateur de Pix4D, jeune pousse de l’EPFL qui édite des logiciels d’imagerie pour drones, fait quant à lui remarquer: «L’EPFZ et l’EPFL bénéficient de financements importants pour la recherche en général et offrent des conditions qui attirent des professeurs de renom. L’écosystème est également adéquat pour fonder des spin-off. Et les doctorants sont motivés par le succès de start-up nées sur leur campus.» Un cercle vertueux qu’illustrent le nombre et la diversité des spin-off helvétiques en activité exploitant des technologies de vision par ordinateur. Et ce, aussi bien en région zurichoise (Advertima, Catcheye, Fashwell, Parquery, PXL Vision, Uniqfeed, Scandit, 4Quant…) qu’en Suisse romande (Biowatch, Darix, Eyeware, Keylemon, Largo, nViso, OneVisage, Pix4D…)

La vision par ordinateur s’immisce partout

Ces jeunes pousses innovent dans des secteurs d’activités multiples, allant de la construction à l’agriculture, en passant par le secteur automobile, les médias, le marketing, le retail, la logistique, les interactions homme-machine, la sécurité, la surveillance ou encore le secteur industriel. Le chercheur Edoardo Franzi, à la tête des activités Vision Embedded Systems du CSEM durant vingt ans, souligne le potentiel varié de ces technologies: «La vision par ordinateur explose et on la trouve partout. Par exemple dans les domaines du contrôle qualité, dans l’assemblage industriel, dans la sécurité. Sans oublier le domaine médical, notamment via des caméras capables d’extraire de l’info pour guider les chirurgiens. D’autres algorithmes mis au point au CSEM permettent de détecter des mélanomes aussi finement que le ferait un gigantesque pool de médecins.»

Autant de prouesses qui, de l’avis de tous les experts consultés par ICTjournal, tirent profit des progrès de l’intelligence artificielle et du deep learning en particulier. Sabine Süsstrunk de l’EPFL explique: «Les techniques actuelles permettent de traiter des masses d’images et d’en tirer des conclusions dans un laps de temps raisonnable. On doit ces progrès aux développements en matière de machine learning et de réseaux neuronaux, des avancées rendues possibles grâce à l’amélioration des performances des processeurs graphiques.»

Vers des systèmes dotés de conscience visuelle globale

Les défis actuels des chercheurs consistent à combiner différentes expertises, afin de «répondre à des problématiques de conscience visuelle globale», explique Luc Van Gool: «Par exemple, pour garantir une sécurité totale avec les futures voitures autonomes, les systèmes embarqués devront pouvoir traiter en parallèle l’ensemble des informations visuelles rapidement et de manière fiable. Notre spécialisation en deep learning a d’ailleurs incité Toyota à établir l’un de ses principaux centres de recherche à l’EPFZ.» Tim Llewellynn, CEO de la spin-off de l’EPFL nViso (reconnaissance des expressions faciales pour l’analyse des émotions) indique que l’une des pistes explorées consiste à adapter les algorithmes de deep learning pour qu’ils puissent opérer directement au sein des capteurs et objets connectés (le concept de «edge computing»). Il ajoute que cette approche demande une expertise interdisciplinaire que possèdent la recherche et l’industrie helvétiques: «En ce sens, la Suisse se profile déjà comme leader de la prochaine génération de technologies de vision artificielle.»

Webcode
DPF8_70163