Microsoft dévoile une IA capable de décrire les images aussi bien que les personnes

Cette technologie est déjà disponible sur la plateforme Azure de Microsoft.

post-image-3
Microsoft a dévoilé une nouvelle intelligence artificielle qui serait parfaitement adaptée pour aider les personnes malvoyantes. Selo Microsoft, cette technologie est capable de décrire avec précision le contenu des images de façon aussi précise que les humains.

Une IA capable de décrire des images avec grande précision

En 2016, Google avait déjà proposé une technologie similaire, mais Microsoft affirme que ses équipes sont allées encore plus loin cette fois-ci. Selon Microsoft, ses chercheurs en intelligence artificielle ont développé un système d’intelligence artificielle « encore plus précis que celui des humains », capable de décrire avec une précision étonnante des images. Cette technologie est particulièrement intéressante pour les personnes aveugles ou malvoyantes. Les services Azure de Microsoft proposent déjà cette technologie, ce qui signifie que tous les développeurs peuvent l’intégrer au sein de leurs applications.

L’application de Microsoft destinée aux personnes aveugles et malvoyantes, Seeing AI, disponible en cinq langues différentes depuis quelques mois, propose également cette technologie. À travers cette intelligence artificielle, les aveugles sont capables de « mieux voir » ce qui favorise l’inclusion sociale partout dans le monde. Comme l’explique Microsoft, légender des images est l’un des problèmes les plus difficiles à résoudre pour l’IA et cette nouvelle technologie permet d’y remédier.

Un apprentissage spécifique par mots clés

Eric Boyd, vice-président chez Azure AI, gage que « cela nécessite non seulement la compréhension des objets dans une scène, mais aussi la façon dont ils interagissent, et comment les décrire… Notre intelligence artificielle permet de trouver plus facilement les images que vous recherchez dans les moteurs de recherche. Et pour les utilisateurs malvoyants, cela peut améliorer considérablement la navigation sur le web et les logiciels ».

C’est Xuedong Huang, directeur technique chez Azure AI, qui a insisté pour que cette technologie soit intégrée rapidement sur la plateforme Azure pour qu’elle puisse servir aux utilisateurs le plus rapidement possible. L’algorithme de cette intelligence artificielle a été formé grâce à un modèle d’images étiquetées avec des mots clés spécifiques. C’est ce qui a contribué à lui donner des capacités très importantes que d’autres modèles d’intelligence artificielle n’ont pas. Les modèles similaires sont généralement formés avec des images et des légendes complètes, ce qui empêche aux modèles de bien comprendre l’environnement de l’image.

« Cette préformation au vocabulaire visuel est une étape nécessaire pour éduquer et former le système. Nous essayons d’apprendre à notre intelligence artificielle à apprendre par elle-même », explique Xuedong Huang. C’est cette particularité qui donne à ce nouveau modèle une longueur d’avance sur les autres systèmes d’IA du marché. Aujourd’hui, l’intelligence artificielle est capable de légender des images qu’elle n’a jamais vues avant. Le véritable défi pour ce nouveau système de Microsoft sera la manière dont il fonctionnera dans le monde réel.
Back to top button
Close
Close