Microsoft onthult een AI die afbeeldingen even goed kan omschrijven als een mens

Een technologie die al beschikbaar is op het Azure-platform van Microsoft.

post-image-3

Microsoft heeft een nieuwe Artificiële Intelligentie voorgesteld die perfect geschikt is om slechtzienden te helpen. Volgens Microsoft kan deze technologie de inhoud van afbeeldingen even precies omschrijven als een mens dat zou doen.

Een AI die afbeeldingen met grote precisie kan omschrijven
In 2016 had Google al een gelijkaardige technologie voorgesteld, maar Microsoft bevestigt dat zijn teams deze keer nog verder gegaan zijn. Volgens Microsoft hebben zijn AI-onderzoekers een systeem van artificiële intelligentie ontwikkeld "dat nog preciezer is dan dat van de mens", en dat is staat is om afbeeldingen met verbazingwekkende precisie te beschrijven.

Deze technologie is bijzonder interessant voor blinden en slechtzienden. De Azure-diensten van Microsoft bieden de technologie al aan, wat betekent dat alle ontwikkelaars die in hun toepassingen kunnen integreren.

Seeing AI, een applicatie van Microsoft bestemd voor blinden en slechtzienden die sinds enkele maanden in vijf verschillende talen beschikbaar is, biedt deze technologie ook aan. Via deze artificiële intelligentie kunnen blinden "beter zien", wat wereldwijd de sociale inclusie bevordert. Een afbeelding van een legende voorzien is, zo legt Microsoft uit, een van de moeilijkste problemen voor een AI om op te lossen. En deze nieuwe technologie kan dat.

Speciale leermethode met trefwoorden
Eric Boyd, Vice President Azure AI, bevestigt dat dit "niet enkel vereist dat de voorwerpen in een scène begrepen worden, maar ook de manier waarop zij met elkaar interageren, en hoe ze te beschrijven… Met onze artificiële intelligentie kunt u gemakkelijker de afbeeldingen die u zoekt vinden in de zoekmachine. En voor slechtzienden kan dit het surfen op het web en software aanzienlijk verbeteren".

Het is Xuedong Huang, technisch directeur van Azure AI, die erop aangedrongen heeft dat deze technologie snel geïntegreerd zou worden in het Azure-platform, zodat die zo snel mogelijk kan dienen voor de gebruikers. Het algoritme van deze artificiële intelligentie werd gemaakt via een model van afbeeldingen met een label met daarin specifieke trefwoorden. Wat ertoe bijgedragen heeft om de AI erg belangrijke capaciteiten te geven die andere modellen van artificiële intelligentie niet hebben. Gelijkaardige modellen worden meestal gevormd met afbeeldingen en volledige legendes, wat de modellen verhindert om de omgeving van de afbeelding goed te begrijpen.

"Deze preformatie in visuele woordenschat is een noodzakelijke stap om het systeem op te voeden en te vormen. Wij proberen onze artificiële intelligentie te leren om zelfstandig te leren", zo legt Xuedong Huang uit. Het is deze bijzonderheid die het nieuwe model een lengte voorsprong geeft op de andere AI-systemen op de markt. Vandaag is de artificiële intelligentie in staat om afbeeldingen te labelen die zij nooit tevoren gezien had. De echte uitdaging voor het systeem van Microsoft zal de manier zijn waarop het werkt in de reële wereld.

Back to top button
Close
Close