De drie categorieën algoritmes binnen machine learning uitgelegd
Waarvoor kunt u algoritmes bij machine learning inzetten?
16 april 2020 -
Machine learning is niet meer weg te denken binnen kunstmatige intelligentie. Er zijn verschillende manieren om machine learning te implementeren, hiervoor moet u eerst een algoritme kiezen wat geschikt is voor hetgeen dat u wilt ontwikkelen. Er bestaan veel verschillende algoritmes binnen machine learning. Deze algoritmes zijn in te delen in drie categorieën: supervised learning, unsupervised learning en reinforcement learning.
Romain Huet, senior data scientist bij TMC, licht toe wat deze algoritmes zijn en waarvoor ze ingezet kunnen worden.
1. Supervised learning
Bij deze vorm van machine learning, gecontroleerd leren in het Nederlands, hebt u zowel input variabelen en output variabelen beschikbaar: u hebt dus een complete dataset tot uw beschikking. Er worden tijdens het trainen van het model voorbeelden gegeven van ‘hoe het hoort’, zodat de machine toekomstige output kan leren voorspellen op basis van nieuwe input. Wanneer u dus al weet wat een model voor u moet voorspellen op basis van een bepaalde input en u deze data beschikbaar hebt, is een supervised learning algoritme het meest geschikt voor uqw case.
Om een idee te geven van hoe supervised learning in de praktijk werkt, geven we een voorbeeld: Stel, u bent leraar en u wilt graag een voorspelling doen van wat de resultaten van studenten worden van een volgend tentamen. Hiervoor hebt u eerst een dataset nodig, in dit geval: hun aanwezigheidspercentage tijdens colleges, hoe goed maken ze tussentijdse opdrachten (inputdata) en hun score op het vorige tentamen (outputdata). Met deze data kunt u het algoritme leren om een verband te herkennen tussen het gedrag tijdens de cursus en de uiteindelijke score van het tentamen. Het is nu mogelijk om een voorspelling te doen over toekomstige resultaten. Hiervoor verzamelt u opnieuw dezelfde inputdata, zodat het getrainde model een voorspelling kan doen.
2. Unsupervised learning
Bij unsupervised learning, ook wel ongecontroleerd leren genoemd, doet u eigenlijk het tegenovergestelde van supervised learning. Deze methode wordt gebruikt wanneer u een dataset hebt met enkel inputdata, maar u nog geen gewenste output weet. u zoekt in dit geval naar groepen in bestaande data; een relatie tussen observaties om groepen te kunnen definiëren. De machine zal dus inkomende data scannen en deze uiteindelijk gaan structureren in categorieën of clusters.
In een verkennend proces wordt dus vaak gebruik gemaakt van unsupervised learning. Stel u hebt een grote dataset met voedingsmiddelen, maar u weet nog niet in welke categorieën u deze wilt onderverdelen. Het algoritme gaat voor u op zoek naar overeenkomsten tussen deze voedingswaren, bijvoorbeeld: fruit en groente. Dit zouden dan twee categorieën worden. Uiteindelijk kan dit nog verder worden uitgesplitst, fruit wordt dan bijvoorbeeld verder gecategoriseerd in citrusvruchten en exotisch fruit.
3. Reinforcement learning
Reinforcement learning is een vorm van machine learning waarin een machine leert aan de hand van trial and error. Het model wordt geoptimaliseerd door middel van feedback op eerdere
acties en ervaringen. Meestal is de optimalisatie gebaseerd op beloningen, wat betekent dat sommige acties meer zinvolle ervaringen kunnen opleveren, bijvoorbeeld een muis die kaas krijgt als hij uit een doolhof komt. Het model zal zichzelf updaten door deze feedback te gebruiken om de beloningen te optimaliseren, afhankelijk van de te ondernemen actie.
Een indrukwekkend voorbeeld van hoe reinforcement learning al ingezet is, is hoe een computer geleerd heeft hoe hij een level van Super Mario kan uitspelen. Het model heeft geleerd dat hoe verder hij komt in het level, dus hoe meer punten hij behaalt, hoe beter. Met deze informatie start de computer met het spel. Iedere keer dat hij ‘doodgaat’, weet hij dat er op dat punt een verbetering plaats moet vinden. Maar wanneer hij meer punten behaalt dan tijdens het vorige potje, wordt dit als een beloning gezien. Zo weet het model dat hij deze zetten nog eens kan proberen. Na veel pogingen heeft het model op basis van trial and error geleerd hoe hij Super Mario kan uitspelen.