In de traditionele wereld is het de mens die de computer van instructies voorziet.
Ruwe data wordt door de computer verwerkt volgens de opgegeven instructies, wat resulteert in een verwachte, logische en herleidbare uitkomst.
Deze aanpak is uitstekend geschikt voor vraagstukken die helder te definiëren, logisch en procedureel van aard zijn. Denk aan het berekenen van rente op een lening, of het weergeven van een website.
Machine learning proces
Machine learning is bij uitstek toepasbaar op vraagstukken welke minder eenvoudig te vatten zijn in duidelijke regels. Denk hierbij aan het begrijpen van samenhang in complexe zaken zoals gezichtsherkenning, fraudedetectie in transactiedata, of het doen van persoonlijke aanbevelingen in apps of websites.
Hieronder worden de stappen uitgewerkt waarin Machine learning kan worden onderverdeeld.
Trainen van het model
In de trainingsstap word historische data inclusief de geobserveerde uitkomst aangeleverd aan een computer.
De computer gebruikt deze informatie om een statistisch model op te stellen waarin de herkende patronen in de data zijn vastgelegd. Deze patronen komen voort uit het trainen van het model op de aangeleverde informatie. Voorbeeld hiervan kan zijn informatie over creditcard-transacties, waarbij sommige transacties zijn gekenmerkt als fraudulent.
De aangeleverde informatie bestaat uit veel (potentieel) relevante kenmerken die bijdragen aan de precisie van het model. Denk in het kader van de creditcard-transacties bijvoorbeeld aan zaken als tijdstip van de transactie, locatie, de winkel, het soort gebruikte terminal of het transactiebedrag.
Deze kenmerken beschrijven de transactie en kunnen bestaan uit data die direct aan de transactie zijn te koppelen, of afgeleide data zoals het gemiddelde transactiebedrag voor de kaarthouder of het aantal transacties in de afgelopen 24 uur.
Bij het selecteren van de kenmerken welke bijdragen aan de uitkomst van het model wordt het voorstel van de computer gecontroleerd door een data-analist of data-specialist. Deze samenkomst van mens en machine maakt dat de technische uitkomst ook logisch verklaarbaar is en blijft.
Middels machine learning is het mogelijk om modellen te creëren die meer complexe samenhang van kenmerken bevat dan door mensen kunnen worden gevat, laat staan geprogrammeerd.
Verder is het mogelijk om bepaalde vooroordelen die mensen hebben in de data middels machine learning te elimineren.
Door een model te her-trainen zorg je ervoor dat het model rekening houdt met de actuele, mogelijk gewijzigde, situatie.
Toepassen van het model
Bij het toepassen van het model wordt nieuwe data, waarvan de uitkomst onbekend is, door het model gehaald. Hiermee wordt de uitkomst op deze nieuwe data voorspeld conform de regels die het model maken. Hiermee is het mogelijk om grote hoeveelheden data real-time te voorzien van een voorspelling van een uitkomst. Denk aan het herkennen van een frauduleuze creditcard-transactie, of het willen opzeggen van een klant die de klantenservice van een telefonie- of energieleverancier belt.
De uitkomst van het model op de nieuwe data is veelal afhankelijk van een groot aantal kenmerken, wat maakt dat de logische samenhang door mensen zelf niet kan worden gezien.
Gebruikte technieken
De Bonte Koning maakt gebruik van een aantal technieken voor toepassing van Machine Learning.
Tensorflow voor het genereren en toepassen van het model | Apache NiFi voor geavanceerde data-integratie, inclusief traceerbaarheid van data | Apache Druid als snelle, betrouwbare en schaalbare opslag van eigen en openbare datasets | Apache Kafka als realtime interface tussen data-genererende systemen en toepassing van het model |
Uitgangspunten
- Gebruik van reeds bekende data om onbekende data te voorspellen
- Koppelen van eigen data aan externe databronnen
- Trainen en hertrainen van model
- Toepassen van model op werkelijke data
Artikelen
Hieronder een overzicht van alle artikelen gerelateerd aan machine learning.
-
Voorspellen van annuleringen
In dit artikel gaan we aan de slag met een concrete vraag waar ieder hotel mee te maken heeft: “Hoe kunnen we bepalen welke reserveringen worden geannuleerd?”. Lege kamers leveren immers geen inkomsten op. Om dit te voorkomen worden kamers overboekt. Te veel overboeken leidt ontevreden gasten, te weinig overboeken leidt tot ongebruikte kamers. Door…
Meer info?
Geïnteresseerd en behoefte aan meer informatie? Vul dan hieronder je gegevens in en er wordt contact met je opgenomen.