Machine Learning

In de traditionele wereld is het de mens die de computer van instructies voorziet.

Ruwe data wordt door de computer verwerkt volgens de opgegeven instructies, wat resulteert in een verwachte, logische en herleidbare uitkomst.

Deze aanpak is uitstekend geschikt voor vraagstukken die helder te definiëren, logisch en procedureel van aard zijn. Denk aan het berekenen van rente op een lening, of het weergeven van een website.

Traditionele wijze van dataverwerking

Machine learning proces

Machine learning is bij uitstek toepasbaar op vraagstukken welke minder eenvoudig te vatten zijn in duidelijke regels. Denk hierbij aan het begrijpen van samenhang in complexe zaken zoals gezichtsherkenning, fraudedetectie in transactiedata, of het doen van persoonlijke aanbevelingen in apps of websites.

Hieronder worden de stappen uitgewerkt waarin Machine learning kan worden onderverdeeld.

Trainen van het model

In de trainingsstap word historische data inclusief de geobserveerde uitkomst aangeleverd aan een computer.

De computer gebruikt deze informatie om een statistisch model op te stellen waarin de herkende patronen in de data zijn vastgelegd. Deze patronen komen voort uit het trainen van het model op de aangeleverde informatie. Voorbeeld hiervan kan zijn informatie over creditcard-transacties, waarbij sommige transacties zijn gekenmerkt als fraudulent.

De aangeleverde informatie bestaat uit veel (potentieel) relevante kenmerken die bijdragen aan de precisie van het model. Denk in het kader van de creditcard-transacties bijvoorbeeld aan zaken als tijdstip van de transactie, locatie, de winkel, het soort gebruikte terminal of het transactiebedrag.
Deze kenmerken beschrijven de transactie en kunnen bestaan uit data die direct aan de transactie zijn te koppelen, of afgeleide data zoals het gemiddelde transactiebedrag voor de kaarthouder of het aantal transacties in de afgelopen 24 uur.

Bij het selecteren van de kenmerken welke bijdragen aan de uitkomst van het model wordt het voorstel van de computer gecontroleerd door een data-analist of data-specialist. Deze samenkomst van mens en machine maakt dat de technische uitkomst ook logisch verklaarbaar is en blijft.

Trainen van een machine learning model

Middels machine learning is het mogelijk om modellen te creëren die meer complexe samenhang van kenmerken bevat dan door mensen kunnen worden gevat, laat staan geprogrammeerd.

Verder is het mogelijk om bepaalde vooroordelen die mensen hebben in de data middels machine learning te elimineren.

Door een model te her-trainen zorg je ervoor dat het model rekening houdt met de actuele, mogelijk gewijzigde, situatie.

Toepassen van het model

Bij het toepassen van het model wordt nieuwe data, waarvan de uitkomst onbekend is, door het model gehaald. Hiermee wordt de uitkomst op deze nieuwe data voorspeld conform de regels die het model maken. Hiermee is het mogelijk om grote hoeveelheden data real-time te voorzien van een voorspelling van een uitkomst. Denk aan het herkennen van een frauduleuze creditcard-transactie, of het willen opzeggen van een klant die de klantenservice van een telefonie- of energieleverancier belt.

De uitkomst van het model op de nieuwe data is veelal afhankelijk van een groot aantal kenmerken, wat maakt dat de logische samenhang door mensen zelf niet kan worden gezien.

Gebruikte technieken

De Bonte Koning maakt gebruik van een aantal technieken voor toepassing van Machine Learning.

Tensorflow voor het genereren en toepassen van het modelApache NiFi voor geavanceerde data-integratie, inclusief traceerbaarheid van dataApache Druid als snelle, betrouwbare en schaalbare opslag van eigen en openbare datasetsApache Kafka als realtime interface tussen data-genererende systemen en toepassing van het model

Uitgangspunten

  • Gebruik van reeds bekende data om onbekende data te voorspellen
  • Koppelen van eigen data aan externe databronnen
  • Trainen en hertrainen van model
  • Toepassen van model op werkelijke data

Artikelen

Hieronder een overzicht van alle artikelen gerelateerd aan machine learning.

  • Voorspellen van annuleringen

    Voorspellen van annuleringen

    In dit artikel gaan we aan de slag met een concrete vraag waar ieder hotel mee te maken heeft: “Hoe kunnen we bepalen welke reserveringen worden geannuleerd?”. Lege kamers leveren immers geen inkomsten op. Om dit te voorkomen worden kamers overboekt. Te veel overboeken leidt ontevreden gasten, te weinig overboeken leidt tot ongebruikte kamers. Door…



Meer info?

Geïnteresseerd en behoefte aan meer informatie? Vul dan hieronder je gegevens in en er wordt contact met je opgenomen.