RPA binnen de logistiek

NLP verkenning bij een internationaal havenbedrijf


SMRTR helpt grote internationale havenorganisatie met de waardevolle informatie uit hun inkomende datastroom te halen door middel van Natural Language Processing (NLP). 
Het resultaat van deze verkenning is het inzicht in de waarde van alle inkomende informatie via e-mail en de rol van NLP om dit te structureren en ordenen voor verdere verwerking. 


Software selectie 

Na een oriënterend gesprek met betrekking tot de wensen van de klant en een eerste indruk van de data, hebben we gekeken naar welke NLP-softwareleverancier de beste oplossing zou kunnen bieden voor deze uitdaging. Op basis van de verschillende vereisten hebben we drie leveranciers met elkaar vergeleken: 

  • Microsoft Cognitive Services
  • Google Cloud Services
  • Amazon Webservices


Op basis van een lange lijst met criteria, zoals o.a. security, data-gebruik en innovatiekracht, werden deze drie aanbieders tegen elkaar afgezet om te bepalen welke oplossing het meest geschikt was voor de klant.

Data analyse en informatiestroom

Om naast de software ook te analyseren hoe de inputstroom eruit ging zien doken we de data in. Temeer om een beter beeld te krijgen van het type informatie en de datakwaliteit. De informatie kon in de e-mail zelf zitten of in verschillende soorten bijlagen zoals Excel bestanden, pdf-documenten en/of afbeeldingen. 

Op basis van een set met voorbeeld data zijn we gestart met de structuur en sleutelwoorden te herkennen en te markeren. Dit is een belangrijke stap om inzicht te krijgen in de waarde van de data.

De volgende stap van deze NLP-verkenning betrof het creëren van een dataset op basis waarvan de verschillende tools getoetst konden worden. Hiervoor was het noodzakelijk dat er een 'datasample' beschikbaar werd gesteld die typerend was voor de uitdaging van de klant. In dit geval een flinke hoeveelheid e-mailberichten voortkomend uit het inkomende e-mailverkeer. 

Conclusie

Op basis van de software selectie i.c.m. de test en validatie van de datastromen hebben we het voor de klant inzichtelijk gemaakt waar en op welke manier een NLP gerelateerde software bij kan dragen aan de oplossing van haar probleem. Tevens hebben we duidelijk gemaakt dat de inzet van dergelijke tooling goed overwogen moet worden. Het is immers duidelijk geworden dat de structurering van data van groot belang is voor het succesvol kunnen toepassen van NLP (Crap in is Crap out). 

Tot slot heeft de klant het inzicht gekregen dat zij op een schat van data zit en heeft tot in de top van de organisatie gesprekken over de bredere toepassing van deze innovatieve vorm van Machine Learning. 

Arthim de Vogel

Arthim de Vogel

Machine learning

Machine Learning

SMRTR contact

Contact