Folkert de Vries

Folkert de Vries

Data scientist

Henk van Haaster

Henk van Haaster

Vice President Consulting Expert

‘Herkennen, verkennen en experimenteren’. Ziedaar het credo van CGI’s iAMLAB, het in 2018 door CGI opgerichte Infra and Asset Management Lab. In deze lab-setting experimenteert een multidisciplinair team CGI’ers samen met klanten en leveranciers om de volgende generatie Asset Management omgevingen te bouwen en te ontdekken of de inzet van opkomende technologieën kan leiden tot bruikbare componenten voor verdere experimenten of projecten. In dit blog in de iAMLAB-reeks zoomen Folkert de Vries en Henk van Haaster in op Data Science, een begrip dat al een aantal jaar rond buzzt, onderdak biedt aan diverse al te graag over de tong rollende technologieën – Artificial Intelligence, Deep Learning, Machine Learning. In dit blog worden hier tevens concrete voorbeelden van gegeven.  

En ja hoor, daar heb je weer zo’n in een aantal blokken verdeelde foto van een straat en de bijbehorende vraag of je op de blokjes met een stoplicht wilt klikken. Al enigszins geërgerd – kan ik verdorie niet een keer gewoon simpel inloggen? – schuif je wat dichter naar je beeldscherm en klikt een aantal blokjes aan. Je doet dit omdat je zo denkt aan te tonen dat je geen robot bent, maar een mens. Je reactie als je vervolgens wéér zo’n plaatje krijgt, is dan ook: heb ik een stoplicht over het hoofd gezien? Toch ga je weer klikken. Juist fouten maken maakt je mens, denk je dan maar. Na drie foto’s ben je uitgeklikt en – eindelijk! – ingelogd… 

Bovenstaande, beste lezer, is een mooi staaltje Data Science. Of liever gezegd: een mooi staaltje van een van de technologieën die we onder Data Science scharen: Machine Learning. We denken al klikkend aan te tonen dat we geen robot zijn. Maar ondertussen zijn we vooral data aan het labelen. Grote techbedrijven gebruiken die gelabelde data – dit is een stoplicht, dit is een lantaarnpaal, dit is een bus – namelijk om zelfrijdende auto’s beter te laten functioneren. Dergelijke autonoom bewegende voertuigen registeren de omgeving via camera’s. Een computermodel krijgt al die input binnen en dient vervolgens de juiste beslissing te nemen. Maar het model kan alleen optimaal functioneren als het een stoplicht en een bus herkent. Al klikkend op die blokken, helpen we de modellen bij het leren.

Oude wereld versus nieuwe wereld

Eigenlijk gebeurt hier hetzelfde als bij het bekendere voorbeeld van Machine Learning waarbij we een computer honderdduizenden afbeeldingen van honden dan wel katten laten zien en de opdracht geven te leren wat een hond en een kat is. Op een gegeven moment herkent de computer wat er op de afbeelding staat: dit is een hond, dit is een kat. Dit noemen we Supervised Learning. Deze ontwikkeling vinden de meeste mensen nog wel oké. Geinig toch, dat die computer hetzelfde kan als wijzelf? Spannender wordt het als een computermodel op basis van aangereikte data patronen herkent en daar vervolgens beslissingen op gaat baseren. Dat staat voor velen te ver af van wat we gewend zijn. In onze oude vertrouwde wereld werken we ook met data en wel om inzicht te krijgen: we verzamelen een week, maand of jaar lang gegevens in een Excel-bestand en krijgen zo inzichten in de trends. In de nieuwe wereld, waartoe Data Science hoort, willen we ook laten zien dat je patronen kunt voorspellen en daar scenario’s op kunt baseren: dit staat er te gebeuren dus kunnen we zo en zo handelen. 

Computer says no… yeah, sure!

We zijn bang dat we in die nieuwe wereld de computers te veel beslissingsbevoegdheid geven en onszelf buitenspel zetten. Een beslissing mag geen black box zijn. Met ‘computer says no, dus dan is het nee’ nemen we simpelweg geen genoegen. We willen die zwarte doos ontleden. Zelfs al is technologisch gezien the sky the limit, toch willen we ons ermee blijven bemoeien. Dat zit in onze aard, onze cultuur. De praktijk onderstreept dit keer op keer. Neem de Van Brienenoordbrug. Die brug hangt vol sensoren, die elke beweging en elke trilling registeren. Al die data komt samen in een computermodel. Dat model kan op basis van de data patronen herkennen en voorspellingen doen over bijvoorbeeld het onderhoud van de brug (predictive maintenance). Op detailniveau zelfs: die ene schroef is aan vervanging toe. De brug loopt over de A16, waardoor Rijkswaterstaat verantwoordelijk is voor het onderhoud. Maar RWS gaat niet blindelings af op de constatering van het computermodel. De RWS’ers willen weten hoe de computer bepaald heeft dat het schroefje vervangen moet worden, want als ze fysiek gaan inspecteren zien ze geen slijtage. En waarom moet juist deze schroef vervangen worden, terwijl eenzelfde schroef aan de andere kant van de brug niet vervangen hoeft te worden? Allemaal vragen die zij beantwoord willen hebben. Data wakkert hier dus vooral teveel de dialoog aan. En pas daarna volgt een beslissing. Genomen door mensen, niet door computers. 

Intelligentie? Vooral tussen de oren!

Een partij als Rijkswaterstaat baseert zo’n ‘menselijke’ beslissing op meer dan honderd jaar domeinkennis. Er zit enorm veel intelligentie tussen die oren. Dit zien we bij alle bedrijven die al diverse jubilea hebben gevierd. En dat is gelijk ook één van de bottlenecks waarom we nog maar zo weinig concrete voorbeelden hebben die de waarde van Data Science onderstrepen. We hadden het al even over het feit dat we bang zijn dat computers het stuur te veel in handen krijgen. Die angst heeft vele vaders. Sowieso zijn we nogal voorzichtig met het delen van onze data. Aan data, zeker als het om persoonlijke informatie gaat, zit altijd een stevige privacy-kant. Maar er speelt nog meer. Veel bedrijven drijven zo zeer op al die kennis onder de hersenpan van hun experts, dat het begrip van hoe je data in jouw voordeel kunt inzetten ontbreekt. Dat besef groeit wel, met als gevolg dat veel bedrijven de keuze maken om voortaan datagedreven te werken. Maar deze bedrijven bestaan al zo lang dat hun processen, technologieën en cultuur er simpelweg niet op gebouwd zijn om die switch te maken. En de data die er al is, is vaak ook niet van de beste kwaliteit. Waardoor die eerste belangrijke stap – wij worden een data-organisatie – toch te vaak een vage afdruk in het zand blijft. 

De bedrijven die wél optimaal datagedreven te werk gaan, zijn de organisaties die zijn opgericht met data als verdienmodel. De Facebooks van deze wereld die de gebruikers van hun platform voortdurend prikkelen hun profiel aan te scherpen. Hoe beter ze jou kennen, hoe meer gerichte advertenties ze je kunnen voorschotelen. Daar is grof geld mee te verdienen, zeker als een slimme computer het meeste werk doet. 

Braindrain & andere Data Science-versnellers

Voor de techreuzen loont Data Science dus. Zeker nu computers sneller en beter zijn geworden. Technieken als Machine Learning en Deep Learning bestonden al langer in theorie, maar zijn door die toegenomen computerkracht echt tot leven gewekt. Ook de explosieve groei van data die we opslaan – de bron waarop de het model haar beslissing baseert – draagt hieraan bij. Machine learning en Deep Learning blijken in de praktijk ook nog eens echt goed te werken. Maar er zijn nog andere ontwikkelingen die ervoor zorgen dat Data Science in een stroomversnelling belandt: de vergrijzing en de ontgroening van onze bevolking. Er wacht ons een enorme braindrain. Straks zijn we al die vakidiote kennis die onder die grijzende dan wel kale schedels huist kwijt. En dat terwijl nu al in zowat elke sector de vacatures niet meer te vullen zijn omdat de spoeling aan de onderkant dun is. Hoe kunnen we dan met minder mensen toch dezelfde goede beslissingen nemen? Hoe vervangen we die superintelligentie tussen de oren van onze straks toch echt van hun pensioen genietende experts? Het antwoord hoeven we hier niet te spellen. 

De reconstructie van een bouwtekening

Laten we er dan maar gelijk een voorbeeld uit onze iAMLAB- praktijk bij halen. Uiteraard eentje waarbij de inzet van Data Science een proces niet alleen automatiseert, maar ook optimaliseert en tegelijkertijd de datakwaliteit – de bron waaruit al het virtuele leven ontspringt – vergroot. Daarvoor brengen we een bezoek aan een appartementencomplex in Rotterdam. Zoals je al kon lezen in de iAMLAB-blog over de meerwaarde van 3D-modellen is het onze droom om Nederland in één 3D-model te gieten dat communiceert met een dataplatform waarop allerlei data slim verknoopt wordt (Linked Open Data). Waar je je ook bevindt kun je vervolgens allerlei infra- en assetmanagementdata ophalen. Zo ook bij het appartementencomplex waar we het net over hadden. Het zou echt gaaf zijn als je in ons gedroomde 3D-model van buiten naar binnen kunt gaan; het gebouw dus in. Nou zijn er van dat complex ooit bouwtekeningen gemaakt. Op papier, getekend door een architect. Tegenwoordig werken architecten in AutoCAD en is de bouwtekening een 3D-model, een zogeheten Building Information Modeling – kortweg BIM. Die ‘Information’ slaat op de data die de architect in de 3D-voorstelling kan integreren, bijvoorbeeld het type deur of een speciaal soort brandwerend materiaal voor de muren. Van zo’n model kun je bestanden opslaan. Die zijn snel terug te vinden en gemakkelijk te delen, terwijl paparassen kwijt kunnen raken. Zeker als het pand al decennia geleden is gebouwd. Het vraagstuk waarover het iAMLAB zich in samenwerking met de gemeentes Rotterdam, Den Haag en Amsterdam mocht buigen, is als volgt: kunnen we een dergelijke bouwtekening reconstrueren door de ontbrekende data op een slimme manier in te winnen?

De puntenwolken van de LiDAR-scanner

Al snel kwamen we op het idee om LiDAR-technologie in te zetten. LiDAR staat voor Light Detection and Ranging. Deze techniek maakt gebruik van onzichtbare lasers. Met een scanner in je hand loop je door een ruimte en laat je de lasers hun werk doen. Ze weerkaatsen tegen een object – een muur, een bed – waarna het apparaat berekent hoe lang het duurt voordat het licht gereflecteerd wordt. Op basis hiervan maakt de LiDAR-scanner een berekening van de afstand tot een object. Al die gegevens kun je vervolgens in een model laden. Je krijgt dan een puntenwolk die reconstrueert hoe een ruimte eruitziet. 

BIM-model appartementencomplex Rotterdam
Figuur 1: BIM-model appartementencomplex Rotterdam

Klinkt nogal futuristisch, maar zo’n LiDAR-scanner zit tegenwoordig zelfs in smartphones (bijvoorbeeld de iPhone 12 Pro). Je kunt dit dus thuis zelf ook ervaren. Wij hebben een professionele scanner gehuurd, waardoor het resultaat nog verbluffender was. Je ziet op de puntenwolk zelfs slingers hangen – iemand in het appartement had iets te vieren. 

Motorkapoverleg

Bij een tweede experiment hebben we een autocad-tekening in een BIM-model vergeleken met de puntenwolk die we met de LiDAR-scanner hebben gemaakt. Voor het experiment hebben we een muurtje weggehaald in het BIM-model. In de puntenwolk zie je duidelijk wél een muurtje. De puntenwolk geeft dus de actuele situatie weer, terwijl het BIM-model achterhaald is. Dat lijkt zo op het eerste oog een triviaal gegeven. Maar het kan cruciaal zijn om te weten wat de actuele stand van zaken is. Want stel dat er in dit Rotterdamse appartementencomplex brand uitbreekt. De hulptroepen arriveren met loeiende sirenes bij de brandhaard. Het plan van aanpak wordt vervolgens door de commandanten besproken met de bouwtekening van het pand op de motorkap: aan de noordkant beginnen we met blussen, de nog aanwezige bewoners kunnen we via deze vluchtroute naar buiten leiden. Ze komen dan aan de zuidkant naar buiten, waar triage kan plaatsvinden en de ambulances klaarstaan. Meestal verloopt deze operatie ‘as planned’. Maar wat als blijkt dat er in het pand jaren na de oplevering een muur is geplaatst die vluchten langs de beoogde route onmogelijk maakt? Uitgaan van de actuele situatie in plaats van je te baseren op oude bouwtekeningen, is in dit geval van levensbelang.

Pandbrigade

Nou gaat het hierboven over een calamiteit. Er zijn ook minder heftige toepassingen te bedenken waarbij de puntenwolk interessant kan zijn voor een gemeente. En ook die toepassingen hebben te maken met het feit dat de huidige datakwaliteit – die een gemeente onder andere vanuit de landelijke voorzieningen van het Kadaster opvraagt – niet optimaal is. Terwijl die data wel essentieel is om bijvoorbeeld de WOZ-waarde of huurwaarde te bepalen. De zogeheten ‘pandbrigade’ kan natuurlijk ook met de rolmaat elke ruimte opmeten. Maar met zo’n LiDAR-scanner in de hand is dat zoveel sneller te doen. Waardoor hetzelfde werk door veel minder mensen gedaan kan worden én de datakwaliteit toeneemt.

Op vergelijkbare wijze kan de gemeente steekproefsgewijs controleren of iemand zich wel echt heeft gehouden aan die drie meter uitbouw waarvoor hij een vergunning heeft gekregen. Door het BIM-model te vergelijken met de daadwerkelijke uitbouw – ‘as designed’ versus ‘as built’ – zie je of het allemaal conform de regels is gedaan. 

Welkom in de nieuwe wereld!

Met onze iAMLAB-experimenten hebben we nu al een aantal keer de meerwaarde van Data Science onderstreept. Technologisch is er nog zoveel meer mogelijk dan we nu aan het verkennen zijn. We dagdromen hier soms wel eens van 3D-modellen van op Funda te koop staande huizen, waarop je je eigen scenario’s los kan laten, zoals doorberekenen wat voor energiebesparende ingrepen je kunt doen. Voorlopig zal dat bij dagdromen blijven. Want technologie is één kant van het verhaal; de mens en zijn houding tegenover data (‘afblijven, is van mij!’) en te slimme computers (‘straks pikt-ie mijn baan in’) is de andere kant. Maar zelfs het steeds maar weer aanklikken van fotogedeeltes met stoplichten en lantaarnpalen went. Als we daarmee de wereld vooruit kunnen helpen en daadwerkelijk het nut of wellicht zelfs de urgentie (denk aan de braindrain) van Data Science inzien, zijn we gereed om die nieuwe wereld zonder bezwaren te betreden.

Over deze auteurs

Folkert de Vries

Folkert de Vries

Data scientist

Folkert de Vries is sinds 2016 in dienst bij CGI en actief in het Logistieke domein. Folkert is een Data Scientist met een achtergrond in Artificial Intelligence. Hij heeft technieken zoals Machine Learning, Deep Learning en natuurlijke taalverwerking bij verschillende klanten succesvol toegepast. ...

Henk van Haaster

Henk van Haaster

Vice President Consulting Expert

Henk van Haaster werkt sinds 2001 voor CGI. Hij is Vice President Expert data en analytics.  Binnen CGI Nederland is hij verantwoordelijk voor de visie en strategie op opkomende en geavanceerde data en analytics ontwikkelingen. Sinds twee jaar is hij als product manager verantwoordelijk voor ...