‘Multimedia-mining en kruisbestuiving brengen Big Data Science naar hoger plan’

23 januari 2015

Informaticus Marcel Worring liep op de troepen vooruit toen hij eind jaren tachtig besloot zich op beeldanalyse te storten met zijn promotieonderzoek aan de UvA, ‘Shape Analysis of Digital Curves’. Het onderwerp stond nog in de kinderschoenen. Een kwart eeuw later is Worring nog steeds gefascineerd door zijn vakgebied.

‘Beelden bevatten zo veel informatie! We zijn er al 25 jaar mee bezig en het is nog steeds niet opgelost!’, aldus Worring, inmiddels 49 en onder meer universitair hoofddocent aan het Instituut voor Informatica van de UvA.
Hij is nog steeds aan het pionieren: als hoogleraar Data Science for Business Analytics aan de Amsterdam Business School (ABS) is hij één van de trekkers van de MBA Big Data & Business Analytics die komend najaar van start gaat.
‘Wij beschrijven vanuit de informaticakant de technieken, de mogelijkheden en de onmogelijkheden op het gebied van Big Data. De businesskant brengt een  heel ander soort kennis in: wat zijn de bedrijfsprocessen waar dit over gaat en hoe pas je dit toe binnen een organisatie? Vaak dekt een opleiding slechts één van de twee. Met deze MBA brengen we beide gebieden bij elkaar,’ verklaart Worring in zijn kantoor bij de ABS.

Meer dan mooi alleen 

Beeld is niet alleen ‘gewoon mooi’, het heeft enorm veel in zich wat van nut kan zijn voor gebruikers van uiteenlopende achtergrond, aldus Worring. Niet voor niets is hij associate director van Amsterdam Data Science, een samenwerkingsverband van de UvA, de Hogeschool van Amsterdam, het Centrum voor Wiskunde & Informatica en de Vrije Universiteit Amsterdam, gericht op interdisciplinair ICT-onderzoek in data science. 

Worring doet onderzoek naar patroonherkenning in beeldverzamelingen en naar de mogelijke toepassingen daarvan. De mogelijkheden zijn in zijn ogen schier oneindig. ‘In het algemeen kun je met behulp van Big Data, inclusief een goede analyse van de gevonden informatie, betere beslissingen nemen.’ 

Zo kan een snelle – ofwel geautomatiseerde - analyse van grote hoeveelheden beelden worden ingezet voor marketingdoeleinden. Wie de resultaten van een marketingcampagne wil beïnvloeden, heeft er baat bij te weten welke effecten de verschillende aspecten van beelden hebben, en hoe deze aspecten te beïnvloeden zijn, licht hij toe. 

Het gaat daarbij overigens al lang niet meer om beeld alleen. Worring, die ooit informatica ging studeren omdat hij gefascineerd was door het idee computers zijn wil op te kunnen leggen, richt zich inmiddels met name op multimedia- analyse. 

Dankzij onder meer de opkomst van internet en sociale media zijn er beelden beschikbaar met een schat aan gegevens. Zo is de locatie bekend en zijn er teksten aan gekoppeld. Bovendien is het nu technisch mogelijk om computers grote hoeveelheden objectieve en minder objectieve data te laten analyseren. Wie die informatie en de technieken niet gebruikt, doet zichzelf volgens Worring ernstig tekort: ‘Alleen kijken naar het beeld zelf is niet meer genoeg om te begrijpen wat er op dat beeld staat.’ 

Lerende computers en goede visualisatie 

Om software te leren wat voor beelden bij een bepaald object horen, worden voorbeelden aan de computer getoond. ‘We laten bijvoorbeeld beelden zien die een pen bevatten en beelden waar dat niet zo is. Als de computer genoeg beelden te zien krijgt, kan hij het leren.’ Dat zelfde geldt voor tekst: de computer wordt getraind met woorden die al dan niet bij een bepaald begrip horen. Hoe groter de variëteit van het object of begrip, des te meer input de computer nodig heeft om zelf een betrouwbaar oordeel te kunnen vormen. Worring: ‘Een pen heeft altijd ongeveer de zelfde karakteristieken, net als een colaflesje of een Apple product. Dan kom je met honderd producten al een heel eind.’ 

Lastiger wordt het met bijvoorbeeld een stoel, en nog lastiger met een concept als democratie, vervolgt de hoogleraar.  ‘Dat is eigenlijk geen visueel concept. We gaan op zoek naar foto’s met een bepaalde sfeer, een connotatie, waar mensen het woord “democratie” aan hangen.’ Hoe meer beelden, des te meer de computer leert, maar zelfs na tienduizenden trainingsbeelden zal het voor de software lastig blijven om een relatief vaag concept als ‘democratie’ in een foto te herkennen. 

Vervolgens komt het marketingaspect om de hoek kijken. Worring: ‘Je wil niet alleen weten dat er beelden van bijvoorbeeld een flesje Cola zijn, maar ook zien of die beelden positief of negatief zijn.’ Zo brengt een foto op een blog van een dikke man die Cola drinkt iets heel anders over dan een groepje slanke jongeren met flesjes Cola in de hand. 

Worring koppelt in zijn onderzoek de automatische analyse van ongestructureerde data afkomstig uit beeld, tekst en sociale media – multimedia-mining – aan gestructureerde data zoals bedrijfsgegevens, economische factoren en demografische kentallen. Met als doel het begrijpen, modelleren en verbeteren van bedrijfsprocessen als marketing en klantprofilering. Centrale vraag hierbij is hoe de computer van al deze informatiebronnen samen automatisch kan leren. 

Minstens net zo belangrijk als het vinden, distilleren en analyseren van de juiste informatie is de manier waarop deze informatie wordt gevisualiseerd, benadrukt Worring. ‘Je wilt de data zo tonen dat de marketingmanager het begrijpt. En zo dat hij ze kan manipuleren en kan zien wat voor effect bepaalde veranderingen in het gebruikte beeld hebben op de marketingresultaten.’ 

Kruisbestuiving 

Overheden en het bedrijfsleven kunnen nu al niet meer zonder Big Data en die afhankelijkheid zal alleen maar toenemen naarmate er meer bekend is over Big Data en het mogelijke gebruik daarvan, voorspelt Worring. 

Tot nog toe werkt hij veel met theoretische business cases. De informaticus, die sinds afgelopen najaar les geeft binnen de nieuwe track Big Data Analytics van de master Econometrie aan de UvA, verheugt zich dan ook op de kennisuitwisseling met de deelnemers aan de MBA Big Data & Business Analytics. ‘Hier komen deelnemers met jaren solide ervaring in het bedrijfsleven. Zij zullen óók de vragen stellen waar wij het antwoord nog niet op hebben. De MBA zal ons helpen meer inzicht te krijgen in wat het bedrijfsleven echt nodig heeft.’

Christine Lucassen