Biomedische data zijn cruciaal voor onderzoek op het gebied van life sciences zoals biologie en geneeskunde. Hiertoe moeten relaties in biomedische teksten (uit wetenschappelijke publicaties) geëxtraheerd worden. Ondanks de vele mogelijke benaderingen die tot op heden zijn gepresenteerd, blijft het extraheren van deze relaties een groot probleem. Dit komt onder andere door de kwaliteit van de relaties, de benodigde computerkracht en de verschillende types van relaties die mogelijk zijn. Chinh Bui bestudeerde drie verschillende relatie-extractietaken. Hij presenteert onder andere een nieuwe methode voor het extraheren en combineren van relaties tussen hiv-medicijnen en mutaties in de genetica van het virus. Deze methode is gebaseerd op ‘natural language processing’ (NLP) dat grammaticale relaties produceert en een lijst van regels toepast op deze relaties. Uit de resultaten blijkt dat Bui’s systeem goed presteert in vergelijking met andere prominente systemen. Het wordt toegepast in het ViroLab project (www.ViroLab.org) om virologen te helpen bij het vinden van relaties tussen hiv-medicijnen en de mogelijke mutaties van het hiv-virus.
Deelname
Toegang vrij