Terug naar het overzicht

Digitaal Databeheer

De afdeling Digitaal Databeheer vervult een centrale rol bij de verwerking en harmonisatie van grote gegevensbestanden voor het onderzoek van het Huygens ING / KNAW Humanities Cluster. Ze verleent ondersteuning aan data-intensieve onderzoeksprojecten, beheert datasets en online resources en ziet toe op de interoperabiliteit en bruikbaarheid van de onderzoeksgegevens en digitale tools die door Huygens ING worden aangeboden.

Resources

Het Huygens ING kent een lange geschiedenis van het editeren van historische bronnen en teksten en van het samenstellen van datasets. Inmiddels heeft het instituut bijna tweehonderd resources online beschikbaar voor geesteswetenschappelijk onderzoek. Deze resources vormen niet alleen belangrijke bouwstoffen voor uiteenlopende vormen van onderzoek, maar bieden bovendien vaak een unieke toegang tot weer andere bronnen en teksten over het verleden van de Nederlanden. Om deze resources beter inzetbaar te maken voor nieuwe, digitale onderzoeksbenaderingen zal de afdeling ze de komende jaren stapsgewijs migreren naar (semantische) webomgevingen. Na migratie kunnen onderzoekers de gegevens en concepten uit deze resources flexibel met andere bronnen verbinden en deze in verschillende contexten bestuderen. De afdeling Digitaal Databeheer voert het inhoudelijk beheer van de resources en trekt het migratietraject.

Bekijk de resources van het Huygens ING

Data-infrastructuren

In de geesteswetenschappen worden onderzoeksdata steeds vaker gedeeld, met elkaar verbonden en met nieuwe technologieën geanalyseerd. Goede data-infrastructuren zijn hiervoor van essentieel belang. De afdeling Digitaal Databeheer richt zich op het verwerken en beschikbaar stellen van data in infrastructurele projecten als CLARIAH-CORE, Golden Agents, TRIADO, CLARIAH-PLUS en REPUBLIC. De medewerkers van de afdeling voeren in deze projecten uiteenlopende werkzaamheden uit, variërend van het maken van zogeheten ground truths voor automatische handschriftherkenning of classificaties, het cureren en verbinden van data, het valideren van tools en data, tot het modelleren van betekenisverbanden tussen informatie-eenheden met behulp van ontologieën. De afdeling slaat in deze projecten een brug tussen software engineering en het geesteswetenschappelijk onderzoek en beoogt waar mogelijk de wensen van onderzoekers te vertalen naar gedeelde, generieke data-oplossingen.

In het kader van deze infrastructurele projecten werkt de afdeling intensief samen met universitaire onderzoeksgroepen, erfgoedinstellingen en in enkele gevallen ook met private partners.

Datasupport

De afdeling Digitaal Databeheer biedt ook data-ondersteuning bij individuele onderzoeksprojecten. Haar medewerkers helpen onderzoekers bij de realisatie van hun databehoeften. Zij adviseren over een datamanagementplan (DMP), en het opschonen, systematiseren en opslaan van datasets, en bieden indien mogelijk ook praktische ondersteuning. Daarnaast geeft de afdeling advies bij vragen over open (FAIR) data, gebruiksovereenkomsten en privacywetgeving van onderzoeksdata.

Vanuit de visie dat datamanagement een integraal onderdeel van wetenschappelijk onderzoek is, helpt de afdeling onderzoekers ook bij de implementatie van landelijke en internationale datamanagementprotocollen: ze ondersteunt onderzoekers actief bij het opstellen van de dataparagraaf in onderzoeksaanvragen en bij de toepassing van DMP’s.

Ontologieën en vocabulaires

Met de overvloed aan data wordt het ook belangrijker om meer greep te krijgen op betekenisverbanden tussen informatie-eenheden. Een ontologie maakt het mogelijk om binnen een wetenschapsdomein samenhangen tussen deze eenheden te identificeren en te modelleren zodat er een gedeeld begrip kan ontstaan van de uitgewisselde data. Hierdoor kunnen onderzoekers data op meer effectieve wijze analyseren. De afdeling Digitaal Databeheer neemt deel aan het internationale consortium Data for History, dat tot doel heeft gedeelde ontologische modellen te construeren zodat semantische interoperabiliteit van geesteswetenschappelijke data binnen bereik komt.

Om de mogelijkheden voor verbinding en hergebruik van gegevens te maximaliseren is het bovendien noodzakelijk dat ze met behulp van gedeelde vocabulaires worden beschreven. Samen met het Nationaal Archief en het CBG | Centrum voor familiegeschiedenis heeft de afdeling het Person Name Vocabulary (PNV) ontwikkeld. Dit vocabulaire maakt het mogelijk de afzonderlijke elementen van (historische) persoonsnamen te identificeren, wat helpt om data over personen beter doorzoekbaar te maken en onderling te verbinden.

Databeleid

Datanotitie van het Huygens ING

Contact

Sebastiaan Derks (afdelingshoofd)
Lodewijk Petram (research data manager)