SLUITEN

De brondata omvatten alle voornamen die in een van de jaren van 1945 tot en met 2015 tenminste vijftig keer als eerste naam of als volgnaam in de Basisregistratie Personen geregistreerd werden voor in Nederland nieuw geborenen met de Nederlandse nationaliteit. Samen vertegenwoordigen deze meest gegeven namen 64 tot 83 procent van alle nieuwgeborenen in een jaar.

We bepaalden zowel de populariteit van alle namen individueel als van alle spellingsvarianten van een naam bij elkaar genomen (bijvoorbeeld Sara, Sarah, Zara). Deze groepering maakten we op basis van klankovereenkomst zonder te kijken naar de herkomst of afkorting van de naam (Bram wordt bijvoorbeeld niet als kortere variant gegroepeerd met Abraham). In een eerste, geautomatiseerde stap groepeerden we de namen op basis van de mate van overeenkomst in de drieletter-klanken ('trigrams') waaruit een naam is opgebouwd, samen met fonetische regels voor lettercombinaties zoals 'chr' en 'phi'. In een tweede, handmatige stap schoonden we deze initiële groepering verder op.

Tot slot bepaalden we de herkomst van de namen, volgens de indeling van Bloothooft en Groot. Hierbij voegden we de herkomstgroepen 'Arabic1', 'Arabic2' en 'Turkisch' samen tot een groep Arabisch/Turks en de groepen 'Dutch-premodern', 'Dutch modern', 'Modern', 'English', 'French' en 'Italian-Spanish' tot een groep Modern. De andere herkomstgroepen die onderscheiden worden zijn Traditioneel, Elite, Hebreeuws, Fries en Scandinavisch.

Data-analyse en -visualisatie: Mirjam Leunissen, met medewerking van Anne Chel, Gideon Mooijen, Joël Meyer, Nora Schinkel, Steven de Weille (Universiteit van Amsterdam, BSc Kunstmatige Intelligentie) Unieke-namengenerator: Hay Kranen Vormgeving: Wendy van der Wauw Data en advies: Gerrit Bloothooft (Universiteit Utrecht, Nederlandse Voornamenbank)

SLUITEN