Universiteit Leiden
  home   contact      
 
 
 
Archief
   

Archief > Forum 5/05 > Onderzoek

Onderzoek

Indo-Europees Woordenboek-project schrijft taalhistorie door investering voor de toekomst.

Onderzoeksproject "The Indo-European Dictionary" wordt de komende 10 jaar financiëel gesteund door de Leidse Uitgever Brill.

door Rob Goedemans

Wie de moeite neemt zijn stamboom te onderzoeken wordt soms met verrassende feiten geconfronteerd.  Met de stambomen van woorden is dat niet anders. Wist u bijvoorbeeld dat een alledaags woord als kaak van oorsprong niet Indo-Europees is? We spreken met z'n allen dagelijks een Germaanse, en dus Indo-Europese, taal en gebruiken daarbij blijkbaar om de haverklap woorden die voor ons gevoel erg Germaans zijn, maar die toch niet zijn afgeleid van woorden die onze verre verre Indo-Europese voorouders gebruikten. Ook al zitten ze al sinds de vroege proto-stadia in de Germaanse talen.

Feiten als deze komen aan het licht door etymologisch onderzoek. Zulk onderzoek, waarin men van lexicon naar lexicon springt, en bovendien de woordenschat door de tijd heen volgt om stammen met elkaar te vergelijken en zo de herkomst ervan te achterhalen, is bij uitstek geschikt voor het gebruik van databases. Computers kunnen veel sneller zoeken en vergelijken dan mensen. Dat heeft Sasha Lubotsky, hoogleraar Vergelijkende Indo-Europese Taalwetenschap, al in een vroege fase onderkend. Al sinds 1991 werkt hij aan een project genaamd "The Indo-European Etymological Dictionary" waarin etymologische databases worden gecompileerd uit nieuwe onderzoeksresultaten, maar ook door bestaande etymologische woordenboeken te digitaliseren. Men streeft naar een zo breed mogelijke dekking over alle takken van de Indo-Europese taalfamilie. Inmiddels is het project uitgegroeid tot een flinke onderneming waarin 10 mensen werken aan een scala van talen, waaronder Russisch, Albanees, en Litouws, maar ook gereconstrueerde en inmiddels uitgestorven talen als Proto-Keltisch, Lycisch, Frygisch, Oud-Fries en Oud-Noors. De databases zijn beschikbaar op internet via http://www.indoeuropean.nl. Je kunt ze online individueel bevragen op (delen van) woorden, betekenis, woordklasse etc. (De exacte velden verschillen natuurlijk per database.) Verder kun je overkoepelende zoekopdrachten uitvoeren op álle databases om zo verwante stammen op te sporen.

 

Wat geldt voor alle taalkundige databases geldt ook hier. De databases zijn slechts stukken gereedschap, het getrainde oog van de taalkundige is onmisbaar bij de interpretatie van de zoekresultaten. Niet alles wat de zoekopdracht oplevert is taalkundig relevant, en voor de relevante resultaten moet verder onderzoek uitwijzen wat de precieze status is. De getrainde ogen van Lubotsky en zijn collega's kijken wekelijks gezamenlijk naar de databases om één van de hoofddoelen van het project te realiseren; de compilatie van een nieuw Indo-Europees Etymologisch woordenboek dat het oude woordenboek van Pokorny uit 1959 moet gaan vervangen. Wekelijks voegen ze 10 lemmata toe aan de lijst waardoor er over 3,5 jaar iets presentabels uit zou moeten rollen en het nieuwe woordenboek over 6-7 jaar uitgegeven kan gaan worden.

Dit plan om de data in boekvorm uit te gaan geven is voortgevloeid uit contacten met de Leidse uitgever Brill en heeft het project een nieuwe wending gegeven. Er is een contract gesloten met Brill dat voorziet in financiering van etymologisch onderzoek waarmee de databases gevoed kunnen worden, voor maar liefst 10 jaar. Als tegenprestatie krijgt de uitgever het recht om per taal een etymologisch woordenboek te publiceren. Bovendien gaat Brill natuurlijk het overkoepelende Indo-Europees Etymologisch woordenboek uitgeven en over een aantal jaren ook de website commerciëel exploiteren. Het eerste deel, over de etymologie van het Oud-Fries (Boutkan & Siebinga), staat inmiddels in de boekenwinkel op de plank. Volgens de huidige planning komen volgend jaar Slavisch en Iraans aan de beurt, en daarna Baltisch, Grieks en Latijn.

Behalve een schat aan nieuwe gedetailleerde etymologische informatie voor de verschillende talen levert dit project ons ook nieuwe inzichten op. Er wordt veel meer dan in het verleden de nadruk gelegd op regionale verdelingen. Onderzoek dat wordt gedaan met behulp van de databases laat zien dat er vrij veel woorden zijn waarvan men voorheen beweerde dat ze tot de Indo-Europese woordenschat behoren, maar die bij nader inzien toch eigenlijk maar in één van de regio's waarin Indo-Europese talen worden gesproken voorkomen. Natuurlijk kan het zo zijn dat bepaalde woorden in alle andere regio's verloren gegaan zijn, maar dat lijkt allemaal té toevallig. Waarschijnlijker is het dat deze woorden innovaties zijn, ingegeven door verhuizing van Indo-Europese volkeren naar nieuwe gebieden. De Indo-Europeanen troffen in deze nieuwe gebieden mensen met onbekende talen aan onder wie zij hun eigen dialect verspreidden. Daarbij kunnen ze zelf voor nieuwe zaken nieuwe woorden hebben gemunt die zijn gebleven in het Germaans. Anderzijds kunnen woorden in het Germaans terechtgekomen zijn doordat de inheemse bevolking die het Indo-Europees overnam een groot deel van de eigen woordenschat behield. (Overigens werden ook de uitspraak en de grammatica sterk beïnvloed door de niet-Indo-Europese taal.) Dit is geen kleinschalig proces geweest. Zo blijkt uit onderzoek van Guus Kroonen, een promovendus van Lubotsky, dat maar liefst 40 tot 50% van de Germaanse woordenschat niet van Indo-Europese oorsprong is. Taalkundig onderzoek kan uitwijzen of die woorden geleend zijn uit een substraattaal of nieuw gevormd door de Indo-Europeanen (nieuwe woorden houden zich bijvoorbeeld aan de fonotactische regels van het Indo-Europees, woorden met een andere oorsprong waarschijnlijk niet). Zulk onderzoek laat zien dat kaak hoogst waarschijnlijk is overgenomen uit een substraattaal. Welke taal dat zou kunnen zijn..? In tot de verbeelding sprekende theorieën wordt geclaimd dat dit wel eens een Semitische taal zou kunnen zijn die zich mogelijk met de megalietcultuur via de zee naar Noordwest-Europa heeft verspreid, maar die later door het Germaans zou zijn verdrukt. Het zou zelfs een taal uit een hele Baskische taalfamilie kunnen zijn, waar nu nog maar een fractie van over is. Volgens Kroonen is dit niet onmogelijk, maar toch op zijn minst zéér speculatief. Het is waarschijnlijker dat de substraattaal waaruit we kaak hebben geleend uitgestorven is zonder de rechtstreekse sporen na te laten waarmee we kunnen bewijzen dat hij ooit ergens gesproken werd. Al wat rest is een lexicale erfenis.

                                    
 
   
vorige pagina top pagina