Wortreiche Internet-Forschungsmethode



Teilen: 

08.07.2019 13:32

Wortreiche Internet-Forschungsmethode

ForscherInnen der Universität Konstanz erarbeiten Leitfaden für Studien mit dem Google Books Ngram Viewer

Der Google Books Ngram Viewer ist eine Suchmaschine, die die Veränderung der Häufigkeit bestimmter Wörter über die Zeit in einem Bestand von mehr als acht Millionen Büchern ermittelt. Die Entwickler des Tools legten 2011 in einer Veröffentlichung die Möglichkeiten dar, mit der Suchmaschine kulturelle Strömungen nachzuverfolgen. So zeigten sie beispielsweise, dass im chinesischen Korpus nach 1989 die Studierendenproteste auf dem Tian‘anmen-Platz in Peking weitestgehend unerwähnt blieben, wohingegen sie in der englischsprachigen Literatur ausgiebig adressiert wurden. Anderweitigen Bestätigungen dieses Befundes bis heute zum Trotz sind mit der Zeit generelle Bedenken hinsichtlich der Genauigkeit der Ergebnisse des Ngram Viewer aufgekommen. Prof. Dr. Ulf-Dietrich Reips von der Universität Konstanz und seine Mitarbeiterin Dr. Nadja Younes liefern nun in einer Publikation im Online-Journal PLOS ONE einen Leitfaden zur Verbesserung der Zuverlässigkeit (Reliabilität) von Google Ngram-Studien. Als Beispiel für die vorgeschlagenen Verfahren untersuchen sie das Vorkommen religiös besetzter Wörter in den Jahren von 1900 bis 2000.

Der Acht-Millionen-Korpus des Google Ngram-Tools umfasst neben Literatur aus dem britisch- und amerikanisch-englischen Sprachraum auch Bücher verschiedener europäischer Sprachen wie Deutsch, Französisch, Italienisch, und Spanisch sowie in Chinesisch, Hebräisch und Russisch. Die eingescannte Literatur stammt aus dem Zeitraum zwischen 1500 und 2008 und wurde vornehmlich über Universitätsbibliotheken bezogen. Die digitalen Korpora werden immer häufiger zum Beispiel für Studien genutzt, die mittels individualistisch und kollektivistisch geprägter Worte die Werteveränderung in bestimmten Kulturen darstellen. In Einklang mit gängigen Theorien wird dabei gezeigt, dass die meisten Kulturen individualistischer werden und sich von kollektivistischen Denk- und Verhaltensmustern entfernen. Werden über einen Zeitraum von 1800 bis 2000 beispielsweise verschiedene kollektivistisch geprägte Worte wie „Gehorsam“, „Güte“ und „Verehrung“ im deutschen Korpus gesucht, erhält man eine spätestens ab Mitte des 19. Jahrhunderts steil abfallende Kurve. Mit einer herausstechenden Ausnahme: In der Zeit um den Zweiten Weltkrieg herum und währenddessen.

Tatsächlich haben Ulf-Dietrich Reips, zu dessen Arbeitsbereich Psychologische Methoden und Diagnostik auch die Internet-basierte Forschung gehört, und seine Mitarbeiterin Nadja Younes in einer früheren Publikation die Umkehrung der Werteentwicklung zur Zeit des Zweiten Weltkriegs vorhergesagt und bestätigt. In ihrer neuen Publikation konnten sie nun deutlich zeigen, dass die Anwendung der im Artikel vorgestellten Methoden die Reliabilität von Google Ngram-Studien erhöht. „Wir schlagen vor, eine Kombination verschiedener methodischer Verfahren anzuwenden. Damit erhält man die zuverlässigsten Ergebnisse“, sagt Nadja Younes.

So soll auf Vorschlag der Konstanzer ForscherInnen unter anderem das Vorkommen entsprechender Wörter in den verschiedenen Sprach-Korpora verglichen werden. Im deutschen Korpus ist für die Zeit des Zweiten Weltkriegs ein eindeutiger Anstieg der Häufigkeit religiöser Wörter zu verzeichnen – entgegen dem allgemeinen Trend hin zu deren Bedeutungsverlust. Dies entspricht der gängigen Theorie, dass in Krisenzeiten wie Kriegen Religion wieder besonders an Bedeutung gewinnt. Einen ähnlichen Anstieg finden die ForscherInnen im italienischen Korpus. In der englischsprachigen Literatur hingegen kann kein außergewöhnlich hohes Aufkommen jener Begrifflichkeiten zu Zeiten des Zweiten Weltkriegs festgestellt werden, das dem ansonsten konsistenten Bedeutungsverlust religiöser Worte entgegenstünde. „Wir erklären uns das damit, dass große Teile des Sprachraums insgesamt weiter weg vom eigentlichen Kriegsgeschehen waren“, sagt Nadja Younes.

Die Berücksichtigung historischer Ereignisse wie des Zweiten Weltkriegs ist für die Interpretation der Ergebnisse mit entscheidend. Aber auch Phänomene wie Propaganda und Zensur müssen einbezogen werden: So ist im russischen Korpus während des Sowjetregimes ein Einschnitt in der Frequenz des religiösen Wortgebrauchs zu erkennen. Nach dem Ende des Sowjetregimes steigt die Kurve wieder an. Kann daraus geschlossen werden, dass die russische Bevölkerung während der Sowjetzeit weniger religiös war? „Forschung in diesem Bereich deutet darauf hin, dass die Menschen in der UdSSR ihre Religion auf Grund von religiöser Verfolgung im Geheimen auslebten“, warnt Nadja Younes vor einer Interpretation, die nur die Häufigkeit der Wörter berücksichtigt.

Neben dem Vergleich verschiedensprachlicher Korpora empfiehlt der Artikel Verfahren wie die Gegenprobe in verschiedenen Korpora aus derselben Sprache, wobei es bislang nur im Englischen neben dem allgemeinen auch einen fiktionalen Literaturkorpus gibt. Auch die Unterscheidung von Wortbeugungen, das Auswerten von Synonymen sowie ein von den ForscherInnen speziell entwickeltes Standardisierungsverfahren, das systematische technische Verzerrungen sowie die Dominanz einzelner Worte berücksichtigt, erbringen zusätzliche Sicherheit bei der Interpretation der Ergebnisse. Nadja Younes ist überzeugt: „Google Ngram bietet großes Potential für Forschungszwecke. Nie zuvor war es möglich, Werteveränderungen in verschiedenen Kulturen auf Basis einer so großen Anzahl an kulturellen Produkten so effizient zu untersuchen.“

Faktenübersicht:
– Publikation: Nadja Younes, Ulf-Dietrich Reips (2019) Guideline for improving the reliability of Google Ngram studies: Evidence from religious terms. PloS ONE 14(3):e0213554. DOI: https://doi.org/10.1371/journal.pone.0213554
– ForscherInnen der Universität Konstanz erarbeiten am Beispiel von Religion einen Leitfaden, der die Reliabilität für Studien mit der Suchmaschine Google Books Ngram Viewer erhöht.
– Google Books Ngram Viewer umfasst mehr als acht Millionen Bücher in acht Sprachen.
– Zur Website der Arbeitsgruppe: http://iscience.uni.kn

Kontakt:
Universität Konstanz
Kommunikation und Marketing
Telefon: + 49 7531 88-3603
E-Mail: kum@uni-konstanz.de

– uni.kn


Originalpublikation:

Nadja Younes, Ulf-Dietrich Reips (2019) Guideline for improving the reliability of Google Ngram studies: Evidence from religious terms. PloS ONE 14(3):e0213554. DOI: https://doi.org/10.1371/journal.pone.0213554


Merkmale dieser Pressemitteilung:
Journalisten
Gesellschaft, Psychologie, Sprache / Literatur
überregional
Forschungsergebnisse, Wissenschaftliche Publikationen
Deutsch


Quelle: IDW