B05

Modellierung der Informationslandschaft (IL) bei der Untersuchung von domänenspezifischem und generischem Critical Online Reasoning

Konzeptueller Hintergrund und Studienschwerpunkt

Die Rolle sprachlicher Merkmale für die Lesbarkeit von Texten oder die Glaubwürdigkeit von Internetquellen ist vielfach untersucht worden. Anhand eines Korpus kurzer Offline-Texte haben die Projektverantwortlichen von B05 auch nachgewiesen, dass sprachliche Merkmale für die Prognose der Leistung von Studierenden in domänenspezifischen Wissenstests bedeutend sind. Inwieweit sich solche Zusammenhänge jedoch auf die Online-Informationslandschaft (IL) verallgemeinern lassen, ist noch wenig erforscht. B05 befasst sich mit einem zentralen Desiderat zur Modellierung von sprachlichen Merkmalen, die in der Online-IL verwendet werden, in der sich Studierende beim Lösen von Aufgaben zum Critical Online Reasoning (COR) bewegen.

Konzept und Forschungsziel

B05 zielt darauf ab, ein theoretisch fundiertes Modell zu sprachlichen Merkmalen zu entwickeln, um Prognosen zu COR-Prozessen (die in die IL eingebettet sind) und die Performanz von Studierenden zu treffen. Dies geschieht auf der Grundlage der Texte, die Studierende während der Lösung von COR-Aufgaben verarbeiten oder produzieren. B05 befasst sich mit den folgenden Forschungsfragen: (i) Inwieweit unterscheiden sich die sprachlichen Merkmale, die bei der Leistung von Studierenden bei generischem vs. domänenspezifischem COR beteiligt sind – und zwar innerhalb der vier Domänen: Wirtschaft, Medizin, Soziologie und Physik? (ii) Wie unterscheiden sich diese Merkmale in Bezug auf die drei kognitiven COR-Facetten der Online-Informationsbeschaffung, der kritischen Informationsbewertung und des Schlussfolgerns mit Belegen, Argumentation und Synthese? (iii) Auf welchen Ebenen gelten diese Merkmale: für einzelne oder mehrere Texte, Domänen oder Genres oder für die gesamte IL und die zugrunde liegende(n) Sprache(n) (z. B. das Deutsche) insgesamt?

Messung und Analysen

B05 besteht sowohl aus einem quantitativen als auch einem qualitativen Teil. Zunächst geht es um die qualitative Auswahl sprachlicher Merkmale, die Aufschluss über die Belegbarkeit, die Quelle der Information und die Gliederung von Texten geben. Der quantitative Teil beinhaltet die Operationalisierung dieser Merkmale, ihre vertiefte Untersuchung mit Hilfe eines auf maschinellem Lernen basierenden Modells und die Prüfung ihrer Prognosefähigkeit und Aussagekraft im Hinblick auf die oben genannten Forschungsfragen. Die Integration von qualitativen und quantitativen Analysen entspricht dem computergestützten hermeneutischen Zirkel, in dem der quantitative Teil statistische Auswertungen und Prognosen erstellt, die als Ergebnisse der linguistischen Analysen des qualitativen Teils interpretierbar sind.

Ergebnisse

B05 stellt Modelle des maschinellen Lernens bereit, die sprachliche Merkmale mehrerer Texte als Teil der Informationslandschaft für automatische Analysen zugänglich machen, anhand einer linguistischen Analyse von COR auf der Grundlage von detaillierten linguistischen Informationseinheiten.

Beitrag zur Forschungsgruppe

Die A-Projekte liefern Texte und Daten zur Performanz von Studierenden aus der Längsschnittstichprobe und erhalten Ergebnisse aus den linguistischen Analysen von B05. Da sprachliche Merkmale die bei weitem detailliertesten Informationseinheiten sind, die in der Forschungsgruppe analysiert werden, sind sie für die Forschung in den anderen B-Projekten in Bezug auf Medien- und Inhaltseigenschaften (B04) und narrative und latente Bedeutungsstrukturen (B06) relevant. Das Multimodal Learning Data Science System von C08 ist entscheidend für die Erfassung aller Daten aus B05.