Modellierung der Informationslandschaft (IL) bei der Untersuchung von domänenspezifischem und generischem Critical Online Reasoning
Konzeptueller Hintergrund und Studienschwerpunkt
Die Rolle sprachlicher Merkmale für die Lesbarkeit von Texten oder die Glaubwürdigkeit von Internetquellen ist vielfach untersucht worden. Anhand eines Korpus kurzer Offline-Texte haben die Projektverantwortlichen von B05 auch nachgewiesen, dass sprachliche Merkmale für die Prognose der Leistung von Studierenden in domänenspezifischen Wissenstests bedeutend sind. Inwieweit sich solche Zusammenhänge jedoch auf die Online-Informationslandschaft (IL) verallgemeinern lassen, ist noch wenig erforscht. B05 befasst sich mit einem zentralen Desiderat zur Modellierung von sprachlichen Merkmalen, die in der Online-IL verwendet werden, in der sich Studierende beim Lösen von Aufgaben zum Critical Online Reasoning (COR) bewegen.
Konzept und Forschungsziel
B05 zielt darauf ab, ein theoretisch fundiertes Modell zu sprachlichen Merkmalen zu entwickeln, um Prognosen zu COR-Prozessen (die in die IL eingebettet sind) und die Performanz von Studierenden zu treffen. Dies geschieht auf der Grundlage der Texte, die Studierende während der Lösung von COR-Aufgaben verarbeiten oder produzieren. B05 befasst sich mit den folgenden Forschungsfragen: (i) Inwieweit unterscheiden sich die sprachlichen Merkmale, die bei der Leistung von Studierenden bei generischem vs. domänenspezifischem COR beteiligt sind – und zwar innerhalb der vier Domänen: Wirtschaft, Medizin, Soziologie und Physik? (ii) Wie unterscheiden sich diese Merkmale in Bezug auf die drei kognitiven COR-Facetten der Online-Informationsbeschaffung, der kritischen Informationsbewertung und des Schlussfolgerns mit Belegen, Argumentation und Synthese? (iii) Auf welchen Ebenen gelten diese Merkmale: für einzelne oder mehrere Texte, Domänen oder Genres oder für die gesamte IL und die zugrunde liegende(n) Sprache(n) (z. B. das Deutsche) insgesamt?
Messung und Analysen
B05 besteht sowohl aus einem quantitativen als auch einem qualitativen Teil. Zunächst geht es um die qualitative Auswahl sprachlicher Merkmale, die Aufschluss über die Belegbarkeit, die Quelle der Information und die Gliederung von Texten geben. Der quantitative Teil beinhaltet die Operationalisierung dieser Merkmale, ihre vertiefte Untersuchung mit Hilfe eines auf maschinellem Lernen basierenden Modells und die Prüfung ihrer Prognosefähigkeit und Aussagekraft im Hinblick auf die oben genannten Forschungsfragen. Die Integration von qualitativen und quantitativen Analysen entspricht dem computergestützten hermeneutischen Zirkel, in dem der quantitative Teil statistische Auswertungen und Prognosen erstellt, die als Ergebnisse der linguistischen Analysen des qualitativen Teils interpretierbar sind.
Ergebnisse
B05 stellt Modelle des maschinellen Lernens bereit, die sprachliche Merkmale mehrerer Texte als Teil der Informationslandschaft für automatische Analysen zugänglich machen, anhand einer linguistischen Analyse von COR auf der Grundlage von detaillierten linguistischen Informationseinheiten.
Beitrag zur Forschungsgruppe
Die A-Projekte liefern Texte und Daten zur Performanz von Studierenden aus der Längsschnittstichprobe und erhalten Ergebnisse aus den linguistischen Analysen von B05. Da sprachliche Merkmale die bei weitem detailliertesten Informationseinheiten sind, die in der Forschungsgruppe analysiert werden, sind sie für die Forschung in den anderen B-Projekten in Bezug auf Medien- und Inhaltseigenschaften (B04) und narrative und latente Bedeutungsstrukturen (B06) relevant. Das Multimodal Learning Data Science System von C08 ist entscheidend für die Erfassung aller Daten aus B05.

Publikationen
Peer Review Artikel
Abrami, G., Genios, M., Fitzermann, F., Baumartz, D., & Mehler, A. (2025). Docker Unified UIMA Interface: New perspectives for NLP on big data. SoftwareX, 29, 102033. https://doi.org/10.1016/j.softx.2024.102033
Scherer, T., Laufer, A., Maurer, M., & Schemer, C. (2025). Assessing the information quality of online sources used by first-year students. Zeitschrift für Erziehungswissenschaft. https://doi.org/10.1007/s11618-025-01344-w
Konca, M., Mehler, A., Lücking, A., & Baumartz, D. (2024). Visualizing domain-specific and generic critical online reasoning related structures of online texts. In O. Zlatkin-Troitschanskaia et al. (Eds.), Students’, graduates’ and young professionals’ critical use of online information (pp. 195–239). Springer Nature. https://doi.org/10.1007/978-3-031-69510-0_10
Baumartz, D., Konca, M., Mehler, A., Schrottenbacher, P., & Braunheim, D. (2024). Measuring group creativity of dialogic interaction systems by means of remote entailment analysis. Proceedings of the 35th ACM Conference on Hypertext and Social Media (pp. 153–166). Association for Computing Machinery. https://doi.org/10.1145/3648188.3675140
Mehler, A., Bagci, M., Henlein, A., Abrami, G., Spiekermann, C., Schrottenbacher, P., Konca, M., Lücking, A., Engel, J., Quintino, M., Schreiber, J., Saukel, K., & Zlatkin‑Troitschanskaia, O. (2023). A multimodal data model for simulation‑based learning with Va.Si.Li‑Lab. In V. G. Duffy (Ed.), Digital human modeling and applications in health, safety, ergonomics and risk management (pp. 539–565). Springer Nature Switzerland. https://doi.org/10.1007/978‑3‑031‑35741‑1_39
Paper und Poster Präsentationen
Abrami, G., Bönisch, K., & Mehler, A. (2025). Towards unified, dynamic, and annotation-based visualisations and exploration of annotated big data corpora with the help of Unified Corpus Explorer. In Proceedings of the 2025 Annual Conference of the Nations of the Americas Chapter of the Association for Computational Linguistics (NAACL): System Demonstrations.
Abrami, G., Baumartz, D., & Mehler, A. (2025). DUUI: A toolbox for the construction of a new kind of natural language processing. In Proceedings of DHd 2025: Under Construction. Geisteswissenschaften und Data Humanities (pp. 446–448). https://doi.org/10.5281/zenodo.14887461
Scherer, T., Laufer, A., Maurer, M., & Schemer, C. (2025, Januar). Incomplete, incorrect, and unbalanced? The quality of online content used by students to solve COR tasks [Präsentation].12. Kongress der Gesellschaft für Empirische Bildungsforschung (GEBF), Mannheim, Deutscland
Scherer, T., Laufer, A., Maurer, M., & Schemer, C. (2025, August). Information quality of online sources used by first-semester students when solving generic COR tasks [Präsentation]. Conference of the European Association for Research on Learning and Instruction (EARLI), Graz, Österreich.
Konca, M., Mehler, A., Bagci, M., Bönisch, K., Engel, J., Henlein, A., Schrottenbacher, P., Stoeckel, M., & Spiekermann, C. (2024, April 13). Modelling and analyzing the online information landscape university students use for their learning [Paper Präsentation]. Annual Meeting of the American Educational Research Association (AERA), Philadelphia, Pennsylvania, USA.