Masterarbeit: Topic-Aware Semantic Segmentation and Learning Objective Induction

Am 12. März 2026 hat Thomas Plangger seine Masterarbeit erfolgreich verteidigt.

Im Rahmen seiner Arbeit entwickelte er eine durchgängige Pipeline, die unstrukturierte PDF-Dateien aus dem Bildungsbereich in strukturierte Lerninhalte umwandelt. Das System nutzt große Sprachmodelle, um semantische Grenzen in Texten zu erkennen und diese in zusammenhängende Abschnitte zu unterteilen. Diese werden anschließend zu übergeordneten Lernzielen zusammengefasst und bilden die Grundlage für automatisch generierte Lektionen und Quiz-Prototypen.

Zur Bewertung des Ansatzes wurde ein synthetischer Benchmark-Datensatz erstellt, der eine systematische und reproduzierbare Überprüfung der Segmentierungsqualität ermöglicht. Die Ergebnisse zeigen, dass LLM-basierte Methoden aussagekräftige Themenwechsel zuverlässig erkennen und heuristische Referenzwerte übertreffen, auch wenn Herausforderungen wie eine Übersegmentierung in längeren Dokumenten weiterhin bestehen.

Die Arbeit verdeutlicht das Potenzial von LLMs, bestehende Bildungsressourcen für digitale Lernumgebungen zugänglicher und wiederverwendbarer zu machen.

Die Folien aus seinem Vortrag