Computerlinguistik

Computern beibringen, Texte zu verstehen

Juri Opitz (28) studiert im Master Computerlinguistik an der Universität Heidelberg und findet ein Themengebiet spannender als das andere – wie zum Beispiel die computergestützte Verarbeitung historischer Textsammlungen.

In seinem Studium kombiniert Juri Opitz zwei Fachgebiete: die Sprachwissenschaft und die Informatik. „In der Computerlinguistik versuchen wir, Computern beizubringen, aus zum Teil riesigen Textsammlungen – diese können Milliarden von Wörtern enthalten – Strukturen herauszuarbeiten, die der menschlichen Sprache zugrunde liegen“, erklärt der 28-Jährige. Es geht also um die automatische Verarbeitung menschlicher Sprache. „Natürlich hat ein Computer nicht das intuitive Verständnis von Sprache, das wir haben. Deshalb müssen wir ihm eine Art Anleitung geben, nach welcher er die vielen Texte abarbeiten soll. Das Erstellen dieser Anleitungen kann sehr einfach, aber auch sehr kompliziert sein und ist ein Hauptteil unserer Arbeit.“

Spaß an Rätseln und Mehrdeutigkeiten

Juri Opitz Foto: privat

Juri Opitz studiert im dritten von insgesamt vier Mastersemestern an der Universität Heidelberg. Zuvor hat er hier seinen Bachelor mit Computerlinguistik im Haupt- und Geschichte im Nebenfach gemacht. „Mir bereitet das formale Lösen von Problemen und Rätseln Freude und ich habe mich schon in der Schulzeit für die menschliche Sprache und ihre Eigenheiten interessiert. Zum Beispiel der Satz: ‚Der Schimmel ist plötzlich aufgetaucht!‘ Ich denke da an etwas Verschimmeltes, das man gerade aus dem Kühlschrank holen wollte, andere Menschen denken an ein Pferd, das ausgebüxt ist und wiedergefunden wurde“, sagt der Student. Wer ein Computerlinguistikstudium für sich in Erwägung zieht, der sollte sich laut dem Studenten unbedingt für Sprache interessieren. „Spaß an Mathematik und formalem Problemlösen ist auch sehr hilfreich.“

Um die Mehrdeutigkeit einer Aussage wie „Der Schimmel ist plötzlich aufgetaucht!“ aufzulösen, schaut man sich in der Regel den Kontext an, in dem sie steht. Dieses Textverständnis können Computerlinguisten auch Maschinen lehren. „Wenn man eine Idee hat und dem Computer beibringt, nach dieser Idee auf eine bestimmte Weise Millionen von Texten zu verarbeiten und dies dann auch noch Einsichten in unsere Sprache liefert, ist das ein super Gefühl. Man ist dann sozusagen ein erfolgreicher Lehrer des lernenden Computers“, erzählt Juri Opitz begeistert.

Eigene Schwerpunkte setzen

Während es zu Beginn seines Bachelorstudiums einen relativ klaren Studienablauf gab, um das Basiswissen des Fachs zu erlernen – zum Beispiel mathematische Grundlagen oder die Theorie des Satzbaus und der Satzbedeutung – kann er im Laufe der Zeit mehr und mehr eigene Schwerpunkte setzen. „Ich verbringe viel Zeit mit dem Lesen von Arbeiten anderer Forscher. Hin und wieder diskutiere ich eine dieser Arbeiten in einem Referat. Außerdem habe ich, wie einige andere Studierende an meinem Institut, einen Job als wissenschaftliche Hilfskraft und unterstütze eine Doktorandin bei ihrer Forschung. Die Zusammenarbeit mit den vielen anderen interessierten Menschen im Fach hilft mir sehr, eigene Ideen zu verfeinern oder neue zu entwickeln.“

Juri Opitz ist ja selbst vielseitig interessiert: „Ich finde alle Themenfelder spannend, zurzeit besonders die computergestützte Verarbeitung historischer Textsammlungen, um Informationen daraus zu gewinnen. Ein Problem dabei ist, dass man Computer, die gelernt haben, etwa heutige Zeitungstexte zu ‚verstehen‘, nicht einfach auf die alten Texte loslassen kann. Die Sprache dort ist zum Teil ganz anders.“

Nach seinem Abschluss steht er vor der Wahl, ob er in die Wirtschaft gehen oder doch an der Hochschule bleiben möchte. „Ich weiß es noch nicht genau. In IT-Unternehmen gibt es einige spannende Tätigkeiten, aber vielleicht wäre es am schönsten für mich, erst einmal in der Forschung Fuß zu fassen.“