Computerlinguist (m/w/d)
„Griebe Fibuster fidunkeln“
Oder: Wie Computerlinguisten/innen Computern den Umgang mit menschlicher Sprache beibringen
Etienne Roth ist Computerlinguist. Seit inzwischen sieben Jahren arbeitet er 40 Stunden pro Woche in der Abteilung Duden – Sprachtechnologie des Verlages Bibliographisches Institut GmbH. „Es war meine erste Vollzeitstelle, und ich bin dabei geblieben“, erzählt der Produktmanager.
Computerlinguist, das klingt ziemlich theoretisch. Viele Menschen können wahrscheinlich gar nichts damit anfangen. Also, was steckt eigentlich hinter dem Berufsbild? „Die Frage höre ich oft!“, sagt Etienne. Und: „Meine Antwort beginnt meist so: Ein Computerlinguist versucht, Computern den Umgang mit menschlicher Sprache beizubringen. Dabei gibt es verschiedene Aufgaben.“
Welche sind das? „Spracheingabe ist eine offensichtliche. Dass man zum Beispiel einem Computer oder einem Handy Text diktiert oder die Geräte mit gesprochener Sprache bedient.“
Ein weiteres Beispiel sei „Information Retrieval“, nämlich „das intelligente Wiederfinden von Informationen in großen Textmengen“, übersetzt Etienne für einen Laien. „Wer bei Google nach ‚Sauerstoffspiegel‘ sucht, findet viele Artikel von ‚Spiegel Online‘, in denen das Wort Sauerstoff vorkommt. In gewisser Weise ist das schon eine computerlinguistische Leistung, denn das genaue Suchwort kommt in den Ergebnissen gar nicht vor. Trotzdem hilft ein solches Ergebnis zum Beispiel Medizinern nicht weiter“, erklärt er. „Mit computerlinguistischen Methoden könnte der Computer ermitteln, ob Texte zu einem bestimmten Fachgebiet gehören, und würde auf Wunsch nur Texte zurückgeben, die zum Fachgebiet der Suchanfrage passen.“
Etienne selbst ist Produktmanager in der Abteilung „Duden – Sprachtechnologie“. Er betreut die Software für Rechtschreib- und Grammatikkorrektur. „Ich arbeite an der linguistischen Basistechnologie genauso wie an Korrektur-Plug-ins für Anwendungsprogramme, zum Beispiel Adobe InDesign.“
Der Duden-Verlag jedoch sei nicht die einzige mögliche Arbeitsstelle: „Viele große IT-Firmen wie Google, IBM und SAP beschäftigen Computerlinguisten.“ Außerdem gebe es kleinere Unternehmen, die sich auf Dienstleistungen rund um Sprachanalyse spezialisiert haben, wie Dokumentenklassifikation oder Suchoptimierung. „Und man kann an der Universität oder in Forschungsinstituten wie dem Deutschen Forschungszentrum für Künstliche Intelligenz arbeiten.“
Das Studium selbst muss einem liegen. „Es ist eine Kombination aus Sprachwissenschaft und Informatik. Man sollte sich für Sprache interessieren und wissen wollen, wie sie funktioniert.“ Wie Sprache funktioniert? Etienne erklärt: „Ich beschäftige mich damit, wie unsere Sprache aufgebaut ist und wie wir damit kommunizieren. Wie kommt es zum Beispiel, dass man in dem Satz ‚Griebe Fibuster fidunkeln.‘ kein Wort versteht, trotzdem aber schlussfolgern kann, dass ‚griebe‘ ein Adjektiv ist, ‚fidunkeln‘ ein Verb – und dass es mehrere ‚Fibuster‘ sind, die da fidunkeln? Oder: Warum kann jemand auf die Frage ‚Entschuldigung, hast Du eine Uhr?‘ mit ‚Kurz vor zwölf.‘ antworten?“
Als Computerlinguist sollte man außerdem keine Angst vor Computern haben und die Bereitschaft mitbringen, ein, zwei Programmiersprachen zu lernen. „Man sollte abstrahieren können und Spaß daran haben, die Gesetzmäßigkeit hinter einer Reihe von Beobachtungen zu finden“, erzählt der 33-Jährige.
Gute Studienbedingungen habe er einst an der Uni vorgefunden. „In der Einführungsveranstaltung zu Studienbeginn waren wir 30 Leute. Es ist also definitiv kein Massenstudium. Der Kontakt zu den Lehrenden war sehr gut und es war leicht, seine Mitstudierenden kennen zu lernen.“
Den Berufszweig sieht Etienne im Kommen: „Das Internet und der Umgang mit Computern, Tablets und Handys wird immer wichtiger. Das größte Problem bei der Interaktion mit diesen Geräten ist, dass sie nicht besonders gut mit menschlicher sprachlicher Kommunikation klarkommen. Da gibt es noch viel zu tun.“
Übrigens: Der Duden-Verlag sucht regelmäßig engagierte Praktikanten/innen.
Text: Anja Landmann; Foto: Etienne Roth; Hintergrund © Helmut Niklas (fotolia.com)