Textgenerierung: Stories aus Datenbergen

Textgenerierung: Stories aus Datenbergen

Gaming, Streaming, Data | Vortrag | 30 min | Deutsch

DI | 13:00 | HÄKKEN

Menschen brauchen Stories: Wo Computer am liebsten große Datentabellen fressen, interessieren wir Menschen uns für Hervorhebungen, Priorisierungen, Einordnungen. Deshalb ist die Textform auch in unserer datengetriebenen Welt ein effizientes Mittel, um Informationen kompakt darzustellen.
Ganz so einfach ist es aber nicht, überzeugende Texte automatisch zu erstellen: Wer stumpf seine Datenfelder in einen Lückentext einfüllt, langweilt hat seine Leser*innen schnell und schöpft das Potenzial generierter Texte noch lange nicht aus. In diesem Vortrag erläutere ich, wie generierte Texte interessant und relevant gestaltet werden können. Eine gut durchdachte Datenanalyse spielt hier eine wichtige Rolle: Welche Informationen sind für die Leser*innen relevant? In welchem Kontext stehen sie? Ein guter generierter Text passt seine Inhalte den Gegebenheiten an und bringt das Wesentliche auf den Punkt.
Welche Rolle spielen KI und Deep Learning in diesem Kontext? Neuronale Netze zeigen heute ein beeindruckendes Niveau scheinbaren Sprachverständnisses. Aus meiner Sicht kommen Deep Learning-Methoden in der Praxis der Textgenerierung dennoch bislang kaum in Frage – im Vortrag beschkreibe ich einige aktuelle Entwicklungen und erläutere die noch bestehenden Lücken.

Sebastian Beschke

LangTec

Sebastian Beschke ist Informatiker und Computerlinguist und leitet bei LangTec das Text Generation-Team. Seit 2017 hat er an der Umsetzung zahlreicher Textgenerierungsprojekte mitgewirkt. Daneben interessiert er sich für die praktischen Einsatzmöglichkeiten von Machine Learning und Natural Language Processing.