IET

Informationsextraktion aus Tweets 

Kompetenzzentrum: Information Retrieval and Machine Learning
Kontakt: Prof. Dr.-Ing. Sahin Albayrak, Sascha Narr

Partner: SearchMetrics 


Soziale Netzwerke und Dienste wie Twitter stellen reichhaltige Datenquellen dar, in denen Tausende von Nutzern Informationen austauschen. Unter anderem werden dabei auch häufig Äußerungen über z.B. Produkte, Firmen und Marken getroffen. Die automatisierte Analyse der ausgetauschten Textnachrichten ermöglicht es, einen Überblick über die Reaktion und Meinungen zu bestimmten Marken oder Produkten zu erhalten, Trends und Trendsetter zu identifizieren, und zielgerichtetes Marketing betreiben zu können. 

Sprachidentifikation und Erkennung von Emotionen

Im Rahmen des Projekts IET werden Verfahren entwickelt, mit denen zunächst erkannt werden kann, in welcher der vielen auf Twitter benutzten Sprachen ein Tweet verfasst ist. Daraufhin wird analysiert, ob der Tweet bekannte Entitäten wie Personen oder Produkte enthält, und ob er eine subjektive Meinung enthält. Tut er dies, wird ebenfalls erkannt, ob die Meinung positive oder negative Gefühle ausdrückt. Die Verfahren sind speziell ausgerichtet auf die speziellen Merkmale von Textstücken wie Tweets. Sie sind daher robust gegenüber der Kürze der Texte und Schreibfehlern und können auch umgangssprachliche Ausdrücke und inkomplette Sätze verarbeiten.