Informationsfilterung

Kontakt: Andreas LommatzschTill Plumbaum

 

Die Arbeitsgruppe "Information Retrieval" adressiert viele Themen innerhalb der Informationsgewinnung und der Künstlichen Intelligenz. Die wichtigsten Themen betreffen die effiziente Verwendung semantischer Informationen, die in Indizes eingebettet sind, die Optimierung des Suchraumes, der durch große Datenbestände entsteht, um die Anwendung der Filterverfahren zu erleichtern, die Verbesserung der Geschwindigkeit, um auch komplexe Verkettungen von Filterverfahren mit guter Performanz durchzuführen, und vieles mehr. Diese Ziele werden durch die Verbesserung und intelligente Koordination von Verfahren des maschinellen Lernens erreicht, die durch Berücksichtigung der Semantik die Qualität der Ergebnisse verbessern, durch die effiziente Verringerung der Suchräume die Antwortzeit verringern, und dadurch sowohl für hohe Skalierbarkeit als auch für die Zufriedenheit der Benutzer sorgen. 

Im Rahmen dieser Forschung konzentriert sich das CC IRML auf die mehrsprachige Suche und personalisierte Learning to Rank Strategien .

Mehrsprachige Suche erlaubt es uns, nach Dokumenten in verschiedenen Sprachen mittels einer einzigen Suchanfrage, die wir in unserer eigenen Sprache formuliert haben, zu suchen. Um dies zu erreichen, werden Wörter und Phrasen als semantische Konzepte in einer sogenannten Interlingua repräsentiert. Zum Beispiel kann das Wort 'bank' im Englischen sich entweder das Geldinstitut oder das Flussufer beziehen. Im Deutschen kann dasselbe Wort allerdings auch auf die Sitzgelegenheit im Park verweisen. Semantische Konzepte erlauben es uns, solche sprachübergreifenden Mehrdeutigkeiten aufzulösen.

Agenten Ensembles: Ensemble Lernen ist ein Forschungsgebiet, das sich mit der Kombination unterschiedlicher Modelle und Algorithmen des maschinellen Lernens beschäftigt. Ziel des Ensembles Lernens ist es, mehrer Modelle so zu kombinieren, dass die erreichte Ergebnisqualität über der Güte eines einzelnen Lernalgorithmus liegt. D.h. mehre einfache Modelle werden zu einem leistungsfähigen Modell aggregiert. Typische Anwendungsbereiche für Ensemble-Lernen-Algorithmen bilden mehrsprachige Systeme (Kombination von verschiedenen Sprachmodellen), Suchmaschinen (Kombination unterschiedlicher Qualitäts- und Relevanzmodelle) sowie Empfehlungssysteme.