Projekte

Textmining und Sprachverarbeitung - Hochschule Hannover

Extraktion von juristischen Verweisstrukturen: Intertextualität in Gesetzen, Kommentaren und Gerichtsurteilen (JuVer)

Beschreibung: In der Rechtswissenschaft spielen Texte eine zentrale Rolle und werden im Kontext weiterer Texte interpretiert. In diesem Projekt sollen Verfahren entwickelt werden, um diese komplexen Zusammenhänge innerhalb und zwischen den Texten explizit zu machen. Das Projekt beinhaltet die Entwicklung einer Pilotanwendung, den Aufbau eines Korpusses aus juristischen Texten und die Analyse der Bezüge zwischen den Verträgen. Dabei werden Methoden aus der künstlichen Intelligenz eingesetzt um Verweise zwischen den Texten systematisch zu erfassen.

Veröffentlichungen:
Beteiligte: Prof. Dr. Christian Wartena, Prof. Dr. Fabian Schmieder,
Frieda Josi M.A., Jean Charbonnier M.A.

Informationen: Projektwebseite

Analyse von Erneuerungsverträgen

Beschreibung: In dem Kooperationsprojekt zwischen einem Versicherungsunternehmen und der Hochschule Hannover soll untersucht werden, wie unternehmensinterne Underwriter beim Prüfen und Bewerten der Risiken in Vertragstexten und insbesondere beim Vergleich von aktualisierten Vertragstexten mit den früheren Versionen mit Methoden aus dem Bereich der automatischen Sprachverarbeitung unterstützt werden können.
Hierzu soll ein Prototyp eines Legal Tech Tools entwickelt werden.

Veröffentlichungen:
Beteiligte: Prof. Dr. Christian Wartena, Prof. Dr. Fabian Schmieder, Frieda Josi M.A.

LernMINT: Modellierung von Erwerb und Nutzung von Fachsprache im Physikunterrricht

Beschreibung: Promotionsstipendium im Rahmen des Promotionskollegs LernMINT. In den MINT-Fächer gehört das Schreiben von Versuchsprotokollen zu den fachsprachlich anspruchsvollen Aufgaben, deren Progression von der 5. bis 13. Klassenstufe in der Schule angestrebt wird. Die Nutzung maschineller Auswerteverfahren und der Modellierung der Lernprogression kann hier die Lehrkraft bei der Korrektur und der individuellen Förderung unterstützen. Der fachspezifischen Terminologie kommt dabei eine besondere Bedeutung zu. Im Projekt soll für die Physik über den Aufbau einer schulbezogenen Terminologiesammlung und die Verwendung von Verfahren wie künstlichen neuronalen Netzen eine anwendungsorientierte Auswertung von Protokollen erzielt werden. Der Transfer der gewonnenen Erkenntnisse von der Physik auf andere MINT-Fächer wird angestrebt.

LernMINT: Webseite des Promotionsprogramms

Beteiligte: Prof. Dr. Christian Wartena, Prof. Dr. Gunnar Friege

Verantwortungsvolle KI: Bias in gelernten semantischen Wortrepräsentationen

Beschreibung: Promotionsstipendium im Rahmen des Promotionskollegs Verantwortungsvolle Künstliche Intelligenz in der Digitalen Gesellschaft. Ziel des Promotionsvorhabens ist es Methoden für die Erstellung und Verwendung von Word Embeddings (gelernte semantische Darstellungen von Wörtern) zu entwickeln, die mit einem Bias im Trainingskorpus umgehen können. Erstens wird untersucht, wie ein Bias in Word Embeddings definiert und erkannt werden kann. Zweitens werden Verfahren entwickelt, um Bias, die es gibt, sichtbar zu machen, zum Beispiel indem die Dimensionen der Wortdarstellungen möglichst explizit gemacht werden und die latenten Repräsentation in explizite überführt werden. Hiermit können Gründe für die Klassifikation eines Wortes oder für eine gefundenen Ähnlichkeit zwischen Wörtern transparent gemacht werden. Drittens soll untersucht werden, in wie fern die Ansätze von Bolukbasi et al. (2016) und Zhao et al. (2018) zur Entfernung von einem Gender-bias verallgemeinert werden können und der Effekt eines beliebigen Bias (Alter, Herkunft, Hautfarbe aber auch Textsorte oder Stil) minimiert werden kann. Hiervon kann eine Anwendung, wie zum Beispiel die Erkennung von beleidigender Sprache profitieren mit dem Ziel die Gefahr, dass beleidigende Sprache vom Algorithmus mit unerwünschten Faktoren assoziiert wird, zu verringern.

Verantworungsvolle Künstliche Intelligenz in der Digitalen Gesellschaft: Webseite des Promotionsprogramms

Beteiligte: Prof. Dr. Christian Wartena, Prof. Dr. Eirini Ntoutsi>

Nachnutzung von Open-Access-Abbildungen (NOA)

Beschreibung:

Das NOA Projekt entwickelt ein Verfahren um multimediale Open Access Objekte automatisiert zu sammeln, zu erschließen und mithilfe der Wikimedia Commons bereitzustellen. Aktuell befinden sich über 1. Mio. Abbildungen in einer separaten Bilddatenbank. Das NOA Projekt wurde gestartet, um die Nachnutzbarkeit von Forschungsrohdaten, beispielsweise Abbildungen, zu erleichtern. Veröffentlichte Forschungsergebnisse erscheinen hauptsächlich als Textpublikationen angereichert mit Rohdaten. Diese Rohdaten, im NOA Projekt überwiegend Grafiken, Abbildungen und Fotos, sollen nun für weitere Forschungsarbeiten zur Verfügung gestellt werden.

Eine weitere Aufgabenstellung, des Projektes, ist die Bereitstellung der Abbildungen für die Öffentlichkeit. Dies soll mithilfe der Wikimedia-Infrastruktur durchgeführt werden. Den Autoren der Wikipedia soll zukünftig automatisch Bilder vorgeschlagen werden, die sie frei für die erstellten Artikel verwenden können. Die automatische Zuordnung der Bilder soll über die vorhandenen Kategorien der Wikipedia erfolgen. Die wissenschaftlichen Forschungsrohdaten werden somit leichter recherchierbar und können weltweit von Wikipedia-Nutzern verwendet werden.

DFG Projektnummer: 315976924

Link zur NOA-Bildersuche: noa.wp.hs-hannover.de

Link zur Projektseite: blogs.tib.eu/wp/noa