IE-Informationsextraktion

Beschreibung

Bachelor Dokumentenverarbeitung Karteikarten am IE-Informationsextraktion, erstellt von Johanna Lubian am 16/03/2016.
Johanna Lubian
Karteikarten von Johanna Lubian, aktualisiert more than 1 year ago
Johanna Lubian
Erstellt von Johanna Lubian vor mehr als 8 Jahre
6
1

Zusammenfassung der Ressource

Frage Antworten
(Definition) IE Informationsextraktion ist ein Prozess, welcher Texte in einem festen Format, strukturiert und durch eindeutige Daten darstellt
Wann ist IE besonders nützlich? - Information ist explizit angegeben - kleine Zahl von Templates reicht aus - benötigte Information ist relativ lokal im Text
Nenne 4 grundlegende Typen von Elementen, die aus einem Text extrahiert werden können. (Mit Beispiel) - Entitäten (Personen, Firmen, Orte, Gene, Medikamente) - Attribute (Titel und Alter einer Person) - Fakten (ausgedrückt als Relationen zwischen Entitäten: ist-beschäftigt-bei) - Ereignisse (Entitäten sind an Ereignissen beteiligt: Firmenübernahme)
Teilaufgaben bei IE NE CO TE TR ST
Was bedeutet NE? Named Entity recognition - Um welche Grösse geht es? - Um welche Wert- Grössenangaben? < Finden und klassifizieren von Namen, Orten, Uhrzeiten...>
Was bedeutet CO? Coreference resolution Auflösen von Koreferenz-Beziehungen zwischen referierenden Ausdrücken und Entitäten < bestimmen, welche Ausdrücke auf dieselben Objekte verweisen>
Was bedeutet TE? Template Element construction - jedes TE besteht aus einem generischen Objekt und einigen Eigenschaften, die es beschreibt <Ne-Ergebnisse werden (mittels CO) mit weiteren Informationen angereichert>
Was bedeutet TR? Template Relation construction - Welche Beziehung gibt es zwischen Entitäten? - werden oft durch Verben (und Verbalphrasen) ausgedrückt Bsp.: <Groesse> verlor <Prozentwert> auf <Wert>
Was bedeutet ST? Szenario-Templat Informationen zu komplexeren Ereignissen werden zusammengestellt <Zusammenfügen der Ergebnisse aus TE und TR in vordefinierte Ereignis-Szenario>
Wie werden unterschiedliche Wortklassen markiert? mit tags, festgelegt wird das in sog. Tag sets
Zusammenfassung anzeigen Zusammenfassung ausblenden

ähnlicher Inhalt

Geographie Quiz
AntonS
Klinische Psychologie-Grundlagen
evasophie
Grundlagen SAP ERP und SAP NetWeaver
zok42.com
The United Kingdom - Identity and Immigration
Laura D
Einführung in die Forschungsmethoden Kapitel 1
Angelina Idt
FOLO (PuKW STEOP B)
Lara Gundacker
Vetie Mikrobiologie 2013
Maria Jacob
Vetie Histopathologie 2013
Cedric-Bo Lüpkemann
Vetie Para Morphologie
Kristin E
Vetie: Geflügelkrankheiten 2020
Johanna Tr
STADA Jörg Matthes 2021
Julia W.