Created by Johanna Lubian
over 8 years ago
|
||
Question | Answer |
(Definition) IE | Informationsextraktion ist ein Prozess, welcher Texte in einem festen Format, strukturiert und durch eindeutige Daten darstellt |
Wann ist IE besonders nützlich? | - Information ist explizit angegeben - kleine Zahl von Templates reicht aus - benötigte Information ist relativ lokal im Text |
Nenne 4 grundlegende Typen von Elementen, die aus einem Text extrahiert werden können. (Mit Beispiel) | - Entitäten (Personen, Firmen, Orte, Gene, Medikamente) - Attribute (Titel und Alter einer Person) - Fakten (ausgedrückt als Relationen zwischen Entitäten: ist-beschäftigt-bei) - Ereignisse (Entitäten sind an Ereignissen beteiligt: Firmenübernahme) |
Teilaufgaben bei IE | NE CO TE TR ST |
Was bedeutet NE? | Named Entity recognition - Um welche Grösse geht es? - Um welche Wert- Grössenangaben? < Finden und klassifizieren von Namen, Orten, Uhrzeiten...> |
Was bedeutet CO? | Coreference resolution Auflösen von Koreferenz-Beziehungen zwischen referierenden Ausdrücken und Entitäten < bestimmen, welche Ausdrücke auf dieselben Objekte verweisen> |
Was bedeutet TE? | Template Element construction - jedes TE besteht aus einem generischen Objekt und einigen Eigenschaften, die es beschreibt <Ne-Ergebnisse werden (mittels CO) mit weiteren Informationen angereichert> |
Was bedeutet TR? | Template Relation construction - Welche Beziehung gibt es zwischen Entitäten? - werden oft durch Verben (und Verbalphrasen) ausgedrückt Bsp.: <Groesse> verlor <Prozentwert> auf <Wert> |
Was bedeutet ST? | Szenario-Templat Informationen zu komplexeren Ereignissen werden zusammengestellt <Zusammenfügen der Ergebnisse aus TE und TR in vordefinierte Ereignis-Szenario> |
Wie werden unterschiedliche Wortklassen markiert? | mit tags, festgelegt wird das in sog. Tag sets |
Want to create your own Flashcards for free with GoConqr? Learn more.