Zusammenfassung der Ressource
Organizace znalosti
- 6. Odborná terminologie a vědecká
klasifikace
- termín
- • Základní charakteristiky
- 1. - jazyková správnost
- ustálenost
- jednoznačnost a přesnost
- nosnost
- motivovanost
- mezinárodnost
- systémovost
- • Význam termínu (tedy obsah
pojmu) je dán
- preskriptivní terminologie
- deskriptivní terminologie
- deskriptor
- jednoslovný nebo víceslovný výraz
- jasně určeným pojmovým významem
- opakovaně užíván v odborných textech
- možné jej zařadit do soustavy odborných názvů
daného oboru
- Terminologie
- 1) Nauka – terminologická teorie
- 2) Názvosloví (soubor termínů)
- 3) Terminologie - terminografie = Terminologická práce
- 7. Formální struktura a reprezentace dokumentu
- 1) Typologie dokumentů:
- a) podle druhu
- b) podle formy publikace
- c) Podle vztahu k původnímu znění
- 2) Struktura položek v
základním slovníku (LEMMA)
- Formální struktura dokumentu
- Tradiční
- Elektronická
- SGML - Standard Generalized
Markup Language
- 8. Sémantika a syntaktika notačního systému
- Znak
- • arbitrárnost znaku
- • Motivovanost znaku
- Zvuková motivovanost
- Morfematická motivovanost
- Sémantická motivovanost
- Selekční znak
- o Jmenný selekční znak
- o Věcný selekční znak
- Znak založený na přirozeném jazyce
(předmětové selekční jazyky)
- Znak založený na notaci
(systematické selekční jazyky)
- Notační systém
- Sémantika
- vyjádření hierarchických vztahů
- Syntaktika
- vyjadřuje možnost syntézy, kombinace znaků
- Notace
- Charakteristické vlastnosti notace
- zapamatovatelnost
- pohostinnost
- • expresivita
- • syntéza
- • flexibilita
- Typy notací
- • hierarchické, ale nestrukturované
- DDC (částečně) (Deweyův
desetinný systém
- • nehierarchické a strukturované
- BC2 (Blissovo třídění
- • hierarchické a strukturované
- CC - Dvojtečkové třídění (Colon
classification
- • nehierarchické a nestrukturované
- LCC (Library of Congress
Classification)
- 9. Procesy organizace znalostí,
automatizované procedury
- Procesy věcného zpracování
- indexace
- obecně tři typy procesů
- 1. obsahová analýza
- Selekční obraz dokumentu
- Nástroje na dosažení
kvality a konzistence
- 2. identifikace pojmů
- o specifičnost
- o úplnost
- 3. výběr selekčních znaků
- klasifikace
- Reindexace/reklasifikace
- • Důvody
- • Kritéria
- Automatizované procedury
- • typy
- o automatická indexace
- o automatická klasifikace
- o shlukování (klastrování)
- o abstrahování
- o automatická tvorba řízeného slovníku
- • výhody
- • nevýhody
- Hlavní problémy
- Typy automatické indexace
- • extrakce – slovní indexace (SI)
- SLOVNÍ INDEXACE = lexikální analýza
- Slovní indexace – lemmatizace
- o Algoritmické (gramatická
pravidla)
- o Slovníkově orientované
- o Statistické
- o Při indexaci
- o Při zpracování dotazu
- Slovní indexace - vážení
- • Kritéria vážení:
- o Výraz (slovní druh)
- o Text (délka, počet různých termínů)
- o Vztah výrazu a textu
- o Vztah termínu a celé db
- Slovní indexace – nevýznamová slova
- o klíčová slova z textu
- • přiřazování pojmová indexace (PI)
- POJMOVÁ INDEXACE
- • Pojmová indexace – vstup
- • Pojmová indexace - postup
- statistické a
matematickolingvistické
metody
- řízený slovník
- 10. Ontologie jako obecný typ organizace znalostí
- defince
- reprezentaci znalostí
- formalizovaný popis pojmů a jejich vztahů
- sémantické sítě
- přesně definovanou syntaxí
- strukturovaného
- pojmového slovníku
- • Obsahuje dvě části
- 1) Heslář (pojmy a jejich definice)
- 2) Tezaurus (vztahy mezi pojmy)
- • Ontologie se skládá ze 4 prvků:
- 1) Jedinci (entity)
- 2) Třídy (množiny)
- 3) Atributy (vlastnosti, parametry, charakteristiky)
- 4) Vazby (vztahy mezi dvěma jedinci)
- • Ontologie můžeme rozlišovat:
- • Univerzálně orientovaná ontologie
- WordNet
- • Doménová ontologie
- UMLS (lékařská terminologie
- Geopolitical ontology
- • Formalizace (formální jazyky)
- o Jazyky s tradiční syntaxí
- DOGMA (Developing
Ontology-Grounded Methods
and Applications)
- o Značkovací jazyky
- DAML+OIL
- Ontology Inference Layer (OIL)
- Web Ontology Language (OWL)
- Resource Description Framework (RDF)
- 11. Obecné vlastnosti univerzálních klasifikačních systémů a systémů
založených na přirozeném jazyce
- Pořádací systémy založené na přirozeném jazyce:
- • klíčová slova
- • unitermy
- • předmětová hesla
- heslar
- • tezaury (vztahy mezi pojmy
- 12. Reprezentace a vizualizace znalostí (mj. topic maps)
- Vrstvy
- • Informační vrstva
- • Znalostní vrstva
- Základními elementy / prvky map témat jsou
- Doplňkové prvky
- 5. Pojem a reprezentace pojmu
- pojem
- • intenze
- • extenze
- odraz
- vyjádření
- slovník, tj. formální vyjádření pojmů
- • Pojmy se rozlišují na:
- o Obecné a individuální
- o Nadřazené a podřazené, čili rodové a druhové
- • Význam obsahu pojmu je dán
- definicí – tzv. preskritptivní
(nařizující) terminologie
- výkladem – tzv. deskriptivní
(popisný) terminologie
- Semanticky trojuholnik
- pojem - designat
- znak - signifikace, symbolizuje, oznacuje
- objekt - designace, vztahuje se k...
- znak - designator
- pojem - signifikace, symbolizuje, oznacuje
- objekt - denotace, zastupuje
- objekt - denotat
- pojem - designace, vztahuje se k...
- znak - denotace, zastupuje
- • Pojem je myšlenková konstrukce vzniklá abstrakcí na
základě vlastností společných určité množině objektů
- 4. Obecné otázky kategorizace,
klasifikace a fazetace
- • Klasická teorie kategorie
- abstraktní pojem nezávislý na subjektu
- v klasické teorii kategorií objevovány nedostatky:
- rodinných podobností
- Wittgenstein
- objev centrality)
- různých označení pro jednu věc -
základy bázových kategorií
- Brown
- Eleanor Roschová
- 1. Centralita (teorie prototypů)
- o Členové kategorie nemají stejnou hodnotu
- nektere mají lepší příklad, než jiný
- 2. Bázové kategorie
- o Jisté kategorie jsou přirozenější než jiné
- dokážeme představit, „materializovat“ je ve své mysli
- strom, dub = rod
- Jak skutečně lidé kategorizují
- kognitivní vědy související s
prototypy a bázovými kategoriemi
- subjektivistickou
- experiencialismus.
- Kategorizace
- princip ekvivalence (stejnosti,
podobnosti)
- tři typy určování ekvivalence
- 1) zevnitř, obsahově, analýzou struktury (co jsme zjistili
- 2) zvenčí, formálně, podle „povrchu“, formy (co vidíme
- 3) Třetím způsobem je subjektivní
- Organizace spočívá
- 1) v seskupování stejných či podobných věcí
- 2) v oddělení (rozlišení) toho, co není úplně stejné
- kategorie
- Skupinu objektů, jež
považujeme za
ekvivalentní,
- Výsledkem kategorizace je definování struktury organizovaného celku
- • Kategorizace je syntéza – části spojujeme, zařazujeme do větších celků (postup zdola nahoru
- • Klasifikace je analýza – celek dělíme na části (postup shora dolů
- 3. Přístupy k organizaci znalostí – historický přehled, tzv.
klasický knihovnický přístup k organizaci znalostí, přístupy v
digitálním prostředí, doménová analýza
- 1. Tradiční přístupy
- pozitivistickém pohledu na svět
- • Enumerace
- • Princip řazení od obecného ke specifickému
- o MDT
- 2. Manažerské přístupy
- praktickou použitelnost - pragmatismem
- • Institucionální orientace
- standardizaci pořádání
- 3. Fazetová analýza
- • Analyticko-syntetický přístup (fazety)
- zařazení objektů do více tříd
- 4. Počítačově orientované přístupy
- algoritmizované postupy
- • Nestrukturované vyhledávání
- 5. Bibliometrie
- Kvantitativní analýza
- • citační index
- • citační analýza
- • Citační vazby
- 6. Uživatelsky a kognitivisticky
orientované přístupy
- • Uživatel je konečný cíl informačního procesu,
- folksonomie
- tagů
- 7. Doménová analýza
- vnímá kognitivní procesy v kontextu skupin individuí
- vliv kultury a společnosti
- jako doménu označujeme
libovolný sociální agregát,
jenž se skládá
- a. objektů zkoumání
- b. subjektů poznání a tvůrců informačních objektů
- c. informačních objektů
- d. informačních a komunikačních vztahů mezi
objekty zkoumání, subjekty a informačními
objekty
- e. vztahů souladu či nesouladu mezi objekty,
subjekty a informačními objekty
- • Základní charakteristika DA
- • Předpoklady pro DA:
- 2. Ontologická a epistomologická východiska OZ
- Ontologie = CO?
- semantika
- zajímá o samotné bytí a jeho
nejobecnějších určeních a
pojmech
- výslovný (explicitní) a formalizovaný
popis určité problematiky
- obsahuje definici pojmů a tezaurus
(definice vztahů mezi pojmy).
- Epistomologie = JAK?
- • realismus versus nominalismus
- konceptualismus
- Racionalizmus x Empirizmus
- o lidském poznání, jeho předpokladech,
charakteru, procesech a výsledcích
- Teleologie = ZA JAKÝM ÚČELEM?
- zabývající se studiem účelů, cílů a účelnosti samotné
- definuje účel jako předem vytyčený cíl
- • Účelností poté rozumíme zvolení vhodných prostředků
nasměrovaných tak, aby účelu bylo dosaženo
- 1. Organizace znalostí
- definice
- zpracování znalostí je efektivní - 3 charakt.
- • Prvky organizace znalostí – co se organizuje
- princip ekvivalence
- Problémy spojené s organizací znalostí
- 1. Obtížné určování efektivnosti
- 2. Subjektivnost v chápání obsahu/potřeby informace
- 3. Proměnlivost obsahu/potřeby informace v čase
- 4. Závislost na (přirozeném) jazyce a na kulturním kontextu
- 5. Pragmatický aspekt organizace versus teoretické principy
- 6. Informační zahlcení
- 7. Důvěryhodnost (credibility, authority, trustworthiness)
- Cíl organizace znalostí:
- rešeršní funkce
- dokumentová funkce
- pořádací funkce
- Znalost
- jako použitelná informace
- jako vědění či dokonce moudrost.
- o zaznamenané (explicitní)
- o nezaznamenané (implicitní)
- o Životní cyklus znalosti