A Naiv Bayes-háló lényegi feltételezése, hogy: Egy gyermek, több szülő csomópont. A szülők egymástól függetlenek.
A Naiv Bayes-háló lényegi feltételezése, hogy: Több gyermek, több szülő csomópont. A gyermek csomópontok egymástól függetlenek.
A Naiv Bayes-háló lényegi feltételezése, hogy: Egy gyermek, egy szülő csomópont, ezek egymástól függetlenek.
A Naiv Bayes-háló lényegi feltételezése, hogy: Több gyermek, egy szülő csomópont. A gyermek csomópontok egymástól függetlenek.
A Bayes-háló egy kompakt reprezentációja az együttes valószínűségi eloszlásnak.
A Bayes-háló feltételes függetlenségi/függőségi térképként reprezentálja a változók közötti kapcsolatokat.
A Bayes-háló asszociációs kapcsolati térképként reprezentálja a változók közötti függőségeket.
A Bayes-háló oksági kapcsolatokat is képes reprezentálni.
Az oksági kapcsolatok mindig egyben asszociációs kapcsolatok is.
Az asszociációs kapcsolatok mindig egyben oksági kapcsolatok is.
Az oksági kapcsolatok lehetnek asszociációs kapcsolatok is.
Az asszociációs kapcsolat hátterében sosem lehet oksági kapcsolat.
Egy csomópont feltételesen független az őseitől a gyermekek ismeretében.
Egy csomópont feltételesen független a nem leszármazottaitól a szülők ismeretében.
Egy csomópont feltételesen független a nem leszármazottaitól a gyermekek ismeretében.
Egy csomópont feltételesen független a leszármazottaitól a szülők ismeretében.
Egy csomópont feltételes valószínűségi táblája a szülők értékeinek konfigurációja szerint tartalmazza a csomópontra vonatkozó feltételes valószínűségeket.
A Bayes-háló feltételes függetlenségeket / függőségeket leíró gráfstruktúrája összhangban kell legyen a parametrizációval, melyet minden csomópontra a szülők értékei függvényében adunk meg.
A Bayes-háló által reprezentált együttes valószínűségi eloszlás a szülői halmazok alapján faktorálható (feltételes valószínűségek szorzatára).
A Bayes-háló által leírt függőségek mindig oksági kapcsolatokat jelentenek.
Egy adott csomópont szülei, gyermekei és testvérei tartoznak ebbe a halmazba. (Markov-takaró)
Egy adott csomópont szülei, gyermekei és szüleinek egyéb gyermekei tartoznak ebbe a halmazba. (Markov-takaró)
Egy adott csomópont szülei, gyermekei és gyermekeinek egyéb szülei tartoznak ebbe a halmazba. (Markov-takaró)
Egy adott csomópont szülei és gyermekei tartoznak ebbe a halmazba. (Markov-takaró)
Ha a leszámítolási tényező 1, és a jutalmaknak véges maximuma van, akkor végtelen lépéssor is véges összjutalmat eredményez.
A modellalapú ágens a környezetről is, önmagáról is modellt alkot, és ezeket frissíti.
A hasznosságorientált ágens a célhoz vezető különböző állapotsorozatokat (trajektóriákat) is képes értékelni.
Az állapot hasznosságát csak akkor tudjuk értelmezni, ha az adott állapotból csak egy végállapotba lehet eljutni.
A szekvenciális probléma iteratív megoldása során gyakran az értékek még nem konvergálnak pontosan, de a stratégia már egyértelmű lehet.
Mivel az időbeli különbség tanuláshoz nincs szükség az állapotátmenet-modellre, ezért Q-tanulásra is használható
A hasznosságfüggvény explicit reprezentációja jobb általánosító képességet tesz lehetővé, mint az implicit reprezentáció
Az adott állapothoz tartozó legnagyobb Q érték az állapot hasznosságát adja.
A mohó felfedezést végző ágens könnyen egy szuboptimumba juthat.
A hóbortos felfedezést végző ágens nagyon jól kiismeri környezetét, de nem aknázza ki ezt a tudását a jutalmak gyűjtésére.
Az aktív megerősítéses tanulásban kettős célja van az ágensnek: egyrészt minél nagyobb jutalmakat akar gyűjteni, másrészt javítani akarja a megszerzett tudást, a jövőbeli szekvenciákhoz.
Eljárásmód-iteráció esetén, ha a t-dik lépésben kiszámítottuk az Ut(s) értékeket, akkor a következő eljárásmód becslés – (πt+1 (s) – nem függ a leszámítolási tényezőtől.
Az időbeli különbség (IK) tanulási módszer hatékonyságát az állapotátmenet-mátrix optimális felhasználása adja.
Egy adott állapotban elvégezhető cselekvésekhez tartozó legnagyobb Q érték az állapot hasznosságát adja
Amennyiben a környezet sztochasztikus és az ágens érzékelői nem teszik lehetővé a környezet állapotainak meghatározását, akkor az ágens többállapotú problémával néz szembe.
A Bellman összefüggés felállításánál kihasználtuk, hogy a lépéssorozatban nyert jutalmak additívak.
Az optimális eljárásmód az állapotokhoz megadja azt a cselekvést, ami minden sorozatban a legnagyobb jutalmat fogja eredményezni.