Created by Sanni Parviainen
over 8 years ago
|
||
Question | Answer |
Aikasarjat | y= f(t). Aikasarjoissa toisena muuttujana on aina aika (merkitään t tai x). Tutkitaan, miten toisen muuttujan (y) arvot muuttuvat ajan mukaan. Lineaarinen riippuvuus, mallina regressiosuora |
Trendi | Pitkän aikavälin kehityssuunta. Yleensä ryhdytään tutkimaan kaavion avulla. Kaaviotyypiksi kannattaa valita hajontakaavio ilman viivaa. Yleensä väestöön liittyviä ennusteita tehtäessä huomioidaan ajan lisäksi väestön rakenne |
Trendin arviointi ja tasoitus | Trendiä kuvaava malli on pienimmän neliösumman menetelmään pohjautuva trendisuoran yhtälö. Havainnoissa on selvä kehityssuunnan muutos --> luotettavampi ennuste saadaan jättämällä poikkeavat havainnoit pois. Liukuva keskiarvo eliminoi suhdanne-, kausi- ja satunnaisvaihtelut (menneen kehityksen tarkastelu) |
Suhdannevaihtelu | Riippuu koko talouden yleissuhdanteista. Kuvataan aaltomaisella käyrällä, jonka aallonpituus vaihtelee. Yleensä aallonpituus on useita vuosia. Mittarina käytetään bruttokansantuotteen muutosprosenttia |
Kausivaihtelu | Jaksollinen vaihtelu, joka liittyy yleensä vuodenaikoihin. Havaitseminen edellyttää havaintojen tekoa useammin kuin kerran vuodessa (kuukausittain tai neljännesvuosittain) |
Satunnaisvaihtelu | Epäsäännöllinen vaihtelu, joka esiintyy aikasarjoissa erillisenä ilmiönä, jonka voivat aiheuttaa lakot, sodat, luonnonolosuhteet tai poliittiset liikehdinnät. Ei pystytä ennakoimaan tai kuvaamaan matemaattisesti |
Indeksit | Havainnollistaminen ja vertailun helpottaminen. Voidaan laskea millaisille muuttujille tahansa, useimmin käytettyjä ovat hintaindeksit ja volyymi-indeksit |
Indeksin perusajankohta | Perusajankohdan havaintoarvoa vastaa indeksiluku 100. Indeksiluku muuttuu samassa suhteessa kuin havaintoarvo. Esim. 2005=100 |
Yksinkertainen indeksi | Yhden tuotteen hinnan tai määrän tarkastelu. Prosenttiluku, joka ilmoittaa, kuinka monta prosenttia vertailuajankohdan indeksi on perusajankohdan indeksistä. Hinnasta käytetään merkintää p ja määrästä q |
Vertailuajankohdan indeksi | In= 100*an/a0 a0: perusajankohdan arvo an: vertailuajankohdan arvo |
Ryhmäindeksi | Tarkastellaan monen tuotteen hintojen ja määrien muutosten yhteisvaikutusta. Laskemiseen on erilaisia tapoja, mutta yhteistä niille on mukana olevien muuttujien arvojen painotus |
Hintaindeksi | Seurataan yleistä hintakehitystä. Kun hinnat nousevat, niin samalla rahamäärällä saa vähemmän hyödykkeitä kuin aiemmin |
Inflaatio | Rahan reaaliarvo eli ostokyky laskee. Mitataan kuluttajahintaindeksillä. Inflaatioprosentilla tarkoitetaan kuluttajahintaindeksin 12 kuukauden muutosprosenttia |
Inflatointi | Euromäärät muutetaan myöhäisemmän ajankohdan rahan arvoa vastaaviksi. Yleensä valitaan jokin ryhmäindeksi |
Näennäinen muutos ja reaalinen muutos | Kun kuvataan jotakin rahamääräistä muuttujaa pitkällä aikavälillä, niin yleensä on aiheellista huomioida myös rahan arvon muutos. Esim. palkan euromääräinen kehitys ajan mukana ei kerro vielä koko totuutta todellisesta kehityksestä. Jos hinnat ovat nousseet suhteessa enemmän kuin palkka, niin palkan reaaliarvo ja ostovoima ovat laskeneet |
Nimellishintaindeksi ja reaalihintaindeksi | Kun esim. asuntojen hintaindeksi on laskettu euromääräisten muutosten mukaan, kyseessä on nimellishintaindeksi. Kun lisäksi huomioidaan kuluttajahintojen muutos, saadaan reaalihintaindeksi |
Deflatointi | Toimenpide, jolla myöhempien ajankohtien euromäärät muutetaan aikaisemman ajankohdan rahan arvoa vastaaviksi. Deflatoidut arvot kuvaavat reaalikehitystä |
Satunnaisilmiö | AKA satunnaiskoe. Ilmiö, jossa sattuma vaikuttaa yksittäiseen tulokseen |
Stokastinen malli | Matemaattinen malli, joka kuvailee satunnaisilmiöitä |
Alkeistapaus | Satunnaiskokeen tulosmahdollisuus. Alkeistapausten joukkoa kutsutaan otosavaruudeksi, jota merkitään symbolilla omega |
Tapahtuma | Tietty, jonkin ehdon toteuttava alkeistapaus. Merkitään A, B,... |
Kombinatoriikka | Erilaisten mahdollisuuksien lukumäärien laskeminen |
Tuloperiaate | Kertolasku. Lasketaan esim. kuinka monta väriyhdistelmää on talon maalaamiseen tai kuinka monella tavalla yksi rivi voidaan täyttää veikkauksessa. n1*n2*...nk |
Permutaatio | Keskinäisten järjestysten lukumäärä. Lasketaan esim. kuinka moneen keskinäiseen järjestykseen kirjaimet A, B, C ja D voidaan asettaan: 4!=24. Erikseen on määritelty, että 0!=1. Kun keskenään samanlaiset alkiot vaihtavat paikkaa, niin järjestyksen ei oleteta muuttuvan--> n!/n1!*n2!*...nk! |
Variaatio | Järjestetyt osajoukot. Lasketaan esim. kuinka monta järjestettyä paria voidaan muodostaa kirjaimista A-D. Parin eka jäsen voidaan valita neljästä kirjaimesta ja toka kolmesta jäljellä olevasta: 4*3=12. |
Järjestetty pari | Tarkoittaa sitä, että esim. pari AB tulkitaan eri yhdistelmäksi kuin BA. Keskinäisellä järjestyksellä siis on merkitystä (variaatio) |
Kombinaatio | Osajoukkojen järjestyksellä ei ole merkitystä. Lasketaan esim. kuinka monta paria kirjaimista A-D saadaan, kun keskinäisellä järjestyksellä ei ole merkitystä --> 4*3/2=6. Kombinaatioiden lukumäärää merkitään (nk)= n!/k!*(n-k)! |
Tapahtuman tilastollinen todennäköisyys | määritellään laajan kokemusperäisen (empiirisen) havaintoaineiston perusteella tapahtuman suhteellisena osuutena eli suhteellisena frekvenssinä. P(A)= tapahtuman A esiintymiskertojen lkm/satunnaiskokeen toistojen lkm |
Todennäköisyyden klassinen määrittely | Oletetaan, että kaikki alkeistapaukset ovat yhtä mahdollisia. P(A)=k/n (suotuisten alkeistapausten lkm jaetaan kaikkien alkeistapausten lkm) |
Todennäköisyyden yleinen määrittely | Kolmogorovin aksioomajärjestelmä: 1) 0<P()<1. 2) P(omega)=1 ts. on varmaa, että jokin tapaus tapahtuu. 3) P(A)+P(B) kun tapahtumat eivät voi sattua yhä aikaa eli ovat toisensa poissulkevia |
Vastatapahtuma | Tapahtuman A vastatapahtuma on, että A ei esiinny. AKA komplementtitapahtuma. P(komplementti)=1-P(A) P(A)=1-P(komplementti) |
Y | Tapahtumat eivät voi tapahtua yhtä aikaa eli ovat toisensa poissulkevia: P(A tai B)=P(AᴗB)=P(A) + P(B). Tapahtumat voivat tapahtua samanaikaisesti: P(A tai B)= P(AᴗB)= P(A) + P(B) - P(AᴖB) |
Kertolaskusääntö | Tapahtumat ovat riippumattomia: P(A ja B)= P(AᴖB)= P(A)*P(B) |
Kertolaskusääntö: ehdollinen todennäköisyys | Jos tapahtuman B todennäköisyys riippuu tapahtumasta A, merkitään B:n todennäköisyyttä P(B/A) P(A ja B)= P(AᴖB)= P(A)*P(B/A) |
Kokonaistodennäköisyys ja Bayesin kaava | Kokonaistodennäköisyys liittyy tilanteisiin, joissa on useita toisistaan riippuvia todennäköisyyksiä |
Satunnaismuuttuja | AKA stokastinen muuttuja. Muuttuja x(alleviivaus), jonka arvo määräytyy satunnaisluonteisen kokeen tai ilmiön lopputuloksena. Arvot ilmaistaan numeerisesti |
Todennäköisyysjakauma | Satunnaismuuttujan mahdolliset arvot xi ja niihin liittyvät todennäköisyydet pi muodostavat satunnaismuuttujan todennäköisyysjakauman. Todennäköisyyksien pi summa on aina 1 |
Tiheysfunktio | Todennäköisyyksien muodostama funktio. Merkitään f(x) |
Diskreetti satunnaismuuttuja | Satunnaismuuttuja, joka saa vain tiettyjä esim. kokonaislukuarvoja. Vastaavaa todennäköisyysjakaumaa sanotaan diskreetiksi jakaumaksi |
Jatkuva satunnaismuuttuja | Saa periaatteessa mitä tahansa reaalilukuarvoja tietyllä välillä. Sen todennäköisyysjakauma on jatkuva jakauma |
Kertymäfunktio, F | Kaikille, etenkään jatkuville jakumille ei ole mielekästä ilmoittaa jokaista muuttujan arvoa vastaavaa todennäköisyyttä. Tällöin lasketaan todennäköisyyksiä, että muuttujan x arvo on jollakin tietyllä välillä. Arvot vastaavat summafrekvenssejä. F arvo kohdassa a ilmoittaa, millä todennäköisyydellä satunnaismuuttuja x saa arvon, joka on enintään a |
Todennäköisyysjakauman tunnuslukuja | Satunnaismuuttujan arvoja kuvaavista tunnusluvuista tärkeimmät ovat odotusarvo, varianssi ja keskihajonta. Odotusarvo= pitkän koesarjan tulosten keskiarvo. Varianssi ja keskihajonta mittaavat keskimääräistä poikkeamaa odotusarvosta |
Epäjatkuvat todennäköisyysjakaumat | Binomijakauma, Poisson-jakauma |
Binomijakauma | Edellytykset: 1)sama ilmiö toistuu useita kertoja, 2)tulosmahdollisuuksia on kaksi, 3)A:n esiintymistodennäköisyys on jokaisella toistokerralla sama, 4)toistojen tulokset ovat toisistaan riippumattomia. Tarkastellaan A:n esiintymiskertojen lukumääriin liittyviä tod.näk. Parametrit: n(toistojen lkm), p(tod.näk) |
Poissonjakauma | Tarkastellaan tapahtumien esiintymisiä tietyllä aikavälillä tai alueella. Edellytykset: 1)tapahtuman tod.näk. on sama kahdella yhtä pitkällä välillä, 2) tapahtuman esiintyminen on riippumaton tapahtuman esiintymisestä muilla väleillä. Parametri: μ (odotusarvo) |
Jatkuvat todennäköisyysjakaumat | Yksittäisen kohdan todennäköisyysmassa on ykkönen jaettuna äärettömällä. Yksittäisen arvon todennäköisyys on häviävän pieni. Tiheysfunktion kuvaaja on jatkuva käyrä. Käyrän ja x-akselin väliin jäävä alue muodostaa massan, jonka pinta-ala on 1. Tiheysfunktion ja kertymäfunktion kuvaajien muoto ja sijainti vaihtelevat jakauman mukaan |
Jatkuvat todennäköisyysjakaumat | Normaalijakauma (Gaussin jakauma) ja eksponenttijakauma |
Normaalijakauma | Tärkein jatkuva todennäköisyysjakauma. Tiheysfunktion kuvaajaa kutsutaan Gaussin käyräksi. Tiheysfunktio f(x) määritellään odotusarvon ja keskihajonnan avulla. Tiheysfunktion kuvaaja on symmetrinen odotusarvon suhteen. Kuvaajan sijainti määräytyy odotusarvon mukaan ja muoto keskihajonnan mukaan |
Normaalijakauman todennäköisyysmassa | Keskittyy odotusarvonsa ympärille. 68,28% muuttujan arvoista poikkeaa odotusarvosta korkeintaan keskihajonnan verran. 95,45% eroaa korkeintaan kahden keskihajonnan verran. 99,73% arvoista on korkeintaan 3 keskihajonnan mitan päässä odotusarvosta |
Eksponenttijakauma | Tärkein jakauma tutkittaessa satunnaisvaihteluiden alaisia kestoaikoja tai tapahtumien välisiä aikoja. Jatkuvaa satunnaismuuttujaa sanotaan eksponentiaalisesti jakautuneeksi parametrilla a. Odotusarvo ja keskihajonta ovat 1/a |
Eksponenttijakauman unohtavaisuusominaisuus | Muuttuja "ei muista" aikaisemmin esiintynyttä tapahtumaa. Jos satunnaismuuttuja kuvaa jonkin komponentin kestoaikaa, niin ajan x0 kestäneen komponentin jäljellä oletettavasti oleva kestoikä on sama kuin käyttämättömän komponentin |
Tilastollinen päättely | Pohditaan, mitä johtopäätöksiä aineistosta saatujen tietojen pohjalta voidaan tehdä. Virheitä on voinut sattua: mittarien määrityksessä, mittauksessa, koodauksessa ja taitamattomassa aineiston käsittelyssä |
Estimointi | Tehdään päätelmiä perusjoukon ominaisuuksista otoksesta saatujen tietojen perusteella. Otoksesta laskettujen suureiden arvot ovat vastaavien perusjoukkoa kuvaavien suureiden eli parametrien estimaatteja. Otoksen tunnusluvut ovat perusjoukon suureiden estimaattoreita. Estimaattoreiden numeeriset arvot ovat estimaatteja |
Luottamusväli (estimointi) | Otoksesta laskettujen estimaattien perusteella voidaan määrittää väli, jolla perusjoukon vastaava tunnusluku sijaitsee tietyllä todennäköisyydellä. Luottamustaso kuvaa virhearvioinnin todennäköisyyttä. Usein käytetään 95%:n luottamustasoa |
Keskiarvon luottamusväli | Lasketaan mahdollinen poikkeama otoskeskiarvosta. Poikkeaman suuruuteen vaikuttavat keskihajonta, otoskoko ja luottamustaso. Kertoimen arvoa nostettaessa luottamusväli suurenee. 99%:n luottamusväliä vastaava kerroin on 2,58. Mitä suurempi hajonta, sitä pitempi luottamusväli |
Luottamusvälin virhemarginaali | AKA otoksesta laskettu keskivirhe. Keskivirhe kuvaa tunnusluvun luotettavuutta; mitä pienempi keskivirhe, sitä luotettavampi on tunnusluku |
Suhteellisen osuuden luottamusväli | Arvioitaessa otoksen perusteella esim. asian kannatusta tai virheellisten tuotteiden osuutta tuotannosta, lähtökohtana on otoksesta saatu prosenttiosuus. Epävarmuutta kuvataan virhemarginaalilla |
Tilastolliset testit | Pyritään selvittämään tiettyjen ennakkokäsitysten paikkansa pitävyyttä perusjoukossa. Testausmenettelyllä on tarkoitus tutkia, kumpi hypoteeseista on oikea |
Hypoteesit | Nollahypoteesi H0, vastahypoteesi H1. Testeissä ennakko-olettamus H0 pyritään osoittamaan vääräksi, eli hylkäämään nollahypoteesi. Nollahypoteesin oletetaan olevan voimassa, ellei voida muuta osoittaa. Vaihtoehtoinen hypoteesi voi olla yksi- tai kaksisuuntainen |
Testimuuttuja | Suure, jonka arvojen perusteella johtopäätökset hypoteesien voimassaolosta tehdään. Testisuureen arvoa verrataan vastaavaan todennäköisyysjakaumaan. Jos laskettu arvo on hyvin epätodennäköinen, eli asettuu äärirajoille, havaintoarvot tuskin noudattavat ennakko-olettamuksen mukaista jakaumaa--> H0 hylätään |
Testauskäsitteitä | Vapausasteet (df) kuvaavat "vapaiden muuttujien" lukumäärää. Testisuureen arvoa vastaa aina riskitaso eli merkitsevyystaso, jota nimitetään myös p-arvoksi. P-arvo on hylkäämisvirheen todennäköisyys, jonka perusteella tehdään hypoteeseja koskevat johtopäätökset |
1. lajin virhe | Hylkäämisvirhe. Hylätään nollahypoteesi, vaikka se on tosi. Vakavampi kuin hyväksymisvirhe. Mitään vaikutusta tai eroavuutta ei saa pitää todettuna, jos se voidaan selittää sattumasta johtuvaksi. Testauksessa kiinnostuksen kohteena on tämä virhe. Laskettu p-arvo ilmoittaa, kuinka suuri riski on hylätä oikea H0 |
2. lajin virhe | Hyväksymisvirhe. Hyväksytään nollahypoteesi, vaikka se on epätosi |
P-arvo | Kun testissä saadaan pieni merkitsevyystaso eli p-arvo, niin H0 voidaan hylätä, koska virhepäätelmän mahdollisuus on pieni. Usein käytetty riskiraja on 5% eli jos p<0,05, niin H0 hylätään. Muita usein käytettyjä riskirajoja ovat 0,01 ja 0,001 |
P-arvon merkitsevyys | P<0,001: erittäin merkitsevä (***) 0,001<p<0,01: merkitsevä (**) 0,01<p<0,05: melkein merkitsevä (*) 0,05<p<0,10: suuntaa antava |
Testin valinta | Tutkimustilanne, muuttujien mittaustaso, vertailtavien ryhmien riippuvuus, muuttujien jakauma |
Testauksen päävaiheet | 1) Asetetaan hypoteesit. 2) Valitaan testi. 3) Varmistetaan testin soveltuvuuden edellytykset. 4) Lasketaan testisuure ja merkitsevyystaso. 5) Tehdään johtopäätökset. 6) Tulkitaan tulos selväkielisesti |
Jakauman normaalisuuden tutkiminen | Useiden parametristen testien edellytyksenä on, että muuttujat noudattavat likimain normaalijakaumaa. Graafinen tarkastelu: histogrammi. Normaalisti jakautuneen aineiston keskiarvo, mediaani ja moodi ovat samat, vinous ja huipukkuus ovat 0. Laskennallinen tarkastelu: Kolmogorov-Smirnovin testi |
Kolmogorov-Smirnovin testi | Nollahypoteesi on, että jakaumat eivät poikkea toisistaan. Ts. nollahypoteesi on, että tarkasteltava jakauma noudattaa normaalijakaumaa |
Riippuvuuden testaaminen | Selvitetään kahden muuttujan keskinäistä riippuvuutta. Selviää vain riippuvuuden olemassaolo, ei sen laatu (ei voida määrittää, kumpi on syy ja kumpi seuraus) |
Riippuvuustestin valinta | Luokitteluasteikollinen: X2-testi. Järjestysasteikollinen: järjestyskorrelaatiokertoimen testaus. Määrällinen: Pearsonin korrelaatiokertoimen testaus |
X2-riippumattomuustesti | Tutkitaan kahden muuttujan, joista toinen on luokitteluasteikollinen, riippuvuutta. Ristiintaulukointi. H0: muuttujat ovat riippumattomia. H1: muuttujat riippuvat toisistaan. Edellytykset: 1)otos poimittu satunnaisesti ja riippumattomasti, 2)korkeintaan 20% frekvensseistä saa olla pienempiä kuin 5, 3)kaikki frekvenssit ovat suurempia kuin 1 |
X2-yhteensopivuustesti | Ei ole riippuvuustesti. Testataan, kuinka hyvin aineistosta saadut frekvenssit noudattavat jotain tunnettua jakaumaa. Usein vertailtavana jakaumana on tasajakauma (kannatus yhtä suuri). H0: muuttuja noudattaa oletettua jakaumaa. H1: muuttuja ei noudata oletettua jakaumaa. Edellytykset samat kuin riippumattomuustestissä |
Korrelaatiokertoimen testaus | Kahden määrällisen muuttujan välisen lineaarisen riippuvuuden mittaaminen. Testaaminen perustuu normaalijakaumaa muistuttavaan t-jakauman testisuureeseen ja p-arvoon. H0: muuttujat ovat riippumattomia. H1: riippuvat toisistaan. Edellytykset: 1)muuttujat määrällisiä, 2)muuttujat noudattavat normaalijakaumaa |
Yhden otoksen keskiarvon t-testi | Poikkeavatko tutkittavan perusjoukon odotusarvo ja jokin tietty luku toisistaan. H0: μ = μ0 H1: μ ≠ μ0 (kaksisuuntainen) H1: μ > μ0 tai μ < μ0 (yksisuuntainen) Edellytykset: 1)otos poimittu satunnaisesti ja riippumattomasti, 2) muuttuja on määrällinen ja normaalisti jakautunut |
Kahden otoksen keskiarvojen t-testi | Joko riippumattomien otosten t-testi tai riippuvien otosten t-testi (verrannollisten parien). H0: μ1 = μ2 H1: μ1 ≠ μ2 (kaksisuuntainen) H1: μ1 > μ2 tai μ1 < μ2. Edellytykset: 1)otokset poimittu satunnaisesti ja riippumattomasti, 2)muuttujat määrällisiä ja normaalisti jakautuneita. Testataan variansseja |
Levenen testi | T-testin yhteydessä tilasto-ohjelma antaa Levenen varianssien yhtäsuuruustestin tuloksen. Nollahypoteesina on, että varianssit ovat yhtä suuret (ei eroa) |
Varianssianalyysi, ANOVA | Pyritään selittämään ryhmien välillä esiintyviä eroja tai muuttujien välisiä vaikutussuhteita. Useimmiten vertaillaan määrällisen (selitettävän) muuttujan arvoja laadullisen (selittävä) muuttujan luokissa. Verrataan ryhmien keskiarvoja ja testataan erojen merkitsevyyttä. Yksi- ja monisuuntainen analyysi |
ANOVA:n hypoteesit ja edellytykset | H0: μ1 = μ2... (ryhmät eivät eroa perusjoukossa) H1: μ1 ≠ μ2 (väh. 1 ryhmä eroaa) Edellytykset: 1)otokset poimittu satunnaisesti ja riippumattomasti, 2)muuttujat määrällisiä ja normaalisti jakautuneita, 3)osaryhmien varianssit yhtä suuret |
ANOVA (jatkuu) | Varianssien yhtäsuuruus voidaan testata Levenen testillä. Ryhmäkeskiarvojen parittaiseen vertailuun käytettävät testit: Scheffe, LSD, Sidaki, Tukey, Student-Newman-Keuls, Duncan. Yleispätevin on Tukeyn testi, joka huomioi koko aineiston hajonnan |
Ei-parametriset testit (jakaumasta vapaat) | Kolmogorov-Smirnovin testi, Mann-Whitney'n U-testi, Wilcoxonin Signed Rank-testi, Kruskal-Wallisin testi |
Kolmogorov-Smirnovin testi | Testataan yhden otoksen muuttujan jakaumaa. Kolmogorov-Smirnovin Z-testi on kahden riippumattoman otoksen keskiarvotesti, joka vastaa parametristen testien t-testiä. H0: jakaumat eivät poikkea toisistaan |
Mann-Whitney'n U-testi | Kahden riippumattoman otoksen testi, joka vastaa lähinnä riippumattomien otosten t-testiä. Testi perustuu havaintoarvojen järjestyslukuihin. Edellytykset: 1)otokset poimittu satunnaisesti, 2)muuttuja väh. järjestysasteikollinen, 3)perusjoukkojen jakaumat keskenään samanlaiset |
Wilcoxonin Signed Rank -testi | Kahden riippuvan otoksen testi, joka on vastine riippuvien otosten t-testille. Tutkitaan kahden ryhmän jakaumien samanlaisuutta. Toistomittauksessa H0 on, että muutosta ei ole tapahtunut. Jakauman suhteen ei ole vaatimuksia. Edellytyksenä on, että mitattava muuttuja on väh. järjestysasteikollinen |
Kruskal-Wallisin testi | Kolmen tai useamman riippumattoman otoksen ei-parametrinen testi, joka vastaa varianssianalyysia. Käytetään, kun varianssianalyysin oletukset eivät ole voimassa. Edellytykset: 1)riippumattomat ryhmät, 2)muuttuja väh. järjestysasteikollinen |
Want to create your own Flashcards for free with GoConqr? Learn more.