Criado por Wilco Wietsma
aproximadamente 10 anos atrás
|
||
Week 2 | Onderzoek 2Vandaag gaan we bekijken hoe je bij een A-selecte steekproef een omvang kan bepalen. SteekproevenIn veel gevallen zullen marktonderzoekuitkomsten gebaseerd zijn op steekproefuitkomsten. Een steekproef moet niet te klein zijn en op correcte wijze uit populatie worden getrokken. Deze dient een goede afspiegeling te zijn van de gehele populatie.RepresentativiteitHoe weten we of een steekproef representatief voor de populatie? We weten dat nooit helemaal zeker.Nauwkeurigheid (interval)Betrouwbaarheid (%)Keuze van steekproefmethode hangt af van:- Beschikbare informatie- Omvang / aard onderzoekspopulatie- Doel van het onderzoekGeneraliseren steekproefuitkomstenNauwkeurigheid (E): mate waarin de steekproef de werkelijke waarde van de populatieparameter (pie teken) benadert (interval).Pie: populatiefractie deel van de populatie dat het onderzochte kenmerk bezit. Bijv. OV abbonement, tevredenheidP: steekproeffractie (resultaat van je steekproef onderzoek)Betrouwbaarheid (Z): mate van zekerheid betreffende de nauwkeurigheid v/d steekproefschatting (%).Z= constante die samenhangt met de gewenste betrouwbaarheid v/d uitspraken die ment doet over de populatie: 99,7%: z = 3 95,4% z = 2 95% z= 1,96 90% z= 1,65 68,3 z= 1 Betrouwbaarheden vallen samen met bepaalde oppervlakten onder de normale verdeling. Zie afbeelding: Relatie oppervlakte normaalverdeling en Z. De steekproefuitkomstHoe dichter in de buurt van 50%, des te groter de nauwkeurigheidsmarge.Steekproefformule (N>5000)Steekproefomvangbepaling: n= z² * pie (1-pie) ----------------------- E²Pie = populatie fractieAls waarde van pie niet geschat kan worden, gebruik pie = 0.5 in de formule (!)Maximaal toegestane afwijking t.o.v. Pie: E = z (wortel) P (1 - P)----------------------------- nPopulatie maakt niet uit, tenzij deze kleiner is dan 5000:n = pie(1 - pie)---------------------E² + pie(1-pie)-- -------------z² N"Op basis van een steekproef kun je het volgende zeggen: Met een betrouwbaarheid of kans van 95% ligt de populatiefractie (pie) tussen (p-E) en (p+E). "
A-selecte steekproef heb je een x aantal deelnemers in een database.Alles met Griekse letters heeft betrekking op de populatie. En met Latijns op de steekproef.Zorg dat je de Z-waardes uit je hoofd kent voor het tentamen.
Opdrachten Week 2 Opgaven 2.1. Een opdrachtgever wil een marktonderzoek laten uitvoeren naar de tevredenheid over zijn nieuwe product onder zijn klanten. Hij wil de resultaten graag met 95% betrouwbaarheid kunnen interpreteren, en de maximaal toegestane afwijking mag 5% bedragen. Zijn klantenbestand is enkele tienduizenden personen groot. Wat is de benodigde steekproefomvang? 1.96²*0,5 (1-0.5) 0.9604---------------------- = --------------- = 384.16 0.05² 0.00252.2. Ad 1: stel dat de populatie (klantenbestand) bestaat uit 1500 personen. Hoe groot is dan de benodigde steekproefomvang, uitgaande van dezelfde voorwaarden? 0.5(1-0.5) 0.25-------------- ------------------- = 305.830.0025 + 0.5(1-0.5) = 0.0006507705122865 + 0.000166666666666--------- --------------1.96² 15002.3. Stel dat we met 4%-punten onnauwkeurigheid het percentage Emmenaren, dat de afgelopen maand pizza heeft gegeten, willen vaststellen. Veronderstel dat een betrouwbaarheidsniveau van 90% voldoende is: a. Welke steekproefomvang is vereist, indien er geen veronderstellingen over de ware populatiefractie worden gemaakt? b. Als kan worden aangenomen dat de werkelijke fractie niet meer dan 0,30 bedraagt, met hoeveel personen kan dan de steekproef, vergeleken met vraag a., worden verminderd? z= 1.65E²= 0.0016pie= 0,30a1.65²*0.5(1-0.5)---------------------- == 4260.0016b1.65² *0.30(1-0.30)-------------------------- 3580.0016b= 426-358 = 68 2.4. Bij een onderzoek betreffende de schatting van de populatiefractie, besluit je klant plotseling dat ze een nauwkeurigheid wenst van 1%-punt, in plaats van de overeengekomen 3%- punten. In welke mate zal de steekproefomvang hierdoor stijgen? bovenste factor blijft hetzelfde.
Hoorcollege Week 3BetrouwbaarheidsintervalRelatie steekproefomvang en betrouwbaarheidsintervalVoor het onderzoek:Gebruik formule.Steekproefomvangbepaling Na uitvoering onderzoek is afwijking mogelijk tussen:Vooraf aangenomen Een Daadwerkelijke EIn principe formule aanpassen bij alleen E, bij welke marge klopt deze weer.Reden:Uit onderzoek gevonden steekproeffractie 'p' is niet gelijk aan de vooraf aangenomen populatiefractie π (=0,5)Hoe bepaal je dan het betrouwbaarheidsinterval? P +- EE = z wortel P(1-P) --------- nOm dit kunnen weten moet je P en E wetenNa uitvoering van het onderzoek weet je wat P is, na het invullen van de formule krijg je E:VoorbeeldberekeningEis vooraf:95% betrouwbaarheid (Z=1.96)5% onnauwkeurigheid (E)N> 5000Berekening(Zie blackboard presentatie)Stel uit onderzoek blijkt p = 0,2E= z wortel p * (1-P) ------------ n = afgerond 0.04E is afgenomen van 0,05 naar 0,0495% betrouwbaarheidsinterval:P +- E: 0,2 +- 0,04Interval (0,2-0,4 ; 0,2 +0,04) is teken voor interval.In de praktijk?Meestal meerdere vragenPer vraag bepalen?- dus meerdere p's en E'sIn de praktijk:E voor hoofdvraag bepalenofOorspronkelijk vooraf bepaalde E aanhoudenVragenlijstonderzoekElke wijze van gegevensverzameling waarbij wordt gewerkt aan de hand van een uniforme gestructureerde vragenlijst.Criteria bij kiezen van enquetevorm:1. Mate van respons2. Representativiteit3. Gewenste spreiding van respondenten4. Wensen t.a.v. tijd en complexiteit5. KostenDe vraagstellingAlgemene regels bij formulering vragen:- De vraag slechts 1 uitleg vatbaar- 1 onderwerp per pvraag behandelen- eenvoudig taalgebruik / zinsopbouw- vraag neutraal stellenValiditeit: mate waarin een vraag werkelijk wat men wil meten.Open en gesloten vragenVormen van gesloten vragen-Dichtome vraag Slechts 2 antwoordmogelijkheden- Multiple-choice vraagMeerdere mogelijkheden, 1 keizen- schaal vraag (opinie etc)De complete vraaglijst:1 welke elementen moeten in de vragenlijst verwerkt worden en hoe moet de respondent benaderd worden?2 Hoe stel je de vragenlijst op en instructies geef je aan de enquêteurs3 Testen van vragenlijst
E= onauwkeurigheidsmargeP= steekpproeffractie = aantal st.pr. elem dat kenmerk bezit/ totaal aantal in st.prZ= aantal standaarddeviaties van het gemiddelden= steekproefomvang
Opdrachten Week 3Opgaven 3.1Uit een enkelvoudig aselecte steekproef van 600 personen personen blijkt dat 375 een tri-band mobiele telefoon hebben. Wat is het 90% betrouwbaarheidsinterval voor het deel van de populatie dat deze mobiele telefoon bezit?P+- z wortel P(1-P) --------- n0.625 + 1.65 wortel 0.625(1-0.625) -------------- = 0.658 6000.625 - 1.65 wortel 0.625(1-0.625) --------------- = 0.592 6001. 90% betrouwbaarheidsinterval : P= steekproeffractie / steekproefomvang = 375/600= 0.625 E= Z wortel P (1-P) ---------- nOpgave 3.2Uit een enkelvoudige aselecte steekproef komt naar voren 56% van een woonwijk een huisdier bezit. Het onderzoek heeft een onnauwkeurigheidsmarge van 5%. Welke steekproefomvang is gebruikt uitgaande van 95% betrouwbaarheid.E= 0.05Z= 1.96P= 0.56 = pien= z² * pie (1-pie) ----------------------- E²n= 1.96² * 0.56 (1-0.56) ---------------------------- = 379 0,05²0.56 = pie/pOpgave 3.3Uit een representatieve steekproef onder 600 automobilisten bleek dat 240 daarvan een autoradio met usb-aansluiting hebben. er zijn in totaal 6 miljoen auto's Nederland.3a Bereken met 95,4% betrouwbaarheid het aantal autoradio's met USB-Aansluiting dat in die autos tenminste geinstalleerd is. Er mag worden aangenomen dat aan ten hoogste 75% van alle automobilisten een autoradio met USB-aansluiting kan worden verkocht.in symbolen/formule vorm, wat moet je berekenen?(p-E)*NP= 240/600 = 0.40.4 - 2 wortel 0.4(1-0.4) -------------- = 0.36 6000.36 * 6.000.000 = 2160 000
Week 4 hoorcollegeHypothesetoetsen (komt o.a. veel voor bij medische onderzoeken. Je hebt vooraf een idee wat er aan de hand is)Hypothese is een aanname of een stelling over populatiewaarde(n):- π (fractie or proportie) (pie)- mu μ populatie gemiddeldeHoe kun je toetsen dat je hypothese klopt? Door het middel van het doen van een steekproefonderzoek.Met een steekproef heb je nooit zekerheid van een populatie.Waar ligt de grens dat je hypothese klopt, dit is te bepalen door middel van een statische formule.5 stappen bij toetsenBij alle typen toesten onderstaande 5 stappen doorlopen:1. Formuleer de nulhypothese (H0): de stelling die getoetst wordt. Formuleer de alternatieve hypothese H1). Indien H0 verworpen wordt, accepteer H1.één van beide hypothese zijn altijd correct.h0 M= 30,-h1: m= niet 30,-2. Stelhet verlangde significantieniveau (a) vastDe kans op het onterecht verwerpen van H0 is het significantieniveau (a).(1-a) is het betrouwbaarheidsniveauType-I-fout: onterecht verwerpen van H0 (kans= a)Type II-fout: onterecht accepteren van H0 (kans = ẞ)3. waarmee wordt getoetst (toetsgrootheid) en hoe is de verdeling als we er vanuit mogen gaan dat de nulhypothese waar is?Voorbeelden:Met X (gemiddelde steekproef) om een verondestelde waarden van μ (zie powerpoint rest stap 3)4. Bepaal de kritieke waarde(n):- Waarde die overschreden moeten worden om de nulhypothese te verwerpen.- nondirectional hypothesen (tweezijdig) 2 kritieke waarden- directional hypothesen (eenzijdig) 1 kritieke waardeIn formule- en tabellenboek te vinden.5. Bepaal de waargenomen waarde en vergelijk deze met de kritieke waarde(n).Bepaal of H0 al dan niet geaccepteerd wordt. Welke stappen daarvoor> stap 3 en 4.Geef je conclusie in woorden weer.Hoe schrijf je dat op?Je begint met het herhalen van je steekproef bijvoorbeeld (Zie foto) X = 35 geen element van => H0 verwerpen (er is nog steeds 5% kans dat de h0 wel klopt (z waarde 1,96 (betrouwbaarheid van 95%)
Opdrachten Week 4Opgaven 4.1
Hoorcollege Week 5X²-toets (chi kwadraat toets)X²-toets gebruikt bij onafhankelijkheidstoetsen en bij aanpassingsvraagstukken.Toetsen of er een verschil bestaat tussen de waargenomen frequenties Oí en de theoretische frequenties Eí.X²-toets voor verbanden (tentamen) bijvoorbeeld leeftijd + bezoek sportschoolStap 1H0 hypothese: Er is geen verband tussen twee variabelen.H1: er is wel een verbandVoorbeeld: H0 er is geen verband tussen de winkelduur en het uitgeven bedrag.Stap 2:Vaststellen van het significantieniveau αBijv. 0,05Dus 95% betrouwbaarheidStap 3: Resultaten onderzoekOí (observerd frequencies)De toetsgrootheid. Hoe kun je bepalen of er wel of geen verband is tussen bedrag en tijdsduur?- Door vast te stellen wat de frequenties in de cellen zouden zijn als er geen verband is.Verwachte frequenties Eí (Expected frequencies)Hoe: Per cel voer je de volgende berekening uit:(rijtotaal * kolomtotaal)/Totaal Bijv. Cel linksboven in tabel41*40/90 =18Hoe groter de verschillen tussen de waargenomen en de verwachte frequenties, hoe groter de kans dat er wel een verband bestaat.Vanaf wanneer is dat? Nu kan de toetsgrootheid van stap 3 worden berekend:X² berekend = sigma (Oí - Eí)² / Eí Sigma betekend dat dit dit voor elke cel moet worden uitgevoerd. Sigma = alles bij elkaar op tellen.Stap 4:Bepaling kritieke waarde: Kritieke X²Bepaald door:Significantieniveau: αAantal graden van vrijheid: (k-1)x(r-1) bij kruistabellenIn deze formule zijn allen de kolommen en rijen met Oí en Eí belangrijk.Opzoeken in chi² tabel:X²kritiek = X² (95% betrouwbaarheid; (3-1)*(3-1)=4 g.v. = 9,49 Stap 5:Als X²-berekend > (groter) kritieke X² dan H0 verwerpen.X² berekend = 10,03 > (Groter dan) X² kritiek = 9,49Conclusie: H0 verwerpen, er is dus een verband tussen besteed bedrag en winkeltijd.Wat is het verband?Hoe korter men winkelt, hoe minder men uitgeeft.
Hoorcollege week 6Regressie- en correlatieanalyseStatisctische meting van- Soort verband tussen 2 variabelen (regressie)- Mate van verband (correlatie) met een sterk verband kun je wel voorspellen wat een bepaalde onbekende waarde moet zijn.Wat kun je ermee?- Trendlijn vinden (bijv. BNP in de loop van de tijd)- Voorspelling (hoe hoog zal BNP zijn over 3 jaar?)Verschillende regressie-vergelijkingen te onderscheiden o.b.v.:Aantal variabelen:- Enkelvoudig (1 onafhankelijke variabele)- Meervoudig (2 of meer onafhankelijke variabelen)Type verband:- Linear- ExponentioneelWat moeten jullie kunnen?Enkelvoudig lineair handmatig en in SPSSMeervoudig lineair in SPSS (krijg je een screenshot op tentamen)Voorbeeld enkelvoudig lineair handmatig (in Excel)Wat heeft excel berekend?Vergelijking bepaald via de kleinste kwadraten methode, oftwelIn totaal de kleinste afstand tussen de verschillende punten in de grafiek Hoe resultaat Y = a + b * XY afhankelijke variabeleX onafhankelijke variabelea = regressie constante (2 in ons voorbeeld)b = regressie coefficient: geeft de helling van de trendlijn weer (1 in ons voorbeeld)Je moet een kolom maken. Ten eerste totaal berekenen, zodat je gemiddelde van X en Y kunt berekenen.Kwadraat is altijd positiefXi Yi xi yi xiyi x²i1 2 -2 -3 6 4 2 5 -1 0 0 13 6 0 0 0 04 5 1 0 0 15 7 2 2 2 4Totaal15 25 10 10SigmaXi Sigma Yi sigmaxiyi sigmax²ib= 10/10 = 1a= 5-1*3 = 2De gevraagde lin is dus y= 2 + xMaar hoe zinvol is dit? Hoe sterk is het verband?Dan kom je bij de correlatieCorrelatiecoefficient r (de mate van verband): Waarde altijd tussen -1 en +1vuistregel:r> 0,8 dan is er (positieve) correlatier0 is totaal geen verband.Correlatiecoëfficient r:formule R = sigma xiyi / wortel sigma xi² sigma yi²Voor het voorbeeld geldt: R = 10 / wortel 10*14 = 0,85Hoeveel van de variatie in waarden van Y wordt nu bepaald door de gevonden vergelijking Y= 2 + X?r² determinatiecoeffiecientr² = 0,85² = 0,72Dus 72% van de variatie verklaard, 28% door toevallige afwijkingen.
Hoorcollege week 7VariantieanalyseGroepen die je onderscheidt of die een zelfde gemiddelde hebben.Analyse van een verschil tussen 2 of meer populatiegemiddelden (bij 2 groepen, verschiltoets voor gemiddelde gebruiken)Getoetst door middel van steekproefgemiddelden: Bijvoorbeeld toetsten of verkopen van een product beinvloed worden door de vorm van verpakkingEnkelvoudige variantie-analyse:- 1 onafhankelijke variabeleMeervoudige variantie-analyse:- 2 of meer onafhankelijke variabelenbijv prijs en verpakkingWat moeten jullie kunnen?Enkelvoudige variantie handmatig en in SPSSMeervoudig in SPSS.Voorbeeld (zie pushbullet foto verkopen peren)Stap 1: H0: mu 1 = mu2 = mu3 (geen getallen in voeren)Oftewel:Er is geen verschil tussen de populatiegemiddelden> geen invloed op verkopen Stap 2: significantieniveau = 0,05Stap 3: berekening F-Ratiooftewel deF berekend: tussenvariatie/binnenvariatieTussenvariantie = tussenkwadraatomafwijking/vrijheidsgradenBinnenvariantie = binnenkwadraatsomafwijking/vrijheidsgradenTabel: x1 gemiddelde = 27, x2 gemiddelde = 22, x3 gemiddelde = 35, algemene gemiddelde x=28Stap 3 F berekend = tussenvariantie/binnenvariantie = TKS/v1 430 / 2 215 --------- = = 3,77 BKS/v2 684 / 12 57Tussenkwadraatomafwijking (TKS) = (aantal waarnemingen per behandeling) * ((sigma (xi-x)²)== 5 * [(27-28)² + (22-28)² + (35-29)²] = 5 * (1+36+49) = 5*86 =430Aantal graden van vrijheid van de teller v1 : (aantal behandelingen - 1) = (3-1) = 2binnenkwadraatsomafwijking (BKS) : Sigma (Xij - gem. Xi)² = (27 - 27)² + (20-22)² + (35-35)² . ... .. . . .. . . . . . . . (42-27)² + (28-22)² + (35-35)² = 684i: kolom, j : rijAantal graden van vrijheid van de noemer v2: (aantal behandelingen) * (aantal waarnemingen per behandeling -1) 3*(5-1) = 12Stap 4: F-kritiek: aantal graden van vrijheid 2x Teller (tussenvar.) en noemer (binnenvar.) en het significantieniveauF-kritiek = F2 F12 (super/subscript) (0,05) = ***tabel h2 gebruiken = 3,89Stap 5:F berekend is kleiner of gelijk dan F kritiek = H0 accepterenF berekend is groter dan F kritiek = H0 verwerpenDus geen invloed verpakking op verkoop H0 accepteren.
Notities
Opdrachten
Quer criar suas próprias Notas gratuitas com a GoConqr? Saiba mais.