Opgaven hoofdstuk 11 Analyse van categorische gegevens



Dovnload 27.5 Kb.
Datum19.08.2016
Grootte27.5 Kb.

Opgaven hoofdstuk 11

Analyse van categorische gegevens



11.1

Een multinomiaal experiment met k = 3 cellen en n = 320 levert de gegevens die in de tabel staan. Bieden deze gegevens voldoende aanwijzingen om de nulhypothese te weerleggen dat p1 = 0,25, p2 = 0,25 en p3 = 0,50? Toets voor α = 0,05.



11.2

De chocoladesnoepjes van M&M bestaan in zes verschillende kleuren: donkerbruin, geel, rood, oranje, groen en blauw. Volgens de fabrikant (Mars, Inc.) is de kleurverhouding in elke grote productiebatch: 30% bruin, 20% geel, 20% rood, 10% oranje, 10% groen en 10% blauw. Om de juistheid van deze claim te testen liet een professor van het Carleton College (Minnesota) zijn studenten de kleuren tellen van de M&M's in “fun size” zakken van het snoepgoed (Teaching Statistics, voorjaar 1993). De resultaten voor 370 M&M's worden in de tabel gegeven.


a. Als je veronderstelt dat de door de fabrikant opgegeven percentages nauwkeurig zijn, bereken dan de verwachte aantallen die in elk van de zes categorieën vallen.
b. Bereken de waarde van 2 voor het toetsen van de claim van de fabrikant.
c. Voer een toets uit om te bepalen of de werkelijke percentages van de geproduceerde kleuren verschillen van de percentages die door de fabrikant worden genoemd. Gebruik α = 0,05.


Bron:

Johnson, r.W. “Testing colour proportions of M&M's.” Teaching Statistics, vol. 15, No. 1 voorjaar 1993, p. 2 (Table 1).


11.3

Het tijdschrift Bon Appetit heeft een enquête gehouden onder zijn lezers over de vraag van welke van de vier groenten: spruitjes, okra, limabonen en bloemkool, ze het minst hielden. In de tabel worden de resultaten (overgenomen uit Adweek, 21 feb. 2000) gegeven. Noem p1, p2, p3, en p4 de percentages van alle lezers van Bon Appetit die aangeven dat ze het minst houden van respectievelijk spruitjes, okra, limabonen en bloemkool.



a. Als de lezers van Bon Appetit over het algemeen niet één bepaalde groente het minst lekker vinden, wat zijn dan de waarden van p1, p2, p3, en p4?
b. Specificeer de nulhypothese en de alternatieve hypothese die gebruikt moeten worden om vast te stellen of de lezers van Bon Appetit van één bepaalde groente het minst houden.
c. Voer de toets beschreven in b uit voor α = 0,05. Geef je conclusie in termen van de vraagstelling.
d. Aan welke aannames moet worden voldaan opdat de toets in c geldig is? Aan welke van deze aannames kan in dit geval eventueel worden getwijfeld?
11.4

Gegevens van scanners in supermarkten worden door onderzoekers gebruikt om het kooppatroon en de voorkeuren van consumenten te leren begrijpen. Vaak wordt hierbij een steekproef van huishoudens bestudeerd, die het scannerpanel wordt genoemd. Als deze huishoudens winkelen, tonen ze een magnetische identificatiekaart waarmee hun aankoopgegevens kunnen worden geïdentificeerd en verzameld. Marketingonderzoekers hebben onlangs onderzocht in hoeverre het aankoopgedrag van het panel representatief is voor de populatie huishoudens die in dezelfde winkels koopt (Marketing Research, nov. 1996). De tabel toont de gegevens voor de aankoop van pindakaas, die zijn verzameld door A.C. Nielsen Company voor een panel van 2500 huishoudens in Sioux Falls, gedurende een periode van 102 weken. De marktaandeelpercentages in de rechterkolom zijn afgeleid van de totale aankoop van pindakaas in dezelfde 15 winkels waar het panel zijn inkopen deed gedurende dezelfde periode van 102 weken.


a. Bevatten de gegevens voldoende aanwijzingen om te kunnen concluderen dat het kooppatroon van het panel representatief is voor de populatie huishoudens? Toets voor α = 0,05.


Bron: Gupta, S. et al. “Do households scanner data provide representative inferences from brand choices? A comparison with store data.” Journal of Marketing Research, Vol 33, nov. 1996, p. 393 (Table 6).
b. Aan welke aannames moet zijn voldaan opdat de toetsingsprocedure in a geldig is?
c. Bepaal de benaderde p-waarde voor de toets in a en interpreteer deze in het kader van de vraagstelling.
11.5

Beschouw de hier gegeven 2 × 3 (d.w.z. r = 2 en c = 3) kruistabel.


a. Specificeer de nulhypothese en de alternatieve hypothese die gebruikt moeten worden om de onafhankelijkheid te toetsen van de rij- en de kolomclassificaties.
b. Specificeer de toetsingsgrootheid en het verwerpingsgebied die gebruikt moeten worden bij het uitvoeren van de hypothesetoets in a.


c. Stel dat de rijclassificatie en de kolomclassificatie onafhankelijk zijn; bepaal dan schattingen voor de verwachte celfrequenties.
d. Voer de hypothesetoets van a uit. Interpreteer het resultaat.
11.6

Zie opgave 11.5


a. Reken de frequenties om naar percentages door het percentage van elk kolomtotaal dat in elke rij valt te berekenen. Reken ook de kolomtotalen naar het totaal aantal responsen. Geef de percentages in een tabel weer.
b. Maak een grafiek met percentage op de verticale as en kolomnummer op de horizontale as. Teken de percentages rijtotalen als horizontale lijnen in de grafiek, en de celpercentages uit a, waarbij je het rijnummer als symbool in de grafiek gebruikt.
c. Welk patroon verwacht je te zien als de rijen en kolommen onafhankelijk zijn? Is de grafiek in overeenstemming met de onafhankelijkheidstoets van opgave 11.5?
11.6

Om een gedragsprofiel op te stellen van plezierreizigers hebben M. Bonn (Florida State University), L. Forr (Georgia Southern University) en A. Susskind (Cornell University) 5026 plezierreizigers in het Tampa Bay gebied ondervraagd (Journal of Travel Research, mei 1999). Twee van de kenmerken die ze onderzochten waren het opleidingsniveau van de reizigers en het gebruik dat ze maakten van Internet om reisinformatie op te zoeken. In de tabel staat een overzicht van de resultaten van de interviews. De onderzoekers concludeerden dat reizigers die Internet gebruiken om naar reisinformatie te zoeken meestal een universitaire opleiding hadden. Ben je het daar mee eens? Toets voor α = 0,05. Aan welke aannames moet voldaan zijn opdat deze toets geldig is?




Bron: Bonn, M., Furr, L. en Susskind, A., “Predicting a Behavioral Profile for Pleasure Travelers on the Basis of Internet Use Segmentation,” Journal of Travel Research, vol. 37, mei 1999, pp. 333-340.
11.7

Onderzoek heeft uitgewezen dat de stress die door de huidige levensstijl wordt veroorzaakt tot gezondheidsproblemen leidt voor een groot deel van de bevolking. In een artikel in het International Journal of Sports Psychology (juli-sept. 1990) wordt het verband tussen fysieke fitheid en stress onderzocht. 549 werknemers van bedrijven die meedoen met het gezondheidsonderzoeksprogramma van de Health Advancement Services (HAS) werden in drie fitheidsgroepen geclassificeerd: goed, gemiddeld en slecht. Elke persoon werd onderzocht op tekenen van stress. In de tabel staan de resultaten voor de drie groepen. [Opmerking: de gegeven fracties zijn fracties van de hele groep die tekenen van stress vertonen en tot één van de drie fitheidsgroepen behoren]. Leveren de gegevens voldoende aanwijzingen dat de kans op stress afhankelijk is van het fitheidsniveau van een medewerker?



11.8

Een aselecte steekproef van 250 meetwaarden wordt geclassificeerd volgens de rij- en kolomcategorieën in de tabel.





a. Bieden de gegevens voldoende aanwijzingen om te concluderen dat de rijen en kolommen afhankelijk zijn? Toets voor α = 0,05.
b. Zou de analyse veranderen als de rijtotalen waren vastgelegd voordat de gegevens werden verzameld?
c. Is er verschil in de aannames die nodig zijn opdat de analyse geldig is, voor het geval dat de rij- (of kolom-) totalen vastgelegd zijn? Licht je antwoord toe.
d. Reken de waarden in de tabel om naar percentages door elk kolomtotaal als basis te gebruiken en elke rijrespons als percentage van het overeenkomstige kolomtotaal te berekenen. Bereken ook de rijtotalen en reken ze om naar percentages van alle 250 meetwaarden.
e. Teken de rijpercentages op de verticale as tegen het kolomnummer op de horizontale as. Teken horizontale lijnen die overeenkomen met de totale rijpercentages. Ondersteunt de afwijking (of juist geen afwijking) van de individuele rijpercentages van de totale rijpercentages het resultaat van de toets in a?
11.9

Een aselecte steekproef van 150 meetwaarden wordt in de categorieën geclassificeerd zoals gegeven in de tabel.


a. Bevatten de gegevens voldoende aanwijzingen dat de categorieën niet allemaal even waarschijnlijk zijn? Gebruik α = 0,10.
b. Construeer een 90% betrouwbaarheidsinterval voor p2, de kans dat een meetwaarde in categorie 2 valt.
11.10

Er wordt een onderzoek gedaan naar de juistheid van krantenadvertenties van vijf soorten levensmiddelenwinkels in een stad in het zuidoosten van de VS. Op vier verschillende dagen worden artikelen aselect gekozen uit de advertenties voor elk soort winkel en de werkelijke prijs wordt vergeleken met de prijs in de advertentie. Elk van de winkels in de stad wordt geclassificeerd als behorende tot een van de volgende groepen: nationale keten, regionale keten A, regionale keten B, regionale keten C, of onafhankelijk. In de tabel worden de aantallen artikelen gegeven die juist geprijsd waren en die verkeerd geprijsd waren.




a. Bepaal of deze gegevens voldoende aanwijzingen bevatten om te kunnen concluderen dat het percentage juist geprijsde artikelen voor ten minste twee soorten winkels verschillend is. Gebruik α = 0,10
b. Gebruik een 95% betrouwbaarheidsinterval om het percentage te bepalen van juist geprijsde artikelen in de winkels die tot de nationale winkelketen behoren.

11.11

Product- of servicekwaliteit wordt vaak gedefinieerd als geschiktheid voor gebruik. Dit betekent dat het product of de service aan de behoeften van de klant voldoet. In het algemeen is geschiktheid voor gebruik gebaseerd op vijf kwaliteitskenmerken: technisch (bijvoorbeeld, sterkte, hardheid), psychologisch (smaak, schoonheid), tijdsgerelateerd (betrouwbaarheid), contractueel (garantievoorzieningen) en ethisch (beleefdheid, eerlijkheid). De kwaliteit van een service kan met al deze kenmerken te maken hebben, terwijl de kwaliteit van een gefabriceerd product in het algemeen afhangt van de technische en tijdgerelateerde kenmerken (Schroeder, Operations Management, 1993). Na een stortvloed van klachten door consumenten over de slechte kwaliteit, liet een fabrikant van benzinefilters voor auto's zijn kwaliteitsinspecteurs een steekproef nemen van 600 filters – 200 per ploegendienst – en deze controleren op defecten. Dit resulteerde in de gegevens die in de tabel staan vermeld.


a. Vormen de gegevens een aanwijzing dat de kwaliteit van de geproduceerde filters verband houdt met de ploeg die het filter produceert? Toets voor α = 0,05.
b. Schat het percentage defecte filters dat door de eerste ploeg wordt geproduceerd. Gebruik een 95% betrouwbaarheidsinterval.




De database wordt beschermd door het auteursrecht ©opleid.info 2017
stuur bericht

    Hoofdpagina