2 Verdelingen Inhoudsopgave



Dovnload 345.95 Kb.
Pagina1/4
Datum17.08.2016
Grootte345.95 Kb.
  1   2   3   4
2 Verdelingen




Inhoudsopgave
2.0 Geboortes 3

2.1 Frequentieverdelingen 4

2.2 Kans 15

2.3 Op den duur … 20

2.4 Simulaties 28

2.5 Rekenen met kansen 32

2.6 De som van de kansen is 1 39

2.7 Voorwaardelijke kansen 42

2.8 Extra opgaven 48

2.9 Samenvatting Verdelingen 50


Bij dit hoofdstuk hoort een digimap. Daarin staan opgaven waarbij er iets met ict valt te beleven.



Ze hebben hetzelfde nummer als de bijbehorende opgave in deze tekst. Je herkent ze aan het icoontje . Via de digimap kom je bij VU-Statistiek of op een website terecht.

De opgaven in de digimap kunnen op drie manieren worden gebruikt:



  • niet,

  • aanvullend op de corresponderende opgave in deze tekst,

  • vervangend voor de corresponderende opgave in deze tekst.

Bij de opgaven waarvoor WB staat hoort een werkblad.


Colofon
© 2009 cTWO

Experimentele uitgave Kansrekening en Statistiek, vwo, wiskunde A en C

versie 2 (januari. 2012)

auteurs Leon van den Broek, Maris van Haandel

met medewerking van Simon Biesheuvel, Carel van de Giessen, Piet Versnel, Peter van Wijk

2.0 Geboortes

Procentuele verdeling van het hoeveelste kind bij een bevalling wordt geboren naar leeftijd van de moeder, Vlaams Gewest, 2006. Primipaar = eerste kind, pariteit 1 = tweede kind, enz.


Aantal bevallingen per 1.000 vrouwen, opgesplitst naar nieuwe moeders (eerste kind) en vrouwen die al een of meer kinderen hadden, Vlaams Gewest, 2006.





Bron: http://www.zorg-en-gezondheid.be

Wat kun je uit deze verdelingen aflezen?



2.1 Frequentieverdelingen

WB 1 In de eredivisie voetbal worden per seizoen 306 wedstrijden gespeeld. In 2006/2007 waren die als volgt verdeeld over het aantal doelpunten.



aantal doelpunten

0

1

2

3

4

5

6

7

8

9

aantal wedstrijden

18

46

63

58

52

35

19

10

3

2

Hieronder staat het bijbehorende histogram.





a. In hoeveel procent van de wedstrijden werd niet gescoord?

Deze verdeling is niet symmetrisch, maar “scheef”.



b. Wat betekent dat, denk je?
c. Bereken het gemiddelde van het aantal doelpunten per wedstrijd in het seizoen 2006/2007.

Het gemiddelde is de "evenwichtswaarde". Daarbij hoort het volgende idee. Denk je het histo-gram in alsof het is uitgezaagd uit een houten plaat; plaats onder het histogram een wig op de plaats van het gemiddelde; dan balanceert het histogram netjes op deze wig.



d. Welk van de drie posities van de wig hierboven is de juiste? Denk aan het evenwicht.

De verdeling kan van jaar tot jaar verschillen. Maar denk je dat de verdeling in andere jaren heel anders is? In het seizoen 1996/97 was de verdeling als volgt:





aantal doelpunten

0

1

2

3

4

5

6

7

8

9

aantal wedstrijden

17

48

79

66

53

23

11

6

2

1

We gaan de verdelingen in de twee jaren vergelijken.



e. Teken op het werkblad in dezelfde figuur als de verdeling van 2006/2007 het histogram van de verdeling in het seizoen 1996/1997.

Voor het grootste deel vallen de histogrammen over elkaar heen.



f. Hoeveel procent zit niet in de overlap?

g. Vind je dat de verdelingen in de twee seizoenen veel verschillen?

2 Elk uur wordt in De Bilt de temperatuur gemeten. De resultaten van 8 uur ’s ochtends in de jaren 1981 t/m 2000 geven de volgende verdeling.

a. Reken na dat er in die periode 7305 metingen zijn gedaan.



b. Hoe groot is de gemiddelde temperatuur ongeveer?
c. Er is iets verrassends (iets onlogisch) aan de verdeling. Wat?

d. Hoe groot schat jij het percentage van de dagen dat de temperatuur om 8 uur ’s ochtends 20°C of hoger is.

3 De meisjes en de jongens van het Amalia College zijn als volgt verdeeld over de vier profielen:

11 leerlingen in CM, 42 in EM, 60 in NG en 41 in NT:

a. Maak een staafdiagram van de verdeling van alle leerlingen van het Amalia College over de

vier profielen.


Landelijk waren in 2007 de keuzes op het vwo als volgt over de profielen verdeeld.

14% CM, 31% EM, 36% NG en 19% NT.



b. Teken ook een staafdiagram bij deze landelijke verdeling.

4 De meest extreme verdelingen zijn die waarbij 100% van de leerlingen voor één profiel kiest (en de andere profielen dus geen klanten hebben). De meest vlakke verdeling is die waarbij alle vier de profielen evenveel leerlingen hebben.

Stel dat op een school het profiel EM twee keer zo veel leerlingen heeft als CM en dat het profiel NG ook twee keer zo groot is als NT. Stel dat de M-profielen (CM en EM) anderhalf keer zoveel leerlingen hebben als de N-profielen.

Hoe is dan de frequentieverdeling?

Algemeen

In een groep letten we op een zekere eigenschap (variabele). Die eigenschap kan bijvoorbeeld vier waarden hebben. De groep is verdeeld over de vier waarden: elke waarde komt een zeker aantal keren voor. We spreken dan van een frequentieverdeling.

Als de verdeling in procenten van de totale groep is, spreken we van een relatieve frequentie-verdeling. De som van de relatieve frequenties is 100 %.


5 Als je in een Engelse tekst van elk woord telt hoe vaak het voorkomt, dan blijkt het volgende.

Het woordje "the" komt het vaakste voor, het woordje "of" komt op de tweede plaats, enzovoort. Hieronder staat de toptien:




1

2

3

4

5

6

7

8

9

10

the

of

and

to

a

in

that

it

is

was

Dit is zo voor elke (niet te korte) Engelse tekst. Georg Kingley Zipf, docent Duits aan de Harvard University heeft dit verschijnsel ontdekt en verder onderzocht. Dat was het begin van de kwanti­tatieve linguïstiek.

Maar er is meer aan de hand. Zipf constateerde ook dat "the" ongeveer 2 keer zo vaak voorkwam als “of” en 3 keer zo vaak als “and”, 4 keer zo vaak als “to”, enzovoort. Dat is als volgt kort samen te vatten: in een natuurlijke taal is de frequentie waarmee een woord voorkomt ongeveer omgekeerd evenredig met de rang van het woord in de frequentietabel.
Deze wet geldt zowel voor mensen met een grote woordenschat als voor mensen met een kleinere woordenschat.
Het woordje "the" kwam in een zekere tekst 1200 keer voor.

Teken een staafdiagram bij deze frequentieverdeling voor de tien meest voorkomende woordjes.


6 Alle kinderen die op de echopoli van kindercardiologie komen, krijgen een compleet echo- onderzoek waarbij diverse dimensies en bloedstroomsnelheden van het hart worden gemeten. Als blijkt dat het kind geen grote afwijkingen heeft aan het hart, worden deze kinderen "normaal" genoemd. Van deze normaal gescoorde kinderen wordt ook de lengte en het gewicht gemeten.

De gegevens zijn afkomstig van het Radboud Ziekenhuis te Nijmegen.

De gewichten zijn ingedeeld in klassen. Hieronder staat een histogram van de frequentie-verdeling.

a. Kun je uit onderstaand histogram aflezen om hoeveel kinderen het ongeveer gaat? Kies uit 220, 1120, 2440, 4440.
Het frequentiehistogram is verre van symmetrisch.

b. Hoe komt dat?
Het frequentiehistogram is niet zo regelmatig; het is nogal "springerig".

c. Wat gebeurt er met die springerigheid als je de klassenbreedte twee keer zo groot neemt?
Bekijk het databestand via de digimap.

d. Experimenteer met verschillende klassenbreedtes. Welke klassenbreedte heeft je voorkeur?



7 Old Faithful is de beroemdste en actiefste geiser in het Amerikaanse Yellowstone National Park (Wyoming). In een uitbarsting kan de geiser tot 32.000 liter kokend water zo'n 56 m hoog spuiten. Een uitbarsting duurt tussen de 1½ en 6 minuten. De toeschouwer moet soms wel geduld hebben, want de tussenpozen tussen twee uitbarstingen variëren tussen drie kwartier en twee uur.




Van 272 erupties van de Old Faithful is gegeven:



  • de duur en

  • de wachttijd vanaf de vorige eruptie, beide in minuten.

Bekijk de data via de digimap.



a. Maak een histogram van de duren van de erupties. Kies zelf een geschikte klassen-indeling.

b. Ook van de wachttijden.


De verdelingen van de duur en de wachttijd zijn allebei tweetoppig.

c. Hoe zie je dat in nevenstaand diagram?
Van histogram naar polygoon

8 Hoe oud is een vrouw als ze haar eerste kind krijgt? De gegevens voor Vlaanderen (2006) staan in de tabel hieronder:




leeftijd

10-14

15-19

20-24

25-29

30-34

35-39

40-44

45-49

50-54

frequentie

8

1113

5965

13302

6980

1874

237

5

2

Het betreft in totaal 29486 vrouwen.

a. Hoeveel procent van de vrouwen is jonger dan 25 jaar als ze hun eerste kind krijgen.
Als je wilt weten hoeveel procent van de vrouwen 20, 21 of 22 jaar oud is als ze hun eerste kind krijgen, heb je te maken met 3 van de 5 levensjaren in de klasse “20-24”. Een redelijke schatting van dat aantal vrouwen is 3/5 van 5965 = 3579. Dat klopt waarschijnlijk niet precies, maar het is het beste wat je op grond van de gegeven tabel kunt doen (zonder nadere informatie).
b. Bepaal op grond van de tabel hoeveel procent ouder dan 26 maar jonger dan 31 jaar is?
We hebben er een procentueel histogram bij gemaakt.

We hebben de middens van de bovenkanten van de opvolgende balken verbonden. Zodoende ontstaat er een zogenaamde frequentiepolygoon. Om de polygoon links en rechts op 0% te laten beginnen, is er aan weerszijden een lege klasse toegevoegd.


De hoogte van een staaf geeft het aantal of het percentage in de bijbehorende klasse. In plaats van de hoogte kun je ook op de oppervlakte letten.


Bijvoorbeeld in opgave 8:

De oppervlakte van het histogram links van 27 jaar, inclusief 27 jaar zelf, geeft het percentage van de vrouwen van 27 jaar of jonger.

De totale oppervlakte van de balken is 100%.



9 Inkomensverdeling in Nederland

Het besteedbaar inkomen in Nederland is verdeeld in klassen van breedte 2000 euro. Er zijn 5000 gezinnen met een inkomen tussen -6000 en -4000 euro. Er zijn ook gezinnen met een besteedbaar inkomen boven de 100.000 euro, maar die zijn niet meer in de verdeling opgenomen. De gegevens zijn afkomstig van het CBS (2008)






a. Hoeveel procent van de gezinnen had een besteedbaar inkomen van minder dan 20.000 euro?

Merk op dat het totale percentage (van alle balken tezamen) 100% is.


Door de middens van de bovenkanten van de balken te verbinden, ontstaat de frequentie-polygoon.





b. Hoe kun je – in principe – hieruit aflezen hoeveel procent van de gezinnen een besteedbaar inkomen onder de 20.000 euro heeft?
 Zie voor een aardige animatie:

http://www.cbs.nl/nl-NL/menu/themas/inkomen-bestedingen/cijfers/extra/inkomensverdeling.htm

Opmerking

Het plaatje in opgave 2 is ook een frequentiepolygoon. Gevraagd werd het percentage te schatten van de dagen dat de temperatuur ’s ochtends om 8 uur 20°C of hoger is. Daarvoor moest je schatten welk deel van de oppervlakte rechts van 20 °C ligt.



10 Hoeveel uur slaapt een mens? Tijdens een onderzoek is met een EEG (elektro-encefalogram) de slaapduur vastgesteld bij 147 volwassenen (16-71 jaar) gedurende 399 nachten. De gegevens zijn van werkdagen (op vrije dagen slaapt men gemiddeld 1,5 uur langer). Bron: Waken en Slapen, Paul A. M. van Dongen, isbn 90-74078-02-8.

Bekijk de frequentiepolygoon op de volgende bladzijde.



a. Wat betekent de hoogste stip precies?

b. Bepaal op grond van de polygoon zo goed mogelijk hoeveel procent van de mensen meer dan 7 uur en minder dan 9 uur slaapt als hij/zij de volgende dag moet werken.


11 Hieronder zie je de relatieve (procentuele) verdelingen van de slaapduur van ouderen (70-79 jaar) en jongeren (20-29 jaar) (gebaseerd op onderzoek uit 1969). Het betreft de subjectieve slaapduur (zoals de mensen het zelf ervaren).



a. Noem twee verschillen tussen deze verdelingen.
De mediaan (middelste) van de slaapduren is díe waarde waarboven en waaronder 50% zit van alle slaapduren.

b. Bepaal zo goed mogelijk de mediaan van de slaapduur bij de jongeren en bij de ouderen.

c. De modale slaapduur is de slaapduur die het meest voorkomt.

Hoeveel procent ongeveer van de jongeren slaapt bovenmodaal? En hoeveel procent van de ouderen?

De twee krommen snijden elkaar bij 5,5. Anne zegt dat er evenveel ouderen als jongeren zijn die gemiddeld 5,5 uur slapen.

d. Is dat juist?

12 Spaanse exportsinaasappelen zijn gewogen. Hieronder staat de frequentiepolygoon van de gewichten.



a. Hoeveel procent weegt minder dan 160 gram? Schrijf ook op hoe je te werk bent gegaan.

b. Hoeveel wegen de zwaarste 10 procent (ongeveer)?

c. Hoe groot is de mediaan?

13 We bekijken het aantal uren dat een baan per dag telt in Luilekkerland. Dat varieert tussen 0 en 5 uur per dag. Hieronder zie je hoe de banen over de verschillende groottes verdeeld zijn.



a. Hoeveel procent van de banen wordt gerepresenteerd door één hokje?

b. Hoeveel procent van de banen heeft een omvang tussen 1 en 2 uur per dag?

c. Ga door een berekening na of een baan van 1,5 uur groter of kleiner dan de mediaan is.

14 Bekijk de bevolkingspiramide van Nederland op 1 januari 2007.


Een bevolkingspiramide is een grafische weergave van een frequentieverdeling, apart voor mannen en vrouwen.

a. Op welk kenmerk zijn de mannen en de vrouwen verdeeld?

b. Verklaar de "uitschieters" van 60-jarigen.

c. Schat de mediaan van de leeftijden van de Nederlanders.

d. Schat hoeveel procent ouder dan 80 jaar was (op 1 januari 2007).
Van een zekere leeftijd is 2 van de 3 Nederlanders vrouw.

e. Welke leeftijd is dat (ongeveer)?
 Op de site van het CBS kun je de ontwikkeling van de bevolkingspiramide in het verleden en toekomst volgen:

http://www.cbs.nl/nl-NL/menu/themas/bevolking/cijfers/extra/piramide-fx.htm

Opmerking

Langs de verticale as van de verdelingen in opgaven 9, 10, 12 en 13 staat niets. Dat kan ook niet. Je gebruikt de oppervlakte onder de grafiek, waarbij de totale oppervlakte op 100% is gesteld.

Bij opgave 12 vertegenwoordigt één hokje 5%, bij opgave 13 is één hokje 2%.




2.2 Kans

15 We gebruiken nog eens de context en de gegevens van opgave 8. Hieronder staat weer de tabel voor de 29486 bevallingen van het eerste kind in Vlaanderen, 2006.




leeftijd

10-14

15-19

20-24

25-29

30-34

35-39

40-44

45-49

50-54

frequentie

8

1113

5965

13302

6980

1874

237

5

2




a. In hoeveel procent van de bevallingen is de vrouw jonger dan 20 jaar?


Ook herhalen we het histogram.


b. Wat betekent je antwoord op vraag a voor het histogram?

Een Vlaamse vrouw gaat zo dadelijk bevallen van haar eerste kind. We kennen de vrouw verder niet. Hoe oud kan ze zijn? Zeker tussen de 10 en 54 jaar.

In 3,8% van de bevallingen is de vrouw jonger dan 20 jaar.

We zeggen ook wel: de kans dat de vrouw jonger dan 20 jaar is, is 3,8%.

c. Wat is de kans dat de vrouw jonger is dan 30 jaar en ouder dan 19 jaar?

16 Hoeveel doelpunten vallen er per voetbalwedstrijd in de eredivisie? Dat staat voor het seizoen 2010/2011 in onderstaande tabel. Er zijn per seizoen 306 wedstrijden.


aantal doelpunten

0

1

2

3

4

5

6

7

8

9

10

aantal

wedstrijden



18

34

66

65

53

35

21

7

5

1

1




We nemen aan dat deze tabel voor elk seizoen geldt.
Anne heeft geen verstand van voetballen en gaat met haar vriend naar een voetbalwedstrijd.


  1   2   3   4


De database wordt beschermd door het auteursrecht ©opleid.info 2017
stuur bericht

    Hoofdpagina