Nuolatinių kiekybinių duomenų intervalų variacijų eilučių konstravimas. Diskrečiųjų ir intervalinių skirstinių eilučių sudarymo taisyklės

Grupavimas- tai populiacijos suskirstymas į grupes, kurios yra vienalytės pagal tam tikrą požymį.

Paslaugos paskirtis. Naudodami internetinį skaičiuotuvą galite:

  • sukurti variacijų seriją, sudaryti histogramą ir daugiakampį;
  • rasti kitimo rodiklius (vidurkis, režimas (taip pat grafiškai), mediana, kitimo diapazonas, kvartiliai, deciliai, kvartilės diferenciacijos koeficientas, variacijos koeficientas ir kiti rodikliai);

Instrukcijos. Norėdami sugrupuoti seriją, turite pasirinkti gautos variacijų serijos tipą (diskrečią arba intervalinę) ir nurodyti duomenų kiekį (eilučių skaičių). Gautas sprendimas išsaugomas Word faile (žr. statistinių duomenų grupavimo pavyzdį).

Įvesties duomenų skaičius
",0);">

Jei grupavimas jau buvo atliktas ir diskrečių variacijų serija arba intervalo serija, tuomet reikia naudoti internetinį skaičiuotuvą Variation Index. Hipotezės apie pasiskirstymo tipą tikrinimas atliekama naudojantis paslauga Išsiskirstymo formos studijavimas.

Statistinių grupuočių tipai

Variacijų serija . Esant diskretiniams stebėjimams atsitiktinis kintamasis tą pačią reikšmę galima rasti kelis kartus. Tokios atsitiktinio dydžio reikšmės x i registruojamos nurodant n i, kiek kartų jis pasirodo n stebėjimų, tai yra šios reikšmės dažnis.
Esant nuolatiniam atsitiktiniam dydžiui, praktikoje naudojamas grupavimas.
  1. Tipologinis grupavimas- tai kokybiškai nevienalytės tiriamos populiacijos skirstymas į klases, socialinius-ekonominius tipus, vienarūšes vienetų grupes. Norėdami sukurti šią grupę, naudokite parametrą Diskreti variacijų serija.
  2. Grupuotė vadinama struktūrine, kuriame vienalytė populiacija yra suskirstyta į grupes, kurios apibūdina jos struktūrą pagal tam tikrą kintantį požymį. Norėdami sukurti šią grupę, naudokite parametrą Intervalinė serija.
  3. Vadinamas grupavimas, atskleidžiantis ryšius tarp tiriamų reiškinių ir jų charakteristikų analitinė grupė(žr. analitinę serijų grupavimą).

Statistinių grupių sudarymo principai

Stebėjimų serija, išdėstyta didėjančia tvarka, vadinama variacijų serija. Grupavimo funkcija yra charakteristika, pagal kurią populiacija skirstoma į atskiras grupes. Jis vadinamas grupės pagrindu. Grupavimas gali būti pagrįstas tiek kiekybinėmis, tiek kokybinėmis savybėmis.
Nustačius grupavimo pagrindą, reikėtų spręsti klausimą, kiek grupių reikėtų suskirstyti tiriamąją populiaciją.

Naudojant asmeninius kompiuterius Statistiniams duomenims apdoroti objektų vienetų grupavimas atliekamas naudojant standartines procedūras.
Viena iš tokių procedūrų pagrįsta Sturgess formulės naudojimu, siekiant nustatyti optimalų grupių skaičių:

k = 1+3,322*log(N)

Kur k yra grupių skaičius, N yra gyventojų vienetų skaičius.

Dalinių intervalų ilgis apskaičiuojamas kaip h=(x max -x min)/k

Tada skaičiuojami stebėjimų, patenkančių į šiuos intervalus, skaičiai, kurie imami kaip dažniai n i . Nedaug dažnių, kurių reikšmės yra mažesnės nei 5 (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
Vidurinės intervalų x i =(c i-1 +c i)/2 reikšmės laikomos naujomis reikšmėmis.

Matematinės statistikos dalykas. Bendroji ir imtinė populiacija.

— Matematinė statistika– matematikos šaka, tirianti statistinių duomenų atrankos, grupavimo, sisteminimo ir analizės būdus, siekiant gauti moksliškai pagrįstų išvadų.

— Statistika– tiriamų objektų nagrinėjamos charakteristikos skaitinės reikšmės, gautos atsitiktinio eksperimento metu.

Matematinė statistika yra glaudžiai susijusi su tikimybių teorija, tačiau skirtingai nei tikimybių teorija, matematinis eksperimento modelis nežinomas. Matematinė statistika, naudojant statistinius duomenis, būtina nustatyti nežinomą tikimybių skirstinį arba objektyviai įvertinti skirstinio parametrus.

Matematinės statistikos metodai leidžia sukurti optimalius matematinius masės, pasikartojančių reiškinių modelius. Jungiamoji grandis tarp tikimybių teorijos ir matematinės statistikos yra ribines teoremas tikimybių teorija.

Šiuo metu statistiniai metodai taikomi beveik visuose šalies ūkio sektoriuose.

— Gyventojų skaičius– visų tiriamų objektų (kartais – ir pačių objektų) statistiniai duomenys. Dažnai bendra populiacija laikoma SV X.

— Pavyzdys(imties populiacija) – statistiniai objektų, atsitiktinai atrinktų iš bendrosios visumos, duomenys.

— Mėginio dydis n(visų gyventojų skaičius N) – objektų, atrinktų tirti iš bendrosios visumos, skaičius (objektų skaičius bendrojoje aibėje).

Pavyzdžiai.

A) Statistiniai duomenys gali būti: mokinio augimas; veiksmažodžių (ar kitų kalbos dalių) skaičius tam tikros trukmės teksto ištraukoje; GPA; intelekto lygis; dispečerio padarytų klaidų skaičius ir kt.

b) Bendra populiacija galėtų būti: visų žmonių ūgis, visų gamyklos darbuotojų gretos, tam tikros kalbos dalies vartojimo dažnumas visuose tiriamo autoriaus darbuose, visų absolventų atestato pažymių vidurkis ir kt.



V) Mėginių ėmimas galėtų būti: – 20 mokinių ūgis, veiksmažodžių skaičius atsitiktinai parinktose 50 vienarūšių teksto ištraukų, kurių ilgis 500 vartosenų, 100 abiturientų, atsitiktinai atrinktų iš miesto mokyklų, pažymių vidurkis ir kt.

Mėginys vadinamas atstovas jeigu jis teisingai atspindi bendrosios populiacijos nuosavybę. Imties reprezentatyvumas pasiekiamas atsitiktinės atrankos būdu, kai visi populiacijos objektai turi vienodą tikimybę būti atrinkti.

Kad pavyzdys būtų reprezentatyvus, naudokite įvairių būdų studijų objektų parinkimas.

Atrankos tipai: paprastas, mechaninis, serijinis, tipinis.

Paprasta. Elementai parenkami atsitiktinai iš visos populiacijos.

Mechaninis pasirinkimas. Atrenkamas kas 10 (25, 30 ir tt) objektų iš bendrosios populiacijos.

Serialas. Kiekvienoje serijoje atliekamas tyrimas (pvz., iš teksto atrenkama 10 ištraukų iš 500 žodžių vartosenų – 10 serijų).

Tipiškas. Bendroji populiacija skirstoma į tipines grupes pagal tam tikrą požymį. Iš kiekvienos tokios grupės išskirtų serijų skaičius nustatomas pagal šios grupės dalį bendroje populiacijoje.

Imties ir jos statistinis pasiskirstymas grafinis vaizdas.

Ištirkime CB X ( gyventojų) dėl kurio nors požymio. Atliekama nemažai nepriklausomų bandymų. Dėl eksperimentų SV X įgauna tam tikras vertes. Gautų verčių rinkinys yra pavyzdys, o pačios reikšmės yra statistiniai duomenys.

Iš pradžių imtis reitinguojama – imties statistiniai duomenys išdėstomi nemažėjančia tvarka. Gauname variacijų seriją.

Variacijų serija- reitinguotas pavyzdys.

Diskrečiosios statistinės eilutės

Jei bendroji visuma yra diskrečioji SV, sudaroma atskira statistinė eilutė (statistinis skirstinys).

Tegul vertė pavyzdyje pasirodo vieną kartą,

Raza,..., - kartus.

I-oji variantas pavyzdžiai; - dažnis i-oji parinktis Dažnis parodo, kiek kartų pavyzdyje buvo pateikta parinktis.

- santykinis dažnis i-osios parinktys

(rodo, kokia yra imties dalis).

Statistinis pasiskirstymas – tai atrankos parinkčių ir jų dažnių arba santykinių dažnių atitikimas.

DSV atveju statistinis pasiskirstymas gali būti pateiktas lentelės forma – statistine dažnių eilute arba statistine santykinių dažnių eilute.

Statistinės dažnių eilutės Statistinės eilutės

santykiniai dažniai

........
........
........
........

Pateikimo aiškumo dėlei statistinis pasiskirstymas imtys sudaro statistinio skirstinio „grafus“: daugiakampį ir histogramą.

Dažnio daugiakampis(santykiniai dažniai) – grafinis diskrečiųjų statistinių eilučių atvaizdavimas – lūžta linija, nuosekliai jungianti taškus [santykinių dažnių daugiakampiui].

Pavyzdys. Tyrėjas domisi stojančiųjų matematikos žiniomis. Atrenkama 10 pretendentų ir įrašomi jų mokykliniai šio dalyko pažymiai. Gautas toks pavyzdys: 5;4;4;3;2;5;4;3;4;5.

a) Pateikite pavyzdį variacijų serijos forma;

b) sudaryti statistines dažnių ir santykinių dažnių eilutes;

c) nubrėžkite gautos serijos santykinių dažnių daugiakampį.

a) Surikiuokime imtį, t.y. Išdėliokime pavyzdinius narius nemažėjančia tvarka. Gauname variacijų seriją: 2; 3; 3; 4; 4; 4; 4; 5; 5;5.

b) Sudarykite statistinę dažnių eilutę (atrankos parinkčių ir jų dažnių atitikimas) ir santykinių dažnių statistinę eilutę (atrankos parinkčių ir jų santykinių dažnių atitikimas)

0,1 0,2 0,4 0,3

Statistinių dažnių eilutės statistinės eilutės rel. dažnius

1+2+4+3=10=n 0,1+0,2+0,4+0,3=1.

Santykinio dažnio daugiakampis.


Laboratorinis darbas Nr.1. Pirminis statistinių duomenų apdorojimas

Paskirstymo serijos konstrukcija

Tvarkingas gyventojų vienetų pasiskirstymas į grupes pagal bet kurią požymį vadinamas netoli platinimo . Šiuo atveju charakteristika gali būti kiekybinė, tada vadinama serija variacinis , ir kokybinis, tada serija vadinama atributinė . Taigi, pavyzdžiui, miesto gyventojų skaičius gali būti paskirstytas pagal amžiaus grupėse variacijų serijoje arba pagal profesinę priklausomybę atributų serijoje (žinoma, pasiskirstymo serijoms sudaryti galima pasiūlyti daug daugiau kokybinių ir kiekybinių charakteristikų; charakteristikos pasirinkimą lemia užduotis statistiniai tyrimai).

Bet kuriai platinimo serijai būdingi du elementai:

- variantas(x i) – tai individualios imties visumos vienetų charakteristikos reikšmės. Variacijų serijai parinktis įgauna skaitines reikšmes, atributinei – kokybines (pvz., x = „valstybės tarnautojas“);

- dažnis(n i) – skaičius, rodantis, kiek kartų tam tikra atributo reikšmė pasitaiko. Jei dažnis išreiškiamas kaip santykinis skaičius (t. y. populiacijos elementų dalis, atitinkanti duota vertė variantų, bendroje gyventojų apimtyje), tada jis vadinamas santykinis dažnis arba dažnis.

Variacijų serija gali būti:

- diskretiškas kai apibūdinamas tiriamas požymis tam tikras skaičius(dažniausiai visa).

- intervalas, kai nuolat kintančios charakteristikos ribos „nuo“ ir „iki“. Intervalų serija taip pat sudaroma, jei diskretiškai kintančios charakteristikos reikšmių rinkinys yra didelis.

Intervalų serija gali būti sudaryta tiek su vienodo ilgio intervalais (vienodo intervalo eilutės), tiek su nevienodais intervalais, jei tai diktuoja statistinio tyrimo sąlygos. Pavyzdžiui, galima atsižvelgti į pajamų paskirstymo seką tokiais intervalais:<5тыс р., 5-10 тыс р., 10-20 тыс.р., 20-50 тыс р., и т.д. Если цель исследования не определяет способ построения интервального ряда, то строится равноинтервальный ряд, число интервалов в котором определяется по формуле Стерджесса:



kur k yra intervalų skaičius, n yra imties dydis. (Žinoma, formulė dažniausiai duoda trupmeninį skaičių, o intervalų skaičiumi pasirenkamas artimiausias gautam skaičiui sveikasis skaičius.) Intervalo ilgis šiuo atveju nustatomas pagal formulę

.

Grafiškai variacijų serijos gali būti pateiktos formoje histogramos(virš kiekvieno intervalų serijos intervalo pastatyta aukščio „stulpelis“, atitinkantis šio intervalo dažnį), paskirstymo daugiakampis(nutrūkusi linija, jungianti taškus ( x i;n i) arba kaupiasi(pagrįsta sukauptais dažniais, t. y. kiekvienai atributo reikšmei imamas dažnis objektų, kurių atributo reikšmė yra mažesnė už nurodytąją, rinkinyje).

Dirbant su Excel, variacijų serijoms sudaryti galima naudoti šias funkcijas:

CHECK( duomenų masyvas) – imties dydžiui nustatyti. Argumentas yra langelių diapazonas, kuriame yra imties duomenys.

COUNTIF( diapazonas; kriterijus) – gali būti naudojamas atributui arba variacinei serijai sudaryti. Argumentai yra atributo pavyzdinių verčių masyvo diapazonas ir kriterijus - skaitmeninė arba tekstinė atributo reikšmė arba langelio, kuriame jis yra, numeris. Rezultatas yra tos vertės atsiradimo imtyje dažnis.

DAŽNIS( duomenų masyvas; intervalų masyvas) – variacijų serijai sudaryti. Argumentai yra pavyzdinių duomenų masyvo diapazonas ir intervalo stulpelis. Jei reikia sudaryti diskrečią seriją, čia nurodomos parinkčių reikšmės, jei tai yra intervalų serija, tada viršutinės intervalų ribos (jos taip pat vadinamos „kišenėmis“). Kadangi rezultatas yra dažnių stulpelis, funkcijos įvedimą turite užbaigti paspausdami CTRL+SHIFT+ENTER. Atkreipkite dėmesį, kad įvesdami funkciją nurodydami intervalų masyvą, jums nereikia nurodyti paskutinės reikšmės - visos reikšmės, kurios nebuvo įtrauktos į ankstesnes „kišenes“, bus patalpintos į atitinkamą „kišenę“. Tai kartais gali padėti išvengti klaidos, kai didžiausia imties reikšmė automatiškai neįdedama į paskutinę kišenę.

Be to, sudėtingoms grupėms (remiantis keliomis charakteristikomis) naudokite įrankį „pivot tables“. Jie taip pat gali būti naudojami atributų ir variantų serijoms sudaryti, tačiau tai be reikalo apsunkina užduotį. Be to, norint sukurti variantų seriją ir histogramą, yra „histogramos“ procedūra iš „Analytics Package“ papildinio (norėdami naudoti priedus „Excel“, pirmiausia turite juos atsisiųsti; jie nėra įdiegti pagal numatytuosius nustatymus)

Iliustruojame pirminio duomenų apdorojimo procesą šiais pavyzdžiais.

1.1 pavyzdys. Yra duomenų apie 60 šeimų kiekybinę sudėtį.

Sukurkite variacijų seriją ir skirstinio daugiakampį

Sprendimas.

Atidarykime Excel lenteles. Įveskime duomenų masyvą į diapazoną A1:L5. Jei studijuojate dokumentą elektronine forma (pavyzdžiui, Word formatu), norėdami tai padaryti, tiesiog pasirinkite lentelę su duomenimis ir nukopijuokite ją į mainų sritį, tada pasirinkite langelį A1 ir įklijuokite duomenis – jie automatiškai užims atitinkamą diapazoną. Apskaičiuokime mėginio tūrį n – imties duomenų skaičių, kad tai padarytumėte, langelyje B7 įveskite formulę =COUNT(A1:L5). Atkreipkite dėmesį, kad norint įvesti norimą diapazoną į formulę, jo žymėjimo nereikia įvesti iš klaviatūros, pakanka jį pasirinkti. Nustatykime pavyzdžio minimalias ir didžiausias vertes, įvesdami formulę =MIN(A1:L5) langelyje B8, o langelyje B9: =MAX(A1:L5).

1.1 pav. 1 pavyzdys. Pirminis statistinių duomenų apdorojimas Excel lentelėse

Toliau parengsime lentelę variacijų serijai sudaryti, įvesdami intervalo stulpelio (variantų reikšmių) ir dažnio stulpelio pavadinimus. Intervalų stulpelyje įveskite būdingas reikšmes nuo minimalios (1) iki didžiausios (6), užimančias diapazoną B12:B17. Pasirinkite dažnio stulpelį, įveskite formulę =FREQUENCY(A1:L5,B12:B17) ir paspauskite klavišų kombinaciją CTRL+SHIFT+ENTER

1.2 pav. 1 pavyzdys. Variacijų serijos sudarymas

Norėdami valdyti, apskaičiuokime dažnių sumą naudodami funkciją SUM (funkcijos piktograma S grupėje „Redagavimas“ skirtuke „Pagrindinis“), apskaičiuota suma turi sutapti su anksčiau apskaičiuotu mėginio tūriu langelyje B7.

Dabar sukurkime daugiakampį: pasirinkę gautą dažnių diapazoną, skirtuke „Įterpti“ pasirinkite komandą „Grafas“. Pagal numatytuosius nustatymus horizontalios ašies reikšmės bus eilės skaičiai - mūsų atveju nuo 1 iki 6, o tai sutampa su parinkčių reikšmėmis (tarifų kategorijų skaičiais).

Diagramų serijos pavadinimą „1 serija“ galima pakeisti naudojant tą pačią skirtuko „Dizainas“ parinktį „Pasirinkti duomenis“ arba tiesiog ištrinti.

1.3 pav. 1 pavyzdys. Dažnio daugiakampio konstravimas

1.2 pavyzdys. Yra duomenų apie teršalų išmetimą iš 50 šaltinių:

10,4 18,6 10,3 26,0 45,0 18,2 17,3 19,2 25,8 18,7
28,2 25,2 18,4 17,5 41,8 14,6 10,0 37,8 10,5 16,0
18,1 16,8 38,5 37,7 17,9 29,0 10,1 28,0 12,0 14,0
14,2 20,8 13,5 42,4 15,5 17,9 19, 10,8 12,1 12,4
12,9 12,6 16,8 19,7 18,3 36,8 15,0 37,0 13,0 19,5

Sukurkite vienodo intervalo eilutę, sukurkite histogramą

Sprendimas

Įveskime duomenų masyvą į Excel lapą, jis užims diapazoną A1:J5 Kaip ir ankstesnėje užduotyje, nustatysime imties dydį n, pavyzdyje esančias minimalias ir didžiausias reikšmes. Kadangi dabar mums reikia ne diskrečiųjų, o intervalų, o užduotyje esančių intervalų skaičius nenurodytas, intervalų skaičių k apskaičiuojame naudodami Sturgesso formulę. Norėdami tai padaryti, langelyje B10 įveskite formulę =1+3.322*LOG10(B7).

1.4 pav. 2 pavyzdys. Lygių intervalų serijos sudarymas

Gauta reikšmė nėra sveikasis skaičius, ji yra maždaug 6,64. Kadangi k=7 intervalų ilgis bus išreikštas sveikuoju skaičiumi (skirtingai nei k=6 atveju), pasirenkame k=7, įvesdami šią reikšmę į langelį C10. Intervalo d ilgį langelyje B11 apskaičiuojame įvedę formulę =(B9-B8)/C10.

Apibrėžkime intervalų masyvą, nurodydami viršutinę ribą kiekvienam iš 7 intervalų. Norėdami tai padaryti, langelyje E8 apskaičiuojame pirmojo intervalo viršutinę ribą, įvesdami formulę =B8+B11; langelyje E9 viršutinė antro intervalo riba, įvedant formulę =E8+B11. Norėdami apskaičiuoti likusias viršutinių intervalų ribų reikšmes, įvestoje formulėje fiksuojame langelio B11 skaičių naudodami $ ženklą, kad E9 langelio formulė būtų =E8+B$11, ir nukopijuokite ląstelės E9 turinys į E10-E14 ląsteles. Paskutinė gauta vertė yra lygi didžiausiai imties vertei, apskaičiuotai anksčiau langelyje B9.

1.5 pav. 2 pavyzdys. Lygių intervalų serijos sudarymas


Dabar užpildykime „kišenių“ masyvą naudodami FREQUENCY funkciją, kaip buvo padaryta 1 pavyzdyje.

1.6 pav. 2 pavyzdys. Lygių intervalų serijos sudarymas

Naudodami gautas variacijų eilutes sudarysime histogramą: pasirinkite dažnio stulpelį ir skirtuke „Įterpti“ pasirinkite „Histograma“. Gavę histogramą, pakeiskime joje esančias horizontaliosios ašies reikšmes į intervalų diapazono reikšmes, skirtuke „Dizaineris“ pasirinkite parinktį „Pasirinkti duomenis“. Pasirodžiusiame lange pasirinkite „Horizontalios ašies etiketės“ ​​komandą „Keisti“ ir įveskite parinkčių reikšmių diapazoną, pasirinkdami jį pele.

1.7 pav. 2 pavyzdys. Histogramos sudarymas

1.8 pav. 2 pavyzdys. Histogramos sudarymas

Kintamosios charakteristikos pokyčių aprašymas atliekamas naudojant pasiskirstymo eilutes.

Statistinio pasiskirstymo eilutė- tai tvarkingas statistinės visumos vienetų pasiskirstymas į atskiras grupes pagal tam tikrą kintamą charakteristiką.

Kokybiniu pagrindu sudarytos statistinės eilutės vadinamos atributinė. Jei pasiskirstymo serija yra pagrįsta kiekybine charakteristika, tada serija yra variacinis.

Savo ruožtu variacijų serijos skirstomos į diskrečiąsias ir intervalines. Pagrinde diskretiškas paskirstymo eilutėje yra atskiras (nepertraukiamas) požymis, įgaunantis konkrečias skaitines reikšmes (nusikaltimų skaičius, teisinės pagalbos besikreipiančių piliečių skaičius). Intervalas paskirstymo serija sudaroma remiantis tęstiniu požymiu, kuris gali įgyti bet kokią reikšmę iš tam tikro diapazono (nuteistojo amžius, įkalinimo trukmė ir kt.)

Bet kurią statistinio pasiskirstymo eilutę sudaro du privalomi elementai – serijos ir dažnio parinktys. Parinktys (x i) – individualios charakteristikos reikšmės, kurias ji užima pasiskirstymo eilutėje. Dažniai (f i) yra skaitinės reikšmės, rodančios, kiek kartų paskirstymo serijoje atsiranda tam tikrų parinkčių. Visų dažnių suma vadinama populiacijos apimtimi.

Dažniai, išreikšti santykiniais vienetais (trupmenomis arba procentais), vadinami dažniais ( w i). Dažnių suma yra lygi vienetui, jei dažniai išreiškiami vieneto trupmenomis, arba 100, jei jie išreiškiami procentais. Dažnių naudojimas leidžia palyginti variacijų eilutes su skirtingais populiacijos dydžiais. Dažnis nustatomas pagal šią formulę:

Norint sudaryti diskrečią eilutę, surikiuojamos visos serijoje pasitaikančios individualios charakteristikos reikšmės, o tada apskaičiuojamas kiekvienos reikšmės pasikartojimų dažnis. Paskirstymo serija sudaroma lentelės, susidedančios iš dviejų eilučių ir stulpelių, iš kurių viename yra serijos variantų reikšmės, idėja. x i, antroje – dažnio reikšmės fi.

Panagrinėkime diskrečiųjų variacijų serijos sudarymo pavyzdį.

3.1 pavyzdys . Vidaus reikalų ministerijos duomenimis, užregistruoti nusikaltimai, kuriuos N mieste padarė nepilnamečiai.

17 13 15 16 17 15 15 14 16 13 14 17 14 15 15 16 16 15 14 15 15 14 16 16 14 17 16 15 16 15 13 15 15 13 15 14 15 13 17 14.

Sukurkite diskrečią paskirstymo seriją.

Sprendimas .

Pirmiausia reikia reitinguoti duomenis apie nepilnamečių amžių, t.y. užsirašykite juos didėjimo tvarka.

13 13 13 13 13 14 14 14 14 14 14 14 14 15 15 15 15 15 15 15 15 15 15 15 15 15 15 16 16 16 16 16 16 16 16 17 17 17 17 17



3.1 lentelė

Taigi, dažniai atspindi tam tikro amžiaus žmonių skaičių, pavyzdžiui, 5 žmonės yra 13 metų, 8 žmonės yra 14 metų ir t.

Statyba intervalas pasiskirstymo eilutės atliekamos panašiai kaip ir vienodo intervalo grupavimas pagal kiekybinį kriterijų, tai yra pirmiausia nustatomas optimalus grupių, į kurias bus skirstoma populiacija, skaičius, nustatomos intervalų ribos pagal grupes ir apskaičiuojami dažniai. .

Iliustruosime intervalų skirstinio serijos konstrukciją naudodami šį pavyzdį.

3.2 pavyzdys .

Sudarykite intervalų eilutę, remdamiesi tokiu statistiniu visuminiu rodikliu - advokato darbo užmokestis biure, tūkstančiai rublių:

16,0 22,2 25,1 24,3 30,5 32,0 17,0 23,0 19,8 27,5 22,0 18,9 31,0 21,5 26,0 27,4

Sprendimas.

Paimkime, kad optimalus vienodo intervalo grupių skaičius duotai statistinei populiacijai yra 4 (turime 16 variantų). Todėl kiekvienos grupės dydis yra lygus:

ir kiekvieno intervalo reikšmė bus lygi:

Intervalų ribos nustatomos pagal formules:

,

kur yra atitinkamai apatinė ir viršutinė i-ojo intervalo ribos.

Atsisakydami tarpinių intervalų ribų skaičiavimų, jų reikšmes (parinktys) ir advokatų skaičių (dažnius) su atlyginimais kiekviename intervale įrašome į 3.2 lentelę, kuri iliustruoja gautas intervalų eilutes.

3.2 lentelė

Statistinių pasiskirstymo eilučių analizė gali būti atliekama naudojant grafinį metodą. Grafinis pasiskirstymo eilučių vaizdavimas leidžia aiškiai iliustruoti tiriamos populiacijos pasiskirstymo modelius, vaizduojant ją daugiakampio, histogramos ir kumuliacijos pavidalu. Pažvelkime į kiekvieną iš pateiktų grafikų.

Daugiakampis– trūkinė linija, kurios atkarpos jungia taškus su koordinatėmis ( x i;f i). Paprastai daugiakampis naudojamas atskiroms paskirstymo serijoms pavaizduoti. Norėdami jį sukurti, ant x ašies brėžiamos individualios charakteristikos vertės. x i, ordinatėje – šias reikšmes atitinkantys dažniai. Dėl to taškus, atitinkančius duomenis, pažymėtus išilgai abscisių ir ordinačių ašių, sujungus atkarpomis, gaunama laužta linija, vadinama daugiakampiu. Pateiksime dažnio daugiakampio konstravimo pavyzdį.

Norėdami iliustruoti daugiakampio konstrukciją, paimkime 3.1 pavyzdžio sprendimo rezultatą, kad sukurtume diskrečią eilutę – 1 pav. Nuteistųjų amžius brėžiamas išilgai abscisių ašies, o tam tikro amžiaus nepilnamečių nuteistųjų skaičius. ordinačių ašis. Analizuodami šią poligoną, galime teigti, kad daugiausiai nuteistųjų – 14 asmenų – yra 15 metų amžiaus.

3.1 pav. Diskrečiųjų serijų dažnių diapazonas.

Intervalų serijai taip pat galima sudaryti daugiakampį, intervalų vidurio taškai brėžiami išilgai abscisių ašies, o atitinkami dažniai – išilgai ordinačių ašies.

Histograma– laiptuota figūra, susidedanti iš stačiakampių, kurių pagrindai yra atributo reikšmės intervalai, o aukščiai lygūs atitinkamiems dažniams. Histograma naudojama tik intervalų pasiskirstymo serijoms rodyti. Jei intervalai nelygūs, tai norint sudaryti histogramą, ordinačių ašyje brėžiami ne dažniai, o dažnio ir atitinkamo intervalo pločio santykis. Histograma gali būti paversta pasiskirstymo daugiakampiu, jei jos strypų vidurio taškai yra sujungti vienas su kitu atkarpomis.

Norėdami iliustruoti histogramos konstrukciją, paimkime intervalų serijos konstravimo rezultatus iš 3.2 pavyzdžio – 3.2 pav.

3.2 pav. – Advokatų atlyginimų pasiskirstymo histograma.

Variacijų serijų grafiniam vaizdavimui taip pat naudojama kumuliacija. Kaupiasi– kreivė, vaizduojanti sukauptų dažnių seriją ir jungiamuosius taškus su koordinatėmis ( x i;f i nak). Kaupiamieji dažniai apskaičiuojami nuosekliai sudedant visus pasiskirstymo eilučių dažnius ir parodomas populiacijos vienetų, kurių charakteristika yra ne didesnė už nurodytąją, skaičius. Pavaizduokime 3.2 pavyzdyje – 3.3 lentelėje pateiktų variacinių intervalų eilučių sukauptų dažnių skaičiavimą.

3.3 lentelė

Norint sudaryti diskrečiųjų pasiskirstymo serijų kumuliacijas, surūšiuotos atskiros atributo reikšmės brėžiamos išilgai abscisių ašies, o jas atitinkantys sukaupti dažniai – išilgai ordinačių ašies. Konstruojant kaupiamąją intervalų eilutės kreivę, pirmasis taškas turės abscisę, lygią pirmojo intervalo apatinei ribai, o ordinatę lygi 0. Visi tolesni taškai turi atitikti viršutinę intervalų ribą. Sukurkime kumuliaciją naudodami duomenis iš 3.3 lentelės – 3.3 pav.

3.3 pav. – Kaupiamasis advokatų atlyginimų paskirstymo kreivė.

Saugumo klausimai

1. Statistinio skirstinio eilutės samprata, pagrindiniai jos elementai.

2. Statistinių skirstinių eilučių tipai. Trumpas jų aprašymas.

3. Diskrečiųjų ir intervalinių skirstinių eilutės.

4. Diskrečiųjų skirstinių eilučių sudarymo metodika.

5. Intervalų skirstinių eilučių sudarymo metodika.

6. Grafinis diskrečiųjų skirstinių eilučių vaizdavimas.

7. Grafinis intervalų skirstinių eilučių vaizdavimas.

Užduotys

1 problema. Galimi šie duomenys apie 25 mokinių rezultatus TGP grupėje per sesiją: 5, 4, 4, 4, 3, 2, 5, 3, 4, 4, 4, 3, 2, 5, 2, 5, 5, 2, 3 , 3, 5, 4, 2, 3, 3. Sukurkite atskirą mokinių pasiskirstymo variacijų eilutę pagal sesijos metu gautus pažymius. Gautoms serijoms apskaičiuokite dažnius, sukauptus dažnius, sukauptus dažnius. Padarykite išvadas.

2 problema. Kolonijoje yra 1000 nuteistųjų, jų pasiskirstymas pagal amžių pateiktas lentelėje:

Nupieškite šią seriją grafiškai. Padarykite išvadas.

3 problema. Apie kalinių įkalinimo terminus yra šie duomenys:

5; 4; 2; 1; 6; 3; 4; 3; 2; 2; 3; 1; 17; 6; 2; 8; 5; 11; 9; 3; 5; 6; 4; 3; 10; 5; 25; 1; 12; 3; 3; 4; 9; 6; 5; 3; 4; 3; 5; 12; 4; 13; 2; 4; 6; 4; 14; 3; 11; 5; 4; 13; 2; 4; 6; 4; 14; 3; 11; 5; 4; 3; 12; 6.

Sudarykite kalinių pasiskirstymo pagal įkalinimo terminus intervalų eilutę. Padarykite išvadas.

4 problema. Turimi šie duomenys apie nuteistųjų pasiskirstymą regione tiriamuoju laikotarpiu pagal amžiaus grupes:

Nubraižykite šią seriją grafiškai ir padarykite išvadas.

Atskiroms charakteristikoms yra sukurta atskirų variacijų serija.

Norint sudaryti diskrečiųjų variacijų eilutę, reikia atlikti šiuos veiksmus: 1) sutvarkyti stebėjimo vienetus didėjančia tirtos charakteristikos reikšmės tvarka,

2) nustatyti visas galimas atributo x i reikšmes, išdėstyti jas didėjimo tvarka,

atributo vertė, i .

atributo vertės dažnumas ir žymėti f i . Visų serijos dažnių suma yra lygi elementų skaičiui tiriamoje populiacijoje.

1 pavyzdys .

Mokinių gautų pažymių per egzaminus sąrašas: 3; 4; 3; 5; 4; 2; 2; 4; 4; 3; 5; 2; 4; 5; 4; 3; 4; 3; 3; 4; 4; 2; 2; 5; 5; 4; 5; 2; 3; 4; 4; 3; 4; 5; 2; 5; 5; 4; 3; 3; 4; 2; 4; 4; 5; 4; 3; 5; 3; 5; 4; 4; 5; 4; 4; 5; 4; 5; 5; 5.

Štai numeris X - pažymysyra diskretinis atsitiktinis kintamasis, o gautas įverčių sąrašas yrastatistiniai (stebimi) duomenys .

    išdėliokite stebėjimo vienetus tirtos charakteristikos vertės didėjimo tvarka:

2; 2; 2; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5.

2) nustatyti visas galimas atributo x i reikšmes, išdėstyti jas didėjančia tvarka:

Šiame pavyzdyje visi įverčiai gali būti suskirstyti į keturias grupes su šiomis reikšmėmis: 2; 3; 4; 5.

Vadinama atsitiktinio dydžio reikšmė, atitinkanti tam tikrą stebimų duomenų grupę atributo vertė, parinktis (parinktis) ir pažymėkite x i .

Vadinamas skaičius, parodantis, kiek kartų atitinkama charakteristikos reikšmė atsiranda daugelyje stebėjimų atributo vertės dažnumas ir žymėti f i .

Mūsų pavyzdžiui

2 balas pasitaiko – 8 kartus,

3 balas pasitaiko - 12 kartų,

4 balas pasitaiko - 23 kartus,

5 balas pasitaiko – 17 kartų.

Iš viso yra 60 įvertinimų.

4) gautus duomenis surašykite į lentelę iš dviejų eilučių (stulpelių) - x i ir f i.

Remiantis šiais duomenimis, galima sudaryti atskirų variacijų eilutes

Diskrečių variacijų serija – tai lentelė, kurioje tiriamos charakteristikos pasitaikančios reikšmės nurodomos kaip individualios reikšmės didėjančia tvarka ir jų dažniai

  1. Intervalinių variacijų serijos konstravimas

Be atskirų variacijų eilučių, dažnai susiduriama su duomenų grupavimo metodu, pvz., intervalų variacijų serijomis.

Intervalų serija sudaroma, jei:

    ženklas turi nuolatinį kitimo pobūdį;

    Buvo daug atskirų verčių (daugiau nei 10)

    diskrečiųjų verčių dažniai yra labai maži (neviršija 1–3, kai yra gana daug stebėjimo vienetų);

    daug atskirų ypatybės reikšmių su tais pačiais dažniais.

Intervalų variacijų serija yra būdas grupuoti duomenis lentelės, kurioje yra du stulpeliai, forma (charakteristikos reikšmės reikšmių intervalo pavidalu ir kiekvieno intervalo dažnis).

Skirtingai nuo diskrečiųjų serijų, intervalų serijos charakteristikos reikšmės vaizduojamos ne atskiromis reikšmėmis, o reikšmių intervalu („nuo - iki“).

Vadinamas skaičius, rodantis, kiek stebėjimo vienetų pateko į kiekvieną pasirinktą intervalą atributo vertės dažnumas ir žymėti f i . Visų serijos dažnių suma yra lygi elementų (stebėjimo vienetų) skaičiui tiriamoje populiacijoje.

Jei vienetas turi būdingą vertę, lygią viršutinei intervalo ribai, tada jis turi būti priskirtas kitam intervalui.

Pavyzdžiui, vaikas, kurio ūgis 100 cm, pateks į 2 intervalą, o ne į pirmąjį; o vaikas, kurio ūgis 130 cm, pateks į paskutinį intervalą, o ne į trečią.

Remiantis šiais duomenimis, galima sudaryti intervalų variacijų eilutes.

Kiekvienas intervalas turi apatinę ribą (xn), viršutinę ribą (xw) ir intervalo plotį ( i).

Intervalo riba yra atributo reikšmė, esanti ant dviejų intervalų ribos.

vaikų ūgis (cm)

vaikų ūgis (cm)

vaikų skaičius

daugiau nei 130

Jei intervalas turi viršutinę ir apatinę ribas, tada jis vadinamas uždaras intervalas. Jei intervalas turi tik apatinę arba tik viršutinę ribą, tai yra - atviras intervalas. Atviras gali būti tik pats pirmasis arba paskutinis intervalas. Aukščiau pateiktame pavyzdyje paskutinis intervalas yra atviras.

Intervalo plotis (i) – skirtumas tarp viršutinės ir apatinės ribos.

i = x n - x in

Laikoma, kad atvirojo intervalo plotis yra toks pat kaip gretimo uždaro intervalo plotis.

vaikų ūgis (cm)

vaikų skaičius

Intervalo plotis (i)

skaičiavimams 130+20=150

20 (nes gretimo uždaro intervalo plotis yra 20)

Visos intervalų eilutės skirstomos į intervalų eilutes su vienodais intervalais ir intervalų serijas su nevienodais intervalais . Tarpais išdėstytose eilutėse su vienodais intervalais visų intervalų plotis yra vienodas. Intervalų serijose su nelygiais intervalais intervalų plotis yra skirtingas.

Nagrinėjamame pavyzdyje - intervalų eilutė su nelygiais intervalais.