Valoarea tabelară a f Criteriul lui Fisher. Funcția Fisher în Excel și exemple ale activității sale

Returnează inversul distribuției de probabilitate F (coada dreaptă). Dacă p = FRIST(x;...), atunci FRIST(p;...) = x.

Distribuția F poate fi utilizată într-un test F, care compară gradul de dispersie a două seturi de date. De exemplu, puteți analiza distribuția veniturilor din Statele Unite și Canada pentru a determina dacă cele două țări sunt similare în ceea ce privește densitatea veniturilor.

Important: Această caracteristică a fost înlocuită cu una sau mai multe caracteristici noi care oferă mai multe precizie ridicatăși să aibă nume care reflectă mai bine scopul lor. Deși această caracteristică este încă utilizată pentru compatibilitate cu versiunea anterioară, este posibil să nu mai fie disponibilă în versiunile viitoare. versiuni Excel, așa că vă recomandăm să utilizați noile funcții.

Pentru a afla mai multe despre noile funcții, consultați articolele Funcția F.REV și Funcția F.REV.PH.

Sintaxă

FRIST(probabilitate,grade_libertate1,grade_libertate2)

Argumentele pentru funcția FALTER sunt descrise mai jos.

    Probabilitate- argument necesar. Probabilitatea asociată cu distribuția F cumulativă.

    Grade_de_libertate1- argument necesar. Numărător de grade de libertate.

    Grade_de_libertate2- argument necesar. Numitorul gradelor de libertate.

Note

    Dacă oricare dintre argumente nu este un număr, FDIST returnează valoarea de eroare #VALOARE!.

    Dacă „probabilitate”< 0 или "вероятность" >1, funcția FRIST returnează valoarea de eroare #NUM!.

    Dacă valoarea degrees_freedom1 sau degrees_freedom2 nu este un număr întreg, acesta este trunchiat.

    Dacă „grade_libertate1”< 1 или "степени_свободы1" ≥ 10^10, функция FРАСПОБР возвращает значение ошибки #ЧИСЛО!.

    Dacă „grade_libertate2”< 1 или "степени_свободы2" ≥ 10^10, функция FРАСПОБР возвращает значение ошибки #ЧИСЛО!.

Funcția FDIST poate fi utilizată pentru a determina valorile critice ale distribuției F. De exemplu, rezultatele ANOVA includ de obicei date pentru statistica F, probabilitatea F și valoarea critică a distribuției F la un nivel de semnificație de 0,05. Pentru a determina valoarea critică a lui F, trebuie să utilizați nivelul de semnificație ca argument de probabilitate al funcției FDIST.

De valoarea stabilită probabilitate, funcția FDIST caută o valoare a lui x pentru care FDIST(x, grade_libertate1, grade_libertate2) = probabilitate. Astfel, acuratețea funcției FDIST depinde de precizia FDIST. Pentru a căuta, funcția FRIST folosește o metodă de iterație. Dacă căutarea nu se termină după 100 de iterații, este returnată valoarea de eroare #N/A.

Exemplu

Copiați eșantionul de date din următorul tabel și lipiți-l în celula A1 a noului Foaie Excel. Pentru a afișa rezultatele formulelor, selectați-le și apăsați F2, apoi apăsați Enter. Dacă este necesar, modificați lățimea coloanelor pentru a vedea toate datele.

Testul exact al lui Fisher este un criteriu care este utilizat pentru a compara doi indicatori relativi care caracterizează frecvența unei anumite caracteristici care are două valori. Date inițiale pentru calcul criteriu exact Fisher sunt de obicei grupați sub forma unui tabel cu patru câmpuri.

1. Istoricul dezvoltării criteriului

Criteriul a fost propus mai întâi Ronald Fisherîn cartea sa Design of Experiments. Acest lucru s-a întâmplat în 1935. Fischer însuși a susținut că Muriel Bristol l-a îndemnat la această idee. La începutul anilor 1920, Ronald, Muriel și William Roach erau staționați în Anglia la o stație experimentală agricolă. Muriel a susținut că poate determina ordinea în care ceaiul și laptele erau turnate în ceașcă. La acel moment, nu a fost posibil să se verifice corectitudinea declarației sale.

Acest lucru a dat naștere ideii lui Fisher despre „ipoteza nulă”. Scopul nu a fost să demonstreze că Muriel putea face diferența dintre ceștile de ceai preparate diferit. S-a decis să se infirme ipoteza că o femeie face o alegere la întâmplare. S-a stabilit că ipoteza nulă nu a putut fi nici dovedită, nici justificată. Dar poate fi respins în timpul experimentelor.

S-au pregătit 8 căni. Primele patru sunt umplute mai întâi cu lapte, celelalte patru cu ceai. Cupele au fost amestecate. Bristol s-a oferit să guste ceaiul și să împartă ceștile după metoda de preparare a ceaiului. Rezultatul ar fi trebuit să fie două grupuri. Istoria spune că experimentul a fost un succes.

Datorită testului Fisher, probabilitatea ca Bristol să acționeze intuitiv a fost redusă la 0,01428. Adică, s-a putut identifica corect cupa într-un caz din 70. Dar totuși, nu există nicio modalitate de a reduce la zero șansele pe care doamna le determină întâmplător. Chiar dacă măriți numărul de cești.

Această poveste a dat impuls dezvoltării „ipotezei nule”. În același timp, a fost propus criteriul exact al lui Fisher, a cărui esență este enumerarea tuturor combinațiilor posibile de variabile dependente și independente.

2. Pentru ce este folosit exact testul lui Fisher?

Testul exact al lui Fisher este folosit în principal pentru comparație mostre mici. Există două motive bune pentru aceasta. În primul rând, calcularea criteriului este destul de greoaie și poate dura mult timp sau necesită resurse de calcul puternice. În al doilea rând, criteriul este destul de precis (ceea ce se reflectă chiar și în numele său), ceea ce îi permite să fie utilizat în studii cu un număr mic de observații.

Un loc special este acordat testului exact al lui Fisher în medicină. Aceasta este o metodă importantă de prelucrare a datelor medicale și și-a găsit aplicarea în multe studii științifice. Datorită acesteia, este posibil să se studieze relația dintre anumiți factori și rezultate, să se compare frecvența stărilor patologice între două grupuri de subiecți etc.

3. În ce cazuri poate fi folosit testul exact al lui Fisher?

  1. Variabilele comparate trebuie măsurate în Scala nominalași au numai două sensuri, De exemplu, presiunea arterială normal sau crescut, rezultat favorabil sau nefavorabil, complicații postoperatorii prezente sau nu.
  2. Testul exact al lui Fisher este destinat pentru comparație două grupuri independente, împărțit pe baza factorilor. În consecință, factorul ar trebui să aibă, de asemenea, doar două valori posibile.
  3. Testul este potrivit pentru compararea probelor foarte mici: testul exact al lui Fisher poate fi utilizat pentru a analiza tabele din patru părți în cazul valorilor fenomenului așteptat mai mici de 5, ceea ce este o limitare pentru utilizarea chi-pătratului Pearson test, chiar ținând cont de corecția Yates.
  4. Testul exact al lui Fisher poate fi unilateral și cu două fețe. Cu o opțiune unilaterală, se știe exact unde se va abate unul dintre indicatori. De exemplu, un studiu compară câți pacienți s-au recuperat în comparație cu un grup de control. Se presupune că terapia nu poate agrava starea pacienților, ci doar fie o vindecă, fie nu.
    Un test cu două cozi evaluează diferențele de frecvență în două direcții. Adică, se evaluează probabilitatea unei frecvențe atât mai mari, cât și mai mici a fenomenului în grupul experimental comparativ cu grupul de control.

Un analog al testului exact al lui Fisher este testul chi-pătrat al lui Pearson, în timp ce testul exact al lui Fisher are mai multe de mare putere, mai ales atunci când se compară mostre mici și, prin urmare, are un avantaj în acest caz.

4. Cum se calculează testul exact al lui Fisher?

Să presupunem că studiem dependența frecvenței nașterilor copiilor cu malformații congenitale (CDD) de fumatul matern în timpul sarcinii. În acest scop, au fost selectate două grupuri de gravide, dintre care unul a fost un grup experimental, format din 80 de femei care au fumat în primul trimestru de sarcină, iar al doilea a fost un grup de comparație, incluzând 90 de femei care au fumat în primul trimestru. a sarcinii. imagine sănătoasă viata pe tot parcursul sarcinii. Numărul cazurilor de malformații congenitale fetale determinate prin ecografie în lotul experimental a fost de 10, în lotul de comparație - 2.

Mai întâi compunem tabel de urgență cu patru câmpuri:

Testul exact al lui Fisher se calculează folosind următoarea formulă:

unde N - numărul total studiat în două grupe; ! - factorial, care este produsul unui număr și a unei secvențe de numere, fiecare dintre ele mai mic decât precedentul cu 1 (de exemplu, 4! = 4 3 2 1)

Ca rezultat al calculelor, constatăm că P = 0,0137.

5. Cum se interpretează valoarea testului exact al lui Fisher?

Avantajul metodei este respectarea criteriului rezultat valoare exacta nivelul de semnificație p. Adică, valoarea de 0,0137 obținută în exemplul nostru este nivelul de semnificație al diferențelor dintre grupurile comparate în frecvența dezvoltării malformațiilor congenitale ale fătului. Trebuie doar să compari număr dat cu un nivel de semnificație critică acceptat de obicei în cercetarea medicală ca 0,05.

  • Dacă valoarea testului exact al lui Fisher este mai mare decât valoarea critică, acesta este acceptat ipoteza nulăşi se ajunge la concluzia că nu există statistică diferențe semnificative frecvența rezultatului în funcție de prezența unui factor de risc.
  • Dacă valoarea testului exact al lui Fisher este mai mică decât critică, acesta este acceptat ipoteză alternativăși se ajunge la concluzia că există diferențe semnificative statistic în incidența rezultatului în funcție de expunerea la factorul de risc.

În exemplul nostru P< 0,05, в связи с чем делаем вывод о наличии прямой взаимосвязи курения и вероятности развития ВПР плода. Частота возникновения врожденной патологии у детей курящих женщин statistic semnificativ mai mare decât nefumătorii.

1. Tabelul valorilor testului F Fisher pentru nivelul de semnificație α = 0,05

1 2 3 4 5 6 8 12 24
1 161,45 199,50 215,72 224,57 230,17 233,97 238,89 243,91 249,04 254,32
2 18,51 19,00 19,16 19,25 19,30 19,33 19,37 19,41 19,45 19,50
3 10,13 9,55 9,28 9,12 9,01 8,94 8,84 8,74 8,64 8,53
4 7,71 6,94 6,59 6,39 6,26 6,16 6,04 5,91 5,77 5,63
5 6,61 5,79 5,41 5, 19 5,05 4,95 4,82 4,68 4,53 4,36
6 5,99 5,14 4,76 4,53 4,39 4,28 4,15 4,00 3,84 3,67
7 5,59 4,74 4,35 4,12 3,97 3,87 3,73 3,57 3,41 3,23
8 5,32 4,46 4,07 3,84 3,69 3,58 3,44 3,28 3,12 2,93
9 5,12 4,26 3,86 3,63 3,48 3,37 3,23 3,07 2,90 2,71
10 4,96 4,10 3,71 3,48 3,33 3,22 3,07 2,91 2,74 2,54
11 4,84 3,98 3,59 3,36 3, 20 2,95 2,79 2,61 2,40

Când m=1, selectați 1 coloană.

k 2 =n-m=7-1=6 - adică a șasea linie - luați valoarea tabelului Fisher

Tabelul F = 5,99, y avg. = total: 7

Influența lui x asupra y este moderată și negativă

ŷ - valoarea modelului.

F calc. = 28,648: 1 = 0,92
200,50: 5

A = 1/7 * 398,15 * 100% = 8,1%< 10% -

valoare acceptabilă


Modelul este destul de precis.

F calc. = 1/0,92 = 1,6

F calc. = 1,6< F табл. = 5,99

Ar trebui să fie F calc. >F tabel

Încălcat acest model, prin urmare această ecuație nu este semnificativă statistic.

Deoarece valoare calculată mai mică decât valoarea tabelului - model nesemnificativ.

1 Σ (y - ŷ) *100%
N y

Eroare de aproximare.

A= 1/7*0,563494* 100% = 8,04991% 8,0%

Considerăm că modelul este corect dacă eroarea medie de aproximare este mai mică de 10%.

Identificarea parametrilor perechi nu este regresie liniara

Modelul y = a * x b - functie de putere

Pentru a aplica formula cunoscută, este necesară logaritmul modelului neliniar.

log y = log a + b log x

Y=C+b*X -model liniar.

C = 1,7605 - (- 0,298) * 1,7370 = 2,278

Reveniți la modelul original

Ŷ=10 s *x b =10 2,278 *x -0,298

Nu. U X Y X Y*X U eu (y-ŷ)/yI
1 68,80 45,10 1,8376 1,6542 3,039758 2,736378 60,9614643 0,113932
2 61, 20 59,00 1,7868 1,7709 3,164244 3,136087 56,2711901 0,080536
3 59,90 57, 20 1,7774 1,7574 3,123603 3,088455 56,7931534 0,051867
4 56,70 61,80 1,7536 1,7910 3,140698 3, 207681 55,4990353 0,021181
5 55,00 58,80 1,7404 1,7694 3,079464 3,130776 56,3281590 0,024148
6 54,30 47, 20 1,7348 1,6739 2,903882 2,801941 60,1402577 0,107555
7 49,30 55, 20 1,6928 1,7419 2,948688 3,034216 57,3987130 0,164274
Total 405, 20 384,30 12,3234 12,1587 21,40034 21,13553 403,391973 0,563493
In medie 57,88571 54,90 1,760486 1,736957 3,057191 3,019362 57,62742 0,080499

Intrăm în EXCEL prin programul „Start”. Introducem datele în tabel. În „Instrumente” - „Analiza datelor” - „Regresie” - OK

Dacă meniul „Tools” nu are linia „Data Analysis”, atunci acesta trebuie instalat prin „Tools” - „Settings” - „Data Analysis Package”

Prognoza cererii de produse pentru întreprinderi. Utilizare în SM Funcții Excel"Tendinţă"

A este cererea pentru produs. B - timp, zile


Nu. A
1 11 1
2 14 2
3 13 3
4 15 4
5 17 5
6 17,9
7 18,4 7

Pasul 1. Pregătirea datelor inițiale

Pasul 2. Extindeți axa timpului, setați-o la 6.7 înainte; Avem dreptul de a prezice 1/3 din date.

Pasul 3. Selectați intervalul A6: A7 pentru prognoza viitoare.

Pasul 4. Insert Function

Inserați diagrame grafice netede non-standard

gama y gata.


Dacă fiecare valoare ulterioară a axei noastre temporale diferă nu cu câteva procente, ci de mai multe ori, atunci trebuie să utilizați nu funcția „Trend”, ci funcția „Creștere”.


Bibliografie

1. Eliseeva „Econometrie”

2. Eliseeva „Atelier de econometrie”

3. Carlsberg „Excel pentru analize”


Aplicație


Mai multe ecuații, iar în fiecare ecuație - mai multe variabile. Problema estimării parametrilor unui astfel de model ramificat este rezolvată folosind metode complexe și fanteziste. Cu toate acestea, toate au același lucru baza teoretica. Prin urmare, pentru a ne face o idee inițială a conținutului metodelor econometrice, ne vom limita în paragrafele următoare la a lua în considerare regresia liniară simplă. ...

Că compararea clasamentelor (1) și (2) tocmai făcută nu a fost efectuată destul de strict. Este clar că în instrumentele econometrice ale unui specialist care efectuează cercetări de specialitate trebuie să existe un algoritm de reconciliere a clasamentelor obținute. diverse metode. Metoda de reconciliere a clasamentelor grupate Problema luată în considerare aici este extragerea unei ordine generale libere dintr-un set...

Se realizează prin substituirea în ecuația de regresie a valorilor variabilelor independente care determină condițiile pentru care se face prognoza. 2.2 Metode de planificare și prognoză a veniturilor bugetelor guvernamentale administrația locală Metodele de prognoză și planificare sunt exprimate în metode și tehnici de elaborare a documentelor și indicatorilor de prognoză și planificare în raport cu diferitele lor tipuri...

CONCLUZIA REZULTATELOR

Statistici de înregistrare

Plural R 0,947541801
R-pătrat 0,897835464
R-pătrat normalizat 0,829725774
Eroare standard 0,226013867
Observatii 6
Analiza variatiei

Semnificația F

Regresia 2 1,346753196 0,673376598 13,18219855 0,032655042
Rest 3 0,153246804 0,051082268
Total 5 1,5

Cote

Eroare standard

t-statistică

Valoarea P

De jos 95%

Top 95%

De jos 95%

Top 95%

Intersecția în Y 4,736816539 0,651468195 7,27098664 0,005368842 2,66355399 6,810079088 2,66355399 6,810079088
Variabila X1 0,333424008 0,220082134 1,51499807 0,227014505 -0,366975566 1,033823582 -0,366975566

Scop. Testarea ipotezei că două varianțe aparțin aceleiași populații generale și, prin urmare, egalitatea lor.

Ipoteza nulă. S 2 2 = S 1 2

Ipoteză alternativă. Există următoarele opțiuni pentru N A, în funcție de care diferă zonele critice:

1. S 1 2 > S 2 2 . Opțiunea cea mai frecvent utilizată este HA. Regiunea critică este coada superioară a distribuției F.

2. S 1 2< S 2 2 . Критическая область - нижний хвост F-распределения. Ввиду частого отсутствия нижнего хвоста, в таблицах критическую область обычно сводят к варианту 1, меняя местами дисперсии.

3. Face-verso S 1 2 ≠S 2 2. Combinația primelor două.

Cerințe preliminare. Datele sunt independente și distribuite normal. Ipoteza că varianțele a două populații normale sunt egale este acceptată dacă raportul dintre varianța mai mare și cea mai mică este mai mică decât valoarea critică a distribuției Fisher.

F P = S 1 2 / S 2 2

Notă. Cu metoda de verificare descrisă, valoarea lui Fpasch trebuie să fie neapărat mai mare decât unu. Criteriul este sensibil la încălcarea ipotezei de normalitate.

Pentru o alternativă cu două laturi S 1 2 ≠ S 2 2 ipoteza nulă este acceptată dacă este îndeplinită condiția:

F l - α /2< Fрасч < F α /2

Exemplu

Parametrii termofizici au fost determinați folosind o metodă termometrică complexă. caracteristicile (TFC) ale malțului verde. Pentru a pregăti probele, am luat malț uscat la aer (umiditate medie W=19%) și umed malț învechit de patru zile (W=45%) în conformitate cu tehnologie nouă realizarea de malț caramel. Experimentele au arătat că conductivitatea termică λ a malțului umed este de aproximativ 2,5 ori mai mare decât cea a malțului uscat, iar capacitatea termică volumetrică nu are o dependență clară de conținutul de umiditate al malțului. Prin urmare, folosind testul F, am verificat posibilitatea generalizării datelor pe baza valorilor medii fără a ține cont de umiditate

Datele calculate sunt rezumate în tabelul 5.1

Tabelul 5.1

Date pentru calcularea criteriului F

Valoare mai mare s-a obţinut varianţa pentru W=45%, adică. S245 = S12, S219 = S22 şi FP = S12/S22 = 1,35. Din Tabelul 5.2 pentru gradul de libertate f 1 =N 1 -1=5 f 2 =N 2 -1=4 la γ=0,95 determinăm F KR =6,2. Ipoteza nulă formulată ca „În intervalul de umiditate al malțului verde de la 19 la 45%, influența acestuia asupra capacității termice volumetrice poate fi neglijată” sau „S 2 45 = S 2 19 ” cu o probabilitate de încredere de 95% a fost confirmat, din moment ce Fp

Un exemplu de testare a unei ipoteze despre apartenența a două varianțe la aceeași populație folosind criteriul Fisher folosind Excel

Sunt prezentate date pentru două probe independente (Tabelul 5.2) ale gradului de absorbție a apei a boabelor de grâu.S-a realizat un studiu al efectelor câmpurilor magnetice de joasă frecvență.

Tabelul 5.2

Rezultatele cercetării

Număr Numărul eșantionului
experienţă 2 ,
0,027 0,075
0,036 0,4
0,1 0,08
0,12 0,105
0,32 0,075
0,45 0,12
0,049 0,06
0,105 0,075

Înainte de a testa ipoteza despre egalitatea mediilor acestor eșantioane, este necesar să testăm ipoteza despre egalitatea varianțelor pentru a ști ce criteriu să alegem pentru a o testa.

În fig. 5.1 prezintă un exemplu de testare a ipotezei că două varianțe aparțin aceleiași populații folosind criteriul Fisher folosind produsul software Microsoft Excel.

Figura 5.1 Exemplu de testare a apartenenței a două varianțe la o populație folosind criteriul Fisher

Datele sursă se află în celulele situate la intersecția coloanelor C și D cu rândurile 3-10. Să facem următoarele:

1. Să determinăm dacă legea de distribuție a primului și celui de-al doilea eșantion poate fi considerată normală (coloanele C și, respectiv, D). Dacă nu (pentru cel puțin o probă), atunci este necesar să folosim un test neparametric; dacă da, continuăm.

2. Calculați variațiile pentru prima și a doua coloană. Pentru a face acest lucru, în celulele SP și D11 plasăm funcțiile =DISP(SZ:C10) și respectiv =DISP(DЗ:D10). Rezultatul acestor funcții este valoarea varianței calculată pentru fiecare coloană, respectiv.

3. Găsiți valoarea calculată pentru criteriul Fisher. Pentru a face acest lucru, trebuie să împărțiți varianța mai mare la cea mai mică. În celula F13 plasăm formula =C11/D11, care realizează această operație.

4. Stabiliți dacă ipoteza egalității varianțelor poate fi acceptată. Există două metode, care sunt prezentate în exemplu. Conform primei metode, prin stabilirea unui nivel de semnificație, de exemplu 0,05, se calculează valoarea critică a distribuției Fisher pentru această valoare și numărul corespunzător de grade de libertate. În celula F14, introduceți funcția =FPACPOBP(0,05;7;7) (unde 0,05 este nivelul de semnificație specificat; 7 este numărul de grade de libertate ale numărătorului și 7 (al doilea) este numărul de grade de libertate ale numitorul). Numărul de grade de libertate este egal cu numărul de experimente minus unu. Rezultatul este 3,787051. Deoarece această valoare este mai mare decât valoarea calculată de 1,81144, trebuie să acceptăm ipoteza nulă a egalității varianțelor.

Conform celei de-a doua opțiuni, probabilitatea corespunzătoare este calculată pentru valoarea calculată obținută a criteriului Fisher. Pentru a face acest lucru, introduceți funcția =FPACP(F13,7,7) în celula F15. Deoarece valoarea rezultată de 0,22566 este mai mare decât 0,05, se acceptă ipoteza egalității varianțelor.

Acest lucru se poate face printr-o funcție specială. Selectați secvențial elementele de meniu Serviciu , Analiza datelor . Va apărea următoarea fereastră (Fig. 5.2).

Figura 5.2 Fereastra de selectare a metodei de procesare

În această fereastră selectați „ F-mecm cu două mostre pentru variații " Ca rezultat, va apărea o fereastră așa cum se arată în Fig. 5.3. Aici setați intervalele (numerele de celule) ale primei și celei de-a doua variabile, nivelul de semnificație (alfa) și locul în care va fi localizat rezultatul.

Setați toți parametrii necesari și faceți clic pe OK. Rezultatul lucrării este prezentat în Fig. 5.4

Trebuie remarcat faptul că funcția testează un criteriu unilateral și o face corect. Pentru cazul în care valoarea criteriului este mai mare decât 1, se calculează valoarea critică superioară.

Figura 5.3 Fereastra de setare a parametrilor

Când valoarea criteriului este mai mică de 1, se calculează valoarea critică inferioară.

Reamintim că ipoteza egalității varianțelor este respinsă dacă valoarea criteriului este mai mare decât valoarea critică superioară sau mai mică decât cea inferioară.

Figura 5.4 Testarea egalității varianțelor