Regresia în Excel explicată. Analiza corelației în Excel. Activați pachetul de analiză

În opinia mea, ca student, econometria este una dintre cele mai aplicate științe cu care am putut să mă familiarizez între zidurile universității mele. Cu ajutorul acestuia, este într-adevăr posibil să se rezolve probleme aplicate la scară întreprindere. Cât de eficiente vor fi aceste decizii este a treia întrebare. Ideea este că majoritatea cunoștințelor vor rămâne teorie, dar econometria și analiza regresieiÎncă merită studiat cu o atenție deosebită.

Ce explică regresia?

Înainte de a începe să luăm în considerare funcțiile MS Excel care ne permit să rezolvăm aceste probleme, aș dori să vă explic în detaliu ce presupune, în esență, analiza regresiei. Acest lucru vă va face mai ușor să promovați examenul și, cel mai important, va fi mai interesant să studiați materia.

Sper că sunteți familiarizat cu conceptul de funcție din matematică. O funcție este relația dintre două variabile. Când o variabilă se schimbă, ceva i se întâmplă alteia. Schimbăm X și Y se schimbă în consecință. Funcțiile descriu diverse legi. Cunoscând funcția, putem înlocui valorile arbitrare ale lui X și vedem cum se modifică Y.

Are mare importanță, deoarece regresia este o încercare de a explica, la prima vedere, procesele nesistematice și haotice folosind o anumită funcție. De exemplu, este posibil să se identifice relația dintre cursul de schimb al dolarului și șomajul în Rusia.

Dacă acest model poate fi descoperit, atunci folosind funcția pe care am obținut-o în timpul calculelor, vom putea face o prognoză a ratei șomajului la cursul de schimb al al-lea dolar față de rublă.
Această relație se va numi corelație. Analiza de regresie presupune calcularea unui coeficient de corelație care să explice relația strânsă dintre variabilele pe care le luăm în considerare (cursul de schimb al dolarului și numărul de locuri de muncă).

Acest coeficient poate fi pozitiv sau negativ. Valorile sale variază de la -1 la 1. În consecință, putem observa o corelație negativă sau pozitivă ridicată. Dacă este pozitivă, atunci creșterea cursului dolarului va fi urmată de crearea de noi locuri de muncă. Dacă este negativă, înseamnă că o creștere a cursului de schimb va fi urmată de o scădere a locurilor de muncă.

Există mai multe tipuri de regresie. Poate fi liniar, parabolic, de putere, exponențial etc. Alegem un model în funcție de care regresie va corespunde în mod specific cazului nostru, care model va fi cât mai aproape de corelația noastră. Să ne uităm la asta folosind un exemplu de problemă și să o rezolvăm în MS Excel.

Regresia liniară în MS Excel

Pentru a rezolva probleme de regresie liniară, veți avea nevoie de funcționalitatea de analiză a datelor. Este posibil să nu fie activat pentru dvs., așa că trebuie să îl activați.

  • Faceți clic pe butonul „Fișier”;
  • Selectați elementul „Opțiuni”;
  • Faceți clic pe penultima filă „Suplimente” din partea stângă;



  • Mai jos vom vedea inscripția „Management” și butonul „Go”. Apasa pe el;
  • Bifați caseta pentru „Pachet de analiză”;
  • Faceți clic pe „ok”.



Exemplu de sarcină

Funcția de analiză a lotului este activată. Să rezolvăm următoarea problemă. Avem un eșantion de date de câțiva ani privind numărul de situații de urgență pe teritoriul întreprinderii și numărul de lucrători angajați. Trebuie să identificăm relația dintre aceste două variabile. Există o variabilă explicativă X - acesta este numărul de lucrători și o variabilă explicativă - Y - acesta este numărul de incidente de urgență. Să distribuim datele sursă în două coloane.

Să mergem la fila „date” și să selectăm „Analiza datelor”

În lista care apare, selectați „Regresie”. Selectăm valorile corespunzătoare în intervalele de intrare Y și X.

Faceți clic pe „Ok”. Analiza este finalizată, iar rezultatele vom vedea într-o nouă fișă.

Cele mai semnificative valori pentru noi sunt marcate în figura de mai jos.

Multiplu R este coeficientul de determinare. Are o formulă de calcul complexă și arată cât de mult poți avea încredere în coeficientul nostru de corelație. În consecință, cu cât această valoare este mai mare, cu atât mai multă încredere, cu atât modelul nostru în ansamblu este mai de succes.

Y-Intercept și X1-Intercept sunt coeficienții noștri de regresie. După cum am menționat deja, regresia este o funcție și are anumiți coeficienți. Astfel, funcția noastră va arăta astfel: Y = 0,64*X-2,84.

Ce ne oferă asta? Acest lucru ne oferă posibilitatea de a face o prognoză. Să presupunem că vrem să angajăm 25 de lucrători pentru o întreprindere și trebuie să ne imaginăm aproximativ care va fi numărul de incidente de urgență. Îl înlocuim în funcția noastră valoare datăși obținem rezultatul Y = 0,64 * 25 – 2,84. Vom avea aproximativ 13 urgențe.

Să vedem cum funcționează. Aruncă o privire la poza de mai jos. Valorile reale pentru angajații implicați sunt înlocuite în funcția pe care am primit-o. Vedeți cât de aproape sunt valorile de jucătorii adevărați.

De asemenea, puteți construi un câmp de corelare selectând zona Y și X, făcând clic pe fila „inserați” și selectând graficul de dispersie.

Punctele sunt împrăștiate, dar în general se deplasează în sus, ca și cum ar fi o linie dreaptă în mijloc. De asemenea, puteți adăuga această linie accesând fila „Layout” din MS Excel și selectând „Trend Line”

Faceți dublu clic pe linia care apare și veți vedea ce s-a menționat mai devreme. Puteți schimba tipul de regresie în funcție de cum arată câmpul de corelare.

S-ar putea să simți că punctele desenează mai degrabă o parabolă decât o linie dreaptă și că ar fi mai bine să alegi un alt tip de regresie.


Concluzie

Sperăm că acest articol v-a oferit o înțelegere mai bună a ce este analiza de regresie și de ce este necesară. Toate acestea au o mare importanță practică.

Acesta este cel mai comun mod de a arăta dependența unei variabile de altele, de exemplu, cum se întâmplă nivelul PIB-ului de la dimensiune investitii straine sau din Rata creditului de la Banca Nationala sau din prețurile pentru resursele energetice cheie.

Modelarea vă permite să arătați magnitudinea acestei dependențe (coeficienți), datorită cărora puteți face direct o prognoză și puteți efectua un fel de planificare pe baza acestor previziuni. De asemenea, pe baza analizei de regresie, este posibil să se ia decizii de management menite să stimuleze cauzele prioritare care afectează rezultat final, modelul în sine va ajuta la evidențierea acestor factori prioritari.

Vedere generală a modelului de regresie liniară:

Y=a 0 +a 1 x 1 +...+a k x k

Unde A - parametrii de regresie (coeficienți), X - factori care influențează, k - numărul de factori de model.

Datele inițiale

Dintre datele inițiale, avem nevoie de un anumit set de date care ar reprezenta mai multe valori consecutive sau interconectate ale parametrului final Y (de exemplu, PIB) și același număr de valori ale indicatorilor a căror influență o studiem ( de exemplu, investiţii străine).

Figura de mai sus prezintă un tabel cu aceleași date inițiale Y este un indicator al populației economic active, iar numărul de întreprinderi, valoarea investiției în capital și venitul gospodăriei sunt factori de influență, adică X.

Pe baza figurii, se poate ajunge și la o concluzie eronată că modelarea poate fi doar despre serii de timp, adică serii de momente înregistrate secvenţial în timp, dar nu este așa cu același succes, se poate modela în contextul a structura, de exemplu, valorile indicate în tabel pot fi defalcate nu pe an, ci pe regiune.

Pentru a construi adecvat modele liniare Este de dorit ca datele sursă să nu aibă scăderi sau prăbușiri puternice în astfel de cazuri, este recomandabil să se efectueze netezire, dar vom vorbi despre netezire data viitoare.

Pachet de analize

Parametrii unui model de regresie liniară pot fi, de asemenea, calculați manual utilizând Metoda celor mai mici pătrate obișnuite (OLS), dar acest lucru necesită destul de mult timp. Acest lucru poate fi calculat puțin mai rapid folosind aceeași metodă folosind formule în Excel, unde programul însuși va face calculele, dar va trebui totuși să introduceți formulele manual.

Excel are un program de completare Pachet de analize care este frumos Unealtă puternică pentru a ajuta analistul. Acest set de instrumente, printre altele, poate calcula parametrii de regresie folosind aceeași metodă a celor mai mici pătrate, în doar câteva clicuri.

Activați pachetul de analiză

În mod implicit, acest supliment este dezactivat și nu îl veți găsi în meniul file, așa că vom arunca o privire pas cu pas asupra modului de activare.

În Excel, în stânga sus, activează fila Fişier, în meniul care se deschide, căutați articolul Opțiuniși faceți clic pe el.

În fereastra care se deschide, în stânga, căutați articolul Suplimenteși activează-l, în această filă din partea de jos va apărea o listă de control drop-down, unde implicit va fi scris Suplimente Excel , va exista un buton în partea dreaptă a listei derulante Merge, trebuie să faceți clic pe el.

O fereastră pop-up vă va solicita să selectați suplimentele disponibile în ea, trebuie să bifați caseta Pachet de analizeși, în același timp, pentru orice eventualitate, Găsirea unei soluții(de asemenea, un lucru util), apoi confirmați alegerea făcând clic pe butonul Bine.

Instrucțiuni pentru găsirea parametrilor de regresie liniară folosind pachetul de analiză

După activarea suplimentului Analysis Pack, acesta va fi întotdeauna disponibil în fila meniului principal Date sub link Analiza datelor

În fereastra instrumentului activ Analiza datelor din lista de posibilități pe care le căutăm și le selectăm Regresia

În continuare, se va deschide o fereastră pentru configurarea și selectarea datelor sursă pentru calcularea parametrilor modelului de regresie. Aici trebuie să indicați intervalele datelor inițiale, și anume parametrul care este descris (Y) și factorii care îl influențează (X), așa cum se arată în figura de mai jos, parametrii rămași, în principiu, sunt opționali de configurat;

După ce ați selectat datele sursă și ați făcut clic pe butonul OK, Excel produce calcule pe o nouă foaie a registrului de lucru activ (cu excepția cazului în care a fost setat altfel în setări), aceste calcule arată astfel:

Celulele cheie umplute galben Acestea sunt la care trebuie să fii atenți în primul rând și ceilalți parametri sunt importanți, dar ai lor analiză detaliată Poate necesită o postare separată.

Asa de, 0,865 - Acest R 2- coeficient de determinare, care arată că 86,5% din parametrii calculați ai modelului, adică modelul în sine, explică dependența și modificările parametrului studiat - Y din factorii studiați - lui X. Dacă este exagerat, atunci acesta este un indicator al calității modeluluiși cu cât este mai sus, cu atât mai bine. Este clar că nu poate fi mai mare de 1 și este considerat bun atunci când R 2 este peste 0,8, iar dacă este mai mic de 0,5, atunci caracterul rezonabil al unui astfel de model poate fi pus la îndoială în siguranță.

Acum să trecem la coeficienții modelului:
2079,85 - Acest un 0- un coeficient care arată ce va fi Y dacă toți factorii utilizați în model sunt egali cu 0, se înțelege că aceasta este o dependență de alți factori nedescriși în model;
-0,0056 - a 1- un coeficient care arată ponderea influenței factorului x 1 asupra lui Y, adică numărul de întreprinderi din cadrul unui model dat afectează indicatorul populației economic active cu o pondere de numai -0,0056 (un grad destul de mic de influență ). Semnul minus arată că această influență este negativă, adică cu cât sunt mai multe întreprinderi, cu atât mai puțină populație activă economic, oricât de paradoxal ar fi acest sens;
-0,0026 - a 2- coeficientul de influență a volumului investiției în capital asupra mărimii populației economic active conform modelului, această influență este și ea negativă;
0,0028 - a 3- coeficientul de influență a venitului populației asupra mărimii populației active economic, aici influența este pozitivă, adică conform modelului, o creștere a venitului va contribui la creșterea dimensiunii populației economic active.

Să colectăm coeficienții calculați în model:

Y = 2079,85 - 0,0056x 1 - 0,0026x 2 + 0,0028x 3

De fapt, aceasta este liniară model de regresie, care pentru datele sursă utilizate în exemplu arată exact așa.

Estimări și prognoze model

După cum am discutat deja mai sus, modelul este construit nu numai pentru a arăta amploarea dependenței parametrului studiat de factorii de influență, ci și astfel încât, cunoscând acești factori de influență, să fie posibilă realizarea unei prognoze. Efectuarea acestei prognoze este destul de simplă, trebuie doar să înlocuiți valorile factorilor de influență în locul X-urilor corespunzătoare în ecuația modelului rezultat. În figura de mai jos, aceste calcule sunt făcute în Excel într-o coloană separată.

Valori reale (cele care au avut loc în realitate) și valori calculate conform modelului din aceeași figură sunt afișate sub formă de grafice pentru a arăta diferența și, prin urmare, eroarea modelului.

Repet încă o dată, pentru a face o prognoză folosind un model trebuie să existe factori de influență cunoscuți, și dacă despre care vorbim despre o serie temporală și, în consecință, o prognoză pentru viitor, de exemplu, pentru anul sau luna următoare, nu este întotdeauna posibil să aflăm care vor fi factorii de influență în acest viitor. În astfel de cazuri, este de asemenea necesar să se facă o prognoză pentru factorii de influență, cel mai adesea aceasta se face folosind un model autoregresiv - un model în care factorii de influență sunt obiectul studiat și timpul, adică dependența indicatorului; după ceea ce a fost în trecut este modelat.

Ne vom uita la modul de construire a unui model autoregresiv în articolul următor, dar acum să presupunem că știm care vor fi valorile factorilor de influență în perioada viitoare (în exemplu, 2008), și prin înlocuirea acestor valori în calcule vom primi prognoza noastră pentru 2008.

28 oct

Bună ziua, dragi cititori de blog! Astăzi vom vorbi despre regresiile neliniare. Soluţie regresii liniare poate fi vizualizat prin LINK.

Aceasta metoda utilizat în principal în modelarea și prognoza economică. Scopul său este de a observa și identifica dependențe între doi indicatori.

Principalele tipuri de regresii neliniare sunt:

  • polinom (patratic, cubic);
  • hiperbolic;
  • potolit;
  • demonstrativ;
  • logaritmică

Poate fi folosit și diverse combinatii. De exemplu, pentru analiza serii temporale în sectorul bancar, asigurările și studiile demografice folosesc curba Gompzer, care este un tip de regresie logaritmică.

În prognoza folosind regresii neliniare, principalul lucru este să aflăm coeficientul de corelație, care ne va arăta dacă există sau nu o relație strânsă între doi parametri. De regulă, dacă coeficientul de corelație este aproape de 1, atunci există o conexiune, iar prognoza va fi destul de precisă. Un alt element important al regresiilor neliniare este eroarea relativă medie ( A ), dacă este în interval<8…10%, значит модель достаточно точна.

Aici probabil vom termina blocul teoretic și vom trece la calcule practice.

Avem un tabel de vânzări de mașini pe o perioadă de 15 ani (să-l notăm X), numărul de pași de măsurare va fi argumentul n, avem și venituri pentru aceste perioade (să-l notăm Y), trebuie să prezicem ce veniturile vor fi în viitor. Să construim următorul tabel:

Pentru studiu, va trebui să rezolvăm ecuația (dependența lui Y de X): y=ax 2 +bx+c+e. Aceasta este o regresie pătratică pe perechi. În acest caz, aplicăm metoda celor mai mici pătrate pentru a afla argumentele necunoscute - a, b, c. Va conduce la un sistem de ecuații algebrice de forma:

Pentru a rezolva acest sistem, vom folosi, de exemplu, metoda lui Cramer. Vedem că sumele incluse în sistem sunt coeficienți pentru necunoscute. Pentru a le calcula, vom adăuga mai multe coloane la tabel (D,E,F,G,H) și vom semna după semnificația calculelor - în coloana D vom pătrat x, în E îl vom cuba, în F vom înmulți exponenții x și y, în H pătratăm x și înmulțim cu y.

Veți obține un tabel cu formularul completat cu lucrurile necesare pentru a rezolva ecuația.

Să formăm o matrice A sistem format din coeficienți pentru necunoscute din partea stângă a ecuațiilor. Să o plasăm în celula A22 și să o numim „ A=". Urmăm sistemul de ecuații pe care l-am ales pentru a rezolva regresia.

Adică, în celula B21 trebuie să plasăm suma coloanei în care am ridicat indicatorul X la a patra putere - F17. Să ne referim doar la celulă - „=F17”. În continuare, avem nevoie de suma coloanei în care a fost cubit X - E17, apoi mergem strict conform sistemului. Astfel, va trebui să completăm întreaga matrice.

În conformitate cu algoritmul lui Cramer, vom tasta o matrice A1, asemănătoare cu A, în care, în locul elementelor primei coloane, ar trebui să fie plasate elementele din partea dreaptă a ecuațiilor sistemului. Adică, suma coloanei X la pătrat înmulțită cu Y, suma coloanei XY și suma coloanei Y.

De asemenea, vom avea nevoie de încă două matrice - să le numim A2 și A3 în care a doua și a treia coloană vor consta din coeficienții părților din dreapta ale ecuațiilor. Poza va fi așa.

Urmând algoritmul ales, va trebui să calculăm valorile determinanților (determinanții, D) ai matricelor rezultate. Să folosim formula MOPRED. Vom plasa rezultatele în celulele J21:K24.

Vom calcula coeficienții ecuației conform lui Cramer în celulele opuse determinanților corespunzători folosind formula: A(în celula M22) - „=K22/K21”; b(în celula M23) - „=K23/K21”; Cu(în celula M24) - „=K24/K21”.

Obținem ecuația dorită de regresie pătratică pereche:

y=-0,074x 2 +2,151x+6,523

Să evaluăm gradul de apropiere a relației liniare folosind indicele de corelație.

Pentru a calcula, adăugați o coloană J suplimentară la tabel (să o numim y*). Calculul va fi după cum urmează (conform ecuației de regresie pe care am obținut-o) - „=$m$22*B2*B2+$M$23*B2+$M$24.” Să-l plasăm în celula J2. Tot ce rămâne este să trageți marcatorul de completare automată în jos în celula J16.

Pentru a calcula sumele (media Y-Y) 2, adăugați coloanele K și L la tabelul cu formulele corespunzătoare. Calculăm media pentru coloana Y folosind funcția MEDIE.

În celula K25 vom plasa formula de calcul a indicelui de corelație - „=ROOT(1-(K17/L17))”.

Vedem că valoarea de 0,959 este foarte aproape de 1, ceea ce înseamnă că există o relație neliniară strânsă între vânzări și ani.

Rămâne de evaluat calitatea potrivirii ecuației de regresie pătratică rezultată (indice de determinare). Se calculează folosind formula pentru indicele de corelație pătrat. Adică, formula din celula K26 va fi foarte simplă - „=K25*K25”.

Coeficientul de 0,920 este aproape de 1, ceea ce indică o calitate înaltă a potrivirii.

Ultimul pas este calcularea erorii relative. Să adăugăm o coloană și să introducem formula acolo: „=ABS((C2-J2)/C2), ABS - modul, valoare absolută. Trageți markerul în jos și în celula M18 afișați valoarea medie (MEDIA), atribuiți formatul procentual celulelor. Rezultatul obtinut - 7,79% se incadreaza in valorile de eroare acceptabile<8…10%. Значит вычисления достаточно точны.

Dacă este nevoie, putem construi un grafic folosind valorile obținute.

Un exemplu de fișier este atașat - LINK!

Categorii:// din 28.10.2017

Analiza regresiei este una dintre cele mai populare metode de cercetare statistică. Poate fi folosit pentru a stabili gradul de influență al variabilelor independente asupra variabilei dependente. Microsoft Excel are instrumente concepute pentru a efectua acest tip de analiză. Să vedem ce sunt și cum să le folosim.

Dar, pentru a utiliza funcția care vă permite să efectuați o analiză de regresie, trebuie mai întâi să activați Pachetul de analiză. Abia atunci instrumentele necesare pentru această procedură vor apărea pe panglica Excel.


Acum, când mergem la filă "Date", pe panglica din cutia de instrumente "Analiză" vom vedea un buton nou - "Analiza datelor".

Tipuri de analiză de regresie

Există mai multe tipuri de regresii:

  • parabolic;
  • potolit;
  • logaritmică;
  • exponențial;
  • demonstrativ;
  • hiperbolic;
  • regresie liniara.

Vom vorbi mai detaliat despre efectuarea ultimului tip de analiză de regresie în Excel mai jos.

Regresia liniară în Excel

Mai jos, de exemplu, este un tabel care arată temperatura medie zilnică a aerului exterior și numărul de clienți ai magazinului pentru ziua lucrătoare corespunzătoare. Să aflăm folosind analiza de regresie exact cum condițiile meteorologice sub forma temperaturii aerului pot afecta prezența unei unități de vânzare cu amănuntul.

Ecuația generală de regresie liniară este următoarea: Y = a0 + a1x1 +…+ akhk. În această formulă Yînseamnă o variabilă, influența factorilor asupra cărora încercăm să studiem. În cazul nostru, acesta este numărul de cumpărători. Sens X sunt diferiții factori care influențează o variabilă. Opțiuni A sunt coeficienți de regresie. Adică ei sunt cei care determină semnificația unui anumit factor. Index k denotă numărul total al acelorași factori.


Analiza rezultatelor analizei

Rezultatele analizei de regresie sunt afișate sub formă de tabel în locul specificat în setări.

Unul dintre principalii indicatori este R-pătrat. Indică calitatea modelului. În cazul nostru, acest coeficient este de 0,705 sau aproximativ 70,5%. Acesta este un nivel acceptabil de calitate. Dependența mai mică de 0,5 este rea.

Un alt indicator important este situat în celula de la intersecția liniei „Intersecția în Y” si coloana "Cote". Aceasta indică ce valoare va avea Y și, în cazul nostru, acesta este numărul de cumpărători, cu toți ceilalți factori egali cu zero. În acest tabel, această valoare este 58,04.

Valoare la intersecția graficului „Variabila X1”Și "Cote" arată nivelul de dependență al lui Y față de X. În cazul nostru, acesta este nivelul de dependență a numărului de clienți din magazin față de temperatură. Un coeficient de 1,31 este considerat un indicator de influență destul de ridicat.

După cum puteți vedea, folosind Microsoft Excel este destul de ușor să creați un tabel de analiză de regresie. Dar numai o persoană instruită poate lucra cu datele de ieșire și poate înțelege esența acestora.

Analiza de regresie și corelație sunt metode de cercetare statistică. Acestea sunt cele mai comune modalități de a arăta dependența unui parametru de una sau mai multe variabile independente.

Mai jos, folosind exemple practice specifice, vom lua în considerare aceste două analize foarte populare în rândul economiștilor. Vom da, de asemenea, un exemplu de obținere a rezultatelor atunci când le combinăm.

Analiza de regresie în Excel

Arată influența unor valori (independente, independente) asupra variabilei dependente. De exemplu, cum depinde numărul populației active din punct de vedere economic de numărul de întreprinderi, salarii și alți parametri. Sau: cum afectează investițiile străine, prețurile la energie etc. nivelul PIB-ului.

Rezultatul analizei vă permite să evidențiați prioritățile. Și pe baza factorilor principali, anticipați, planificați dezvoltarea zonelor prioritare și luați decizii de management.

Are loc regresia:

  • liniară (y = a + bx);
  • parabolic (y = a + bx + cx 2);
  • exponențial (y = a * exp(bx));
  • putere (y = a*x^b);
  • hiperbolic (y = b/x + a);
  • logaritmică (y = b * 1n(x) + a);
  • exponențial (y = a * b^x).

Să ne uităm la un exemplu de construire a unui model de regresie în Excel și de interpretare a rezultatelor. Să luăm tipul liniar de regresie.

Sarcină. La 6 întreprinderi au fost analizate salariul mediu lunar și numărul de angajați care au demisionat. Este necesar să se determine dependența numărului de angajați care renunță la salariul mediu.

Modelul de regresie liniară arată astfel:

Y = a 0 + a 1 x 1 +…+a k x k.

Unde a sunt coeficienți de regresie, x sunt variabile de influență, k este numărul de factori.

În exemplul nostru, Y este indicatorul renunțării angajaților. Factorul de influență este salariul (x).

Excel are funcții încorporate care vă pot ajuta să calculați parametrii unui model de regresie liniară. Dar suplimentul „Pachet de analiză” va face acest lucru mai repede.

Activăm un instrument analitic puternic:

Odată activat, suplimentul va fi disponibil în fila Date.

Acum să facem însăși analiza de regresie.



În primul rând, acordăm atenție R-pătratului și coeficienților.

R-pătrat este coeficientul de determinare. În exemplul nostru – 0,755 sau 75,5%. Aceasta înseamnă că parametrii calculați ai modelului explică 75,5% din relația dintre parametrii studiați. Cu cât coeficientul de determinare este mai mare, cu atât modelul este mai bun. Bun - peste 0,8. Proastă – mai mică de 0,5 (o astfel de analiză nu poate fi considerată rezonabilă). În exemplul nostru – „nu e rău”.

Coeficientul 64,1428 arată ce va fi Y dacă toate variabilele din modelul luat în considerare sunt egale cu 0. Adică valoarea parametrului analizat este influențată și de alți factori nedescriși în model.

Coeficientul -0,16285 arată ponderea variabilei X pe Y. Adică salariul mediu lunar în cadrul acestui model afectează numărul de renunțați cu o pondere de -0,16285 (acesta este un grad mic de influență). Semnul „-” indică un impact negativ: cu cât salariul este mai mare, cu atât mai puține persoane renunță. Ceea ce este corect.



Analiza corelației în Excel

Analiza corelației ajută la determinarea dacă există o relație între indicatorii din unul sau două eșantioane. De exemplu, între timpul de funcționare al unei mașini și costul reparațiilor, prețul echipamentului și durata de funcționare, înălțimea și greutatea copiilor etc.

Dacă există o conexiune, atunci o creștere a unui parametru duce la o creștere (corelație pozitivă) sau o scădere (negativă) a celuilalt. Analiza corelației ajută analistul să determine dacă valoarea unui indicator poate fi utilizată pentru a prezice valoarea posibilă a altuia.

Coeficientul de corelație se notează cu r. Variază de la +1 la -1. Clasificarea corelațiilor pentru diferite zone va fi diferită. Când coeficientul este 0, nu există o relație liniară între probe.

Să vedem cum să găsim coeficientul de corelație folosind Excel.

Pentru a găsi coeficienți perechi, este utilizată funcția CORREL.

Obiectiv: Determinați dacă există o relație între timpul de funcționare al unui strung și costul întreținerii acestuia.

Plasați cursorul în orice celulă și apăsați butonul fx.

  1. În categoria „Statistică”, selectați funcția CORREL.
  2. Argumentul „Matrice 1” - primul interval de valori – timpul de funcționare al mașinii: A2:A14.
  3. Argumentul „Matrice 2” - al doilea interval de valori – costul reparației: B2:B14. Faceți clic pe OK.

Pentru a determina tipul de conexiune, trebuie să vă uitați la numărul absolut al coeficientului (fiecare domeniu de activitate are propria sa scară).

Pentru analiza corelației mai multor parametri (mai mult de 2), este mai convenabil să utilizați „Analiza datelor” (suplimentul „Pachet de analiză”). Trebuie să selectați corelația din listă și să desemnați matricea. Toate.

Coeficienții rezultați vor fi afișați în matricea de corelație. Ca aceasta:

Analiza corelației și regresiei

În practică, aceste două tehnici sunt adesea folosite împreună.

Exemplu:


Acum datele analizei de regresie au devenit vizibile.