Kiểm tra các giả thuyết đơn giản bằng phép kiểm tra chi bình phương Pearson trong MS EXCEL. Tiêu chí Pearson. Kiểm định giả thuyết phân phối chuẩn

Phòng thí nghiệm số 6. Kiểm tra giả thuyết về phân phối chuẩn của mẫu bằng tiêu chí Pearson.

Công việc trong phòng thí nghiệm được thực hiện trong Excel 2007.

Mục đích của công việc là cung cấp các kỹ năng xử lý dữ liệu sơ cấp, xây dựng biểu đồ, lựa chọn luật phân phối phù hợp và tính toán các tham số của nó, kiểm tra sự phù hợp giữa luật phân phối thực nghiệm và giả thuyết bằng bài kiểm tra chi bình phương Pearson bằng Excel.

1. Hình thành mẫu phân phối chuẩn Số ngẫu nhiên Với giá trị đã cho kỳ vọng toán học và độ lệch chuẩn.

Dữ liệu → Phân tích dữ liệu → Tạo số ngẫu nhiên → OK.

Cơm. 1. Hộp thoại Phân tích dữ liệu

Trong cửa sổ hiện ra Tạo số ngẫu nhiênđi vào:

Số lượng biến: 1 ;

Số lượng số ngẫu nhiên: 100 ;

Phân bổ: Bình thường.

Tùy chọn:

Trung bình = 15 (gia trị được ki vọng);

Độ lệch chuẩn = 2 (độ lệch chuẩn);

Phân tán ngẫu nhiên: đừng điền vào(hoặc điền theo hướng dẫn của giáo viên);

Khoảng đầu ra: địa chỉ của ô đầu tiên của cột mảng số ngẫu nhiên - $ MỘT$1 . ĐƯỢC RỒI.

Cơm. 2. Hộp thoại Tạo số ngẫu nhiên với các trường đầu vào đầy

Là kết quả của hoạt động Tạo số ngẫu nhiên một cột sẽ xuất hiện $ MỘT$1: $A$100 chứa 100 số ngẫu nhiên.

Cơm. 3. Đoạn trang tính Excel gồm một số số ngẫu nhiên đầu tiên $A$1: $A$100.

2. Xác định thông số lấy mẫu, thống kê mô tả

Từ menu chính của Excel, chọn: Dữ liệu → Phân tích dữ liệu → Thống kê mô tả → OK.

Trong cửa sổ hiện ra Thống kê mô tảđi vào:

Khoảng đầu vào– 100 số ngẫu nhiên trong ô $ MỘT$1: $ MỘT$100 ;

Nhóm- theo cột;

Khoảng đầu ra– địa chỉ của ô nơi bảng bắt đầu Thống kê mô tả - $C$1 ;

Thống kê tóm tắt- đánh dấu. ĐƯỢC RỒI.

Cơm. 4. Hộp thoại Thống kê mô tả với các trường đầu vào đã hoàn thành.

Một bảng sẽ xuất hiện trên bảng Excel - Cột 1

Cơm. 5. Bảng Cột 1 với dữ liệu thủ tục Thống kê mô tả.

Bảng chứa số liệu thống kê mô tả, cụ thể:

Trung bình– ước tính kỳ vọng toán học;

Độ lệch chuẩn- ước tính độ lệch chuẩn;

Thặng dưBất đối xứng– ước tính độ nhọn và sự bất đối xứng.

Sự bằng nhau gần đúng của các ước tính độ nhọn và độ lệch bằng 0, và sự bằng nhau gần đúng của ước tính trung bình với ước tính trung bình cung cấp cơ sở sơ bộ cho việc lựa chọnH 0 sự phân bố các thành phần của dân số nói chung là một quy luật bình thường.

Khoảng thời gian- phạm vi mẫu;

tối thiểugiá trị tối thiểu biến ngẫu nhiên trong mẫu;

Tối đa– giá trị lớn nhất của biến ngẫu nhiên trong mẫu.

Trong một tế bào F15 - độ dài của khoảng thời gian một phần h, được tính như sau:

Số khoảng thời gian nhóm k trong Excel nó được tính toán tự động bằng công thức

trong đó dấu ngoặc đơn có nghĩa là làm tròn xuống phần nguyên của số.

Trong biến thể đang được xem xét N = 100 , kể từ đây, k = 11 . Thật sự:

Công thức này được nhập vào ô F15: =($D$13-$D$12)/10

Kết quả của thủ tục Thống kê mô tả sẽ được yêu cầu sau này khi xây dựng luật phân phối lý thuyết.

CÔNG VIỆC PHÒNG THÍ NGHIỆM

PHÂN TÍCH TƯƠNG QUAN TRONGXUẤT SẮC

1.1 Phân tích tương quan trong MS Excel

Phân tích tương quan bao gồm việc xác định mức độ liên kết giữa hai biến ngẫu nhiên X và Y. Hệ số tương quan được sử dụng làm thước đo cho mối liên hệ đó. Hệ số tương quan được ước tính từ mẫu gồm n cặp quan sát liên quan (x i, y i) từ quần thể chung của X và Y. Để đánh giá mức độ liên hệ giữa các giá trị của X và Y, được đo bằng thang định lượng, nó Được sử dụng hệ số tương quan tuyến tính(hệ số Pearson), giả định rằng các mẫu X và Y có phân phối chuẩn.

Hệ số tương quan thay đổi từ -1 (mối quan hệ tuyến tính nghịch đảo chặt chẽ) đến 1 (mối quan hệ tỷ lệ thuận chặt chẽ). Khi được đặt thành 0, không có mối quan hệ tuyến tính giữa hai mẫu.

Phân loại chung các mối tương quan (theo Ivanter E.V., Korosov A.V., 1992):

Có một số loại hệ số tương quan, tùy thuộc vào các biến X và Y, có thể được đo lường trên các thang đo khác nhau. Chính thực tế này quyết định việc lựa chọn hệ số tương quan thích hợp (xem Bảng 13):

Trong MS Excel, một hàm đặc biệt được sử dụng để tính hệ số tương quan tuyến tính cặp CORREL (mảng1; mảng2),

đối tượng

trong đó mảng1 là tham chiếu đến phạm vi ô của vùng chọn đầu tiên (X);

Ví dụ 1: 10 học sinh được làm bài kiểm tra về tư duy hình ảnh và lời nói. Thời gian trung bình để giải các bài kiểm tra được tính bằng giây. Nhà nghiên cứu quan tâm đến câu hỏi: liệu có mối liên hệ nào giữa thời gian cần thiết để giải quyết những vấn đề này không? Biến X biểu thị thời gian trung bình để giải các bài kiểm tra bằng hình ảnh và biến Y biểu thị thời gian trung bình để giải các bài kiểm tra bằng lời nói.

R giải pháp:Để xác định mức độ quan hệ, trước hết cần nhập số liệu vào bảng MS Excel (xem bảng, Hình 1). Sau đó giá trị của hệ số tương quan được tính toán. Để thực hiện việc này, hãy đặt con trỏ vào ô C1. Trên thanh công cụ, nhấp vào nút Insert Function (fx).

Trong hộp thoại Trình hướng dẫn Tính năng xuất hiện, hãy chọn một danh mục Thống kê và chức năng CORREL, rồi bấm OK. Sử dụng con trỏ chuột, nhập phạm vi dữ liệu mẫu X vào trường array1 (A1:A10). Trong trường array2, nhập phạm vi dữ liệu mẫu Y (B1:B10). Bấm vào đồng ý. Trong ô C1, giá trị của hệ số tương quan sẽ xuất hiện - 0,54119. Tiếp theo, bạn cần xem xét số tuyệt đối của hệ số tương quan và xác định loại kết nối (gần, yếu, trung bình, v.v.)

Cơm. 1. Kết quả tính hệ số tương quan

Như vậy, mối liên hệ giữa thời gian giải bài kiểm tra bằng hình ảnh và lời nói chưa được chứng minh.

Bài tập 1. Dữ liệu có sẵn cho 20 cơ sở nông nghiệp. Tìm thấy Hệ số tương quan giữa năng suất cây ngũ cốc và chất lượng đất đai và đánh giá tầm quan trọng của nó. Dữ liệu được hiển thị trong bảng.

Bảng 2. Sự phụ thuộc của năng suất hạt vào chất lượng đất

Số trang trại

Chất lượng đất đai, điểm số

Năng suất, c/ha


Nhiệm vụ 2. Xác định xem có mối liên hệ nào giữa thời gian hoạt động của thiết bị mô phỏng thể dục thể thao (nghìn giờ) và chi phí sửa chữa (nghìn rúp):

Thời gian vận hành mô phỏng (nghìn giờ)

Chi phí sửa chữa (nghìn rúp)

1.2 Tương quan bội trong MS Excel

Tại số lượng lớn quan sát, khi các hệ số tương quan cần được tính toán tuần tự cho một số mẫu, để thuận tiện, các hệ số thu được được tóm tắt trong các bảng gọi là ma trận tương quan.

Ma trận tương quan là một bảng hình vuông trong đó tại giao điểm của các hàng và cột tương ứng có hệ số tương quan giữa các tham số tương ứng.

Trong MS Excel, thủ tục được sử dụng để tính toán ma trận tương quan Tương quan từ gói Phân tích dữ liệu. Quy trình này cho phép chúng ta thu được ma trận tương quan chứa các hệ số tương quan giữa các tham số khác nhau.

Để thực hiện thủ tục bạn cần:

1. thực hiện lệnh Dịch vụ - Phân tích dữ liệu;

2. trong danh sách hiện ra Công cụ phân tích chọn dòng Tương quan và nhấn nút ĐƯỢC RỒI;

3. trong hộp thoại xuất hiện, chỉ định Khoảng đầu vào, nghĩa là nhập liên kết đến các ô chứa dữ liệu được phân tích. Khoảng đầu vào phải chứa ít nhất hai cột.

4. trong phần Nhómđặt công tắc theo dữ liệu đã nhập (theo cột hoặc theo hàng);

5. chỉ ra ngày nghỉ khoảng thời gian, nghĩa là nhập một liên kết đến ô mà kết quả phân tích sẽ được hiển thị. Kích thước của phạm vi đầu ra sẽ được xác định tự động và một thông báo sẽ được hiển thị nếu phạm vi đầu ra có thể trùng với dữ liệu nguồn. Nhấn nút ĐƯỢC RỒI.

Một ma trận tương quan sẽ được xuất ra phạm vi đầu ra, trong đó tại giao điểm của mỗi hàng và cột có hệ số tương quan giữa các tham số tương ứng. Các ô trong phạm vi đầu ra có tọa độ hàng và cột khớp nhau chứa giá trị 1 vì mỗi cột trong phạm vi đầu vào hoàn toàn tương quan với chính nó

Ví dụ 2. Có dữ liệu quan sát hàng tháng về điều kiện thời tiết và lượng người tham dự các bảo tàng và công viên (xem Bảng 3). Cần xác định xem có mối liên hệ nào giữa điều kiện thời tiết và việc tham quan bảo tàng, công viên hay không.

Bảng 3. Kết quả quan sát

Số ngày trong xanh

Số lượng khách tham quan bảo tàng

Số lượng khách đến công viên

Giải pháp. Để thực hiện phân tích tương quan, hãy nhập dữ liệu gốc vào phạm vi A1:G3 (Hình 2). Sau đó trong menu Dịch vụ chọn mục Phân tích dữ liệu rồi nhập dòng Tương quan. Trong hộp thoại xuất hiện, chỉ định Khoảng đầu vào(A2:C7). Chỉ định rằng dữ liệu được xem xét trong các cột. Chỉ định phạm vi đầu ra (E1) và nhấn nút ĐƯỢC RỒI.

Trong bộ lễ phục. 33 cho thấy mối tương quan giữa điều kiện thời tiết và lượng người tham dự bảo tàng là -0,92, giữa điều kiện thời tiết và lượng người tham quan công viên là 0,97, và giữa điều kiện thời tiết và lượng người tham dự bảo tàng là 0,92.

Do đó, theo kết quả phân tích, các mối phụ thuộc đã được tiết lộ: mức độ mạnh mẽ của mối quan hệ tuyến tính nghịch đảo giữa lượng người tham dự bảo tàng và số ngày nắng và mối quan hệ gần như tuyến tính (trực tiếp rất mạnh) giữa lượng người tham quan công viên và điều kiện thời tiết. Có một mối quan hệ nghịch đảo mạnh mẽ giữa việc tham quan bảo tàng và công viên.

Cơm. 2. Kết quả tính toán ma trận tương quan từ ví dụ 2

Nhiệm vụ 3. 10 nhà quản lý được đánh giá bằng phương pháp đánh giá của chuyên gia về đặc điểm tâm lý trong tính cách nhà quản lý. 15 chuyên gia đã đánh giá từng đặc điểm tâm lý bằng hệ thống năm điểm (xem Bảng 4). Nhà tâm lý học quan tâm đến câu hỏi về mối quan hệ giữa những đặc điểm này của một nhà lãnh đạo.

Bảng 4. Kết quả nghiên cứu

Đối tượng

khéo léo

tính chính xác

sự quan trọng

​ Thử nghiệm χ 2 của Pearson là một phương pháp phi tham số cho phép chúng ta đánh giá tầm quan trọng của sự khác biệt giữa số kết quả thực tế (được tiết lộ) hoặc đặc điểm định tính của mẫu thuộc từng loại và con số lý thuyết có thể được mong đợi trong nghiên cứu. nhóm nếu giả thuyết không là đúng. Nói một cách đơn giản, phương pháp này cho phép bạn ước tính ý nghĩa thống kê sự khác biệt giữa hai hoặc nhiều chỉ số tương đối (tần số, tỷ lệ).

1. Lịch sử phát triển của tiêu chí χ 2

Bài kiểm tra chi bình phương để phân tích các bảng dự phòng được phát triển và đề xuất vào năm 1900 bởi nhà toán học, nhà thống kê, nhà sinh vật học và triết gia người Anh, người sáng lập ra thống kê toán học và một trong những người sáng lập sinh trắc học Karl Pearson(1857-1936).

2. Tại sao sử dụng phép thử χ 2 của Pearson?

Kiểm định chi bình phương có thể được sử dụng trong phân tích Bảng ngẫu nhiên chứa thông tin về tần suất xảy ra tùy thuộc vào sự hiện diện của yếu tố rủi ro. Ví dụ, bảng dự phòng bốn trường như sau:

Có một kết quả (1) Không có kết quả (0) Tổng cộng
Có yếu tố rủi ro (1) MỘT B A+B
Không có yếu tố rủi ro (0) C D C+D
Tổng cộng A+C B+D A+B+C+D

Làm thế nào để điền vào một bảng dự phòng như vậy? Hãy xem xét một ví dụ nhỏ.

Một nghiên cứu đang được tiến hành về ảnh hưởng của việc hút thuốc đối với nguy cơ phát triển bệnh tăng huyết áp động mạch. Với mục đích này, hai nhóm đối tượng đã được chọn - nhóm đầu tiên bao gồm 70 người hút ít nhất 1 bao thuốc lá mỗi ngày, nhóm thứ hai bao gồm 80 người không hút thuốc ở cùng độ tuổi. Trong nhóm đầu tiên, 40 người bị huyết áp cao. Trong lần thứ hai, tăng huyết áp động mạch được quan sát thấy ở 32 người. Theo đó, huyết áp bình thường ở nhóm hút thuốc là ở 30 người (70 - 40 = 30) và ở nhóm không hút thuốc là ở 48 (80 - 32 = 48).

Chúng tôi điền vào bảng dự phòng bốn trường với dữ liệu ban đầu:

Trong bảng dự phòng thu được, mỗi dòng tương ứng với một nhóm đối tượng cụ thể. Cột - hiển thị số người bị tăng huyết áp động mạch hoặc bình thường huyết áp.

Nhiệm vụ được đặt ra cho nhà nghiên cứu là: có số liệu thống kê sự khác biệt đáng kể giữa tần suất người bị huyết áp giữa người hút thuốc và người không hút thuốc? Câu hỏi này có thể được trả lời bằng cách tính toán kiểm tra chi bình phương Pearson và so sánh giá trị kết quả với giá trị tới hạn.

3. Điều kiện và hạn chế áp dụng phép kiểm chi bình phương Pearson

  1. Các chỉ số so sánh phải được đo lường bằng quy mô danh nghĩa(ví dụ: giới tính của bệnh nhân là nam hoặc nữ) hoặc thứ tự(ví dụ: mức độ tăng huyết áp động mạch, lấy giá trị từ 0 đến 3).
  2. Phương pháp này cho phép bạn phân tích không chỉ các bảng bốn trường, khi cả yếu tố và kết quả đều là các biến nhị phân, nghĩa là chúng chỉ có hai giá trị có thể (ví dụ: nam hoặc nữ, sự hiện diện hay vắng mặt của một bệnh nào đó trong tiền sử...). Kiểm tra chi bình phương Pearson cũng có thể được sử dụng trong trường hợp phân tích các bảng nhiều trường, khi một yếu tố và (hoặc) kết quả có ba giá trị trở lên.
  3. Các nhóm được so sánh phải độc lập, nghĩa là không nên sử dụng phép kiểm định chi bình phương khi so sánh các quan sát trước-sau. bài kiểm tra McNemar(khi so sánh hai quần thể liên quan) hoặc được tính toán Bài kiểm tra Q của Cochran(trong trường hợp so sánh từ 3 nhóm trở lên).
  4. Khi phân tích bảng bốn trường Các giá trị dự kiến trong mỗi ô phải có ít nhất 10. Nếu trong ít nhất một ô, hiện tượng dự kiến ​​có giá trị từ 5 đến 9 thì phải tính toán kiểm tra chi bình phương với sửa đổi của Yates. Nếu trong ít nhất một ô hiện tượng dự kiến ​​nhỏ hơn 5 thì phân tích nên sử dụng tiêu chí chính xác người câu cá.
  5. Khi phân tích các bảng nhiều trường, số lượng quan sát dự kiến ​​không được nhỏ hơn 5 trong hơn 20% số ô.

4. Làm thế nào để tính toán kiểm tra chi bình phương Pearson?

Để tính toán kiểm tra chi bình phương bạn cần:

Thuật toán này có thể áp dụng cho cả bảng bốn trường và bảng nhiều trường.

5. Làm thế nào để diễn giải giá trị của phép thử chi bình phương Pearson?

Nếu giá trị thu được của tiêu chí χ 2 lớn hơn giá trị tới hạn, chúng tôi kết luận rằng có mối quan hệ thống kê giữa yếu tố rủi ro được nghiên cứu và kết quả ở mức ý nghĩa phù hợp.

6. Ví dụ tính toán kiểm tra chi bình phương Pearson

Chúng ta hãy xác định ý nghĩa thống kê về ảnh hưởng của yếu tố hút thuốc lá đến tỷ lệ mắc bệnh tăng huyết áp động mạch bằng cách sử dụng bảng đã thảo luận ở trên:

  1. Chúng tôi tính toán các giá trị mong đợi cho từng ô:
  2. Tìm giá trị của phép kiểm tra chi bình phương Pearson:

    χ 2 = (40-33,6) 2 /33,6 + (30-36,4) 2 /36,4 + (32-38,4) 2 /38,4 + (48-41,6) 2 /41,6 = 4,396.

  3. Số bậc tự do f = (2-1)*(2-1) = 1. Sử dụng bảng, chúng ta tìm thấy giá trị tới hạn của phép thử chi bình phương Pearson, ở mức ý nghĩa p=0,05 và số bậc tự do 1 là 3,841.
  4. Chúng tôi so sánh giá trị thu được của phép thử chi bình phương với giá trị tới hạn: 4,396 > 3,841, do đó, sự phụ thuộc của tỷ lệ mắc bệnh tăng huyết áp động mạch vào sự hiện diện của việc hút thuốc là có ý nghĩa thống kê. Mức ý nghĩa của mối quan hệ này tương ứng với p<0.05.

Đánh giá sự tuân thủ phân phối chuẩn

Phương pháp này được sử dụng để kiểm tra sự phù hợp giữa phân bố thực nghiệm và phân bố lý thuyết nếu số lượng thử nghiệm lớn hơn 100.

Bản chất của phương pháp là xác định tiêu chí Pearson ( c 2) sau đó so sánh giá trị thu được với giá trị lý thuyết.

Quy trình xác định tiêu chí Pearson:

Giá trị trung bình và độ lệch chuẩn được xác định. Để tính tiêu chí Pearson, một bảng được lập ra (Bảng 11).

2. Xác định thái độ

3. Sử dụng bảng đặc biệt (Bảng 12) xác định tần số phân bố Y 0.


Bảng 11


Bảng 12

t 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 0,3989 0,2420 0,0544 0,0044

4. Tính giá trị tần số lý thuyết

(40)

Ở đâu N- tổng số lần kiểm tra;

k- khoảng thời gian của lớp học;

S- độ lệch chuẩn.

5. Xác định sự khác biệt giữa phân bố tần số thực tế và lý thuyết

y tôi – U t(41)

dựa vào

6. Tìm tiêu chí Pearson

(43)

7. Xác định số bậc tự do

C = m-3(44)

Ở đâu C- số bậc tự do;

tôi- số lớp hoặc số dòng.

8. Đặt xác suất tin cậy q, xác định giá trị lý thuyết của tiêu chí Pearson.

9. So sánh c f 2 Với c t 2. Nếu như c 2 f< c 2 т , thì đối với xác suất tin cậy được chấp nhận, giả thuyết về sự phù hợp giữa phân bố thực nghiệm và lý thuyết được chấp nhận, nếu không thì bị bác bỏ.

Trong Excel, việc kiểm tra được thực hiện bằng hàm HI2TEST(Hình 22). HI2TEST trả về giá trị cho phân bố χ 2 Phép kiểm tra này được sử dụng để xác định liệu một giả thuyết có được thực nghiệm ủng hộ hay không.

Cơm. 22. Chức năng HI2TEST

HI2TEST(khoảng thời gian thực tế;dự kiến_khoảng thời gian)

Khoảng_thời gian thực tế là khoảng dữ liệu chứa các quan sát được so sánh với các giá trị dự kiến.

Khoảng_kỳ vọng là khoảng dữ liệu chứa tỷ lệ tích của tổng hàng và cột với tổng cuối.

Nếu thực tế_interval và kỳ vọng có số lượng điểm dữ liệu khác nhau thì hàm HI2TEST trả về giá trị lỗi #N/A.

Kiểm định χ 2 trước tiên tính toán thống kê χ 2 bằng công thức:

(45)

Ở đâu A ij- tần số thực tế trong Tôi-dòng thứ j cột thứ

E ij- tần suất dự kiến ​​ở hàng thứ i, cột thứ j

r- số dòng

c- số cột

Giá trị của tiêu chí χ 2 là chỉ số về tính độc lập. Như có thể thấy từ công thức, tiêu chí χ 2 luôn dương hoặc bằng 0, và điều sau chỉ có thể xảy ra nếu A ij = E ij cho bất kỳ giá trị tôi, j.

HI2TEST trả về xác suất mà, với tính độc lập nhất định, có thể thu được giá trị của thống kê χ 2 ít nhất bằng giá trị thu được từ công thức trên. Để tính xác suất này, HI2TEST sử dụng phân bố χ 2 với số bậc tự do tương ứng ( df). Nếu như r> 1 và c > 1 thì df= (r- 1)(c- 1). Nếu như r= 1, một c> 1 thì df=c- 1 hoặc nếu r> 1, một c= 1 thì df= r- 1. Bình đẳng, ở đâu r = c= 1 không được phép nên sẽ xuất hiện thông báo lỗi #N/A.

Chức năng HI2TEST có thể được sử dụng trong trường hợp phân phối giả thuyết được xác định hoàn toàn, nghĩa là không chỉ loại luật phân phối giả định được xác định mà còn tất cả các tham số của luật này. Chỉ trong trường hợp này, hàm mới trả về chính xác số bậc tự do.

CHIDIST(x;độ_tự do) (Hình 23) trả về xác suất một phía của phân bố chi bình phương. Phân phối χ 2 có liên quan đến phép thử χ 2. Kiểm định χ 2 được sử dụng để so sánh giá trị ước tính và giá trị quan sát được. Ví dụ, trong một thí nghiệm di truyền, người ta đưa ra giả thuyết rằng thế hệ thực vật tiếp theo sẽ có một màu sắc nhất định. Bằng cách so sánh kết quả quan sát được với kết quả mong đợi, bạn có thể xác định liệu giả thuyết ban đầu có đúng hay không.

x là giá trị mà bạn muốn tính toán phân phối.

Độ_tự do – số bậc tự do.

Cơm. 23. Chức năng CHIDIST

Nếu bất kỳ đối số nào không phải là số thì hàm CHIDIST trả về giá trị lỗi #VALUE!

Nếu x âm thì hàm CHIDIST

Nếu độ_of_tự do< 1 или степени_свободы >10^10, hàm số CHIDIST trả về giá trị lỗi #NUM!

CHIDIST tính như CHIDIST= P(X> x), trong đó x - χ 2 biến ngẫu nhiên.

HI2OBR(xác suất;độ_tự do) (Hình 24) trả về nghịch đảo của xác suất một phía của phân bố chi bình phương. Nếu xác suất = CHIDIST(x;...), thì HI2OBR(xác suất;...) = x. Chức năng này cho phép bạn so sánh kết quả quan sát được với kết quả mong đợi để xác định xem giả thuyết ban đầu có đúng hay không.

Khả năng xảy ra là xác suất liên quan đến phân bố c2 (chi-square).

Độ_tự do - số bậc tự do.

Nếu bất kỳ đối số nào không phải là số, CH2INV sẽ trả về giá trị lỗi #VALUE!.

Cơm. 24. Chức năng HI2OBR

Nếu xác suất< 0 или вероятность >1, chức năng HI2OBR trả về giá trị lỗi #NUM!

Nếu giá trị của đối số bậc_tự do không phải là số nguyên thì nó sẽ bị cắt bớt.

Nếu độ_of_tự do< 1 или степени_свободы ≥ 10^10, HI2OBR trả về giá trị lỗi #NUM!

Nếu cho trước một giá trị xác suất thì hàm HI2OBR tìm giá trị x mà hàm CHIDIST(x; bậc_tự do) = xác suất. Tuy nhiên, độ chính xác của hàm HI2OBR phụ thuộc vào độ chính xác CHIDIST. Trong chức năng HI2OBR Phương pháp lặp được sử dụng để tìm kiếm. Nếu việc tìm kiếm vẫn chưa kết thúc sau 100 lần lặp, hàm sẽ trả về thông báo lỗi #N/A.

Hệ số tương quan phản ánh mức độ liên quan giữa hai chỉ tiêu. Nó luôn nhận giá trị từ -1 đến 1. Nếu hệ số nằm ở khoảng 0 thì không có mối liên hệ nào giữa các biến.

Nếu giá trị gần bằng một (ví dụ từ 0,9), thì có mối quan hệ trực tiếp mạnh mẽ giữa các đối tượng được quan sát. Nếu hệ số gần với điểm cực trị khác của phạm vi (-1), thì có mối quan hệ nghịch đảo chặt chẽ giữa các biến. Khi giá trị nằm trong khoảng từ 0 đến 1 hoặc 0 và -1 thì Chúng ta đang nói vềkết nối yếu(trực tiếp hoặc ngược lại). Mối quan hệ này thường không được tính đến: người ta tin rằng nó không tồn tại.

Tính hệ số tương quan trong Excel

Hãy xem một ví dụ về các phương pháp tính hệ số tương quan, các đặc điểm của mối quan hệ trực tiếp và nghịch đảo giữa các biến.

Giá trị của chỉ số x và y:

Y là biến độc lập, x là biến phụ thuộc. Cần phải tìm ra độ mạnh (mạnh/yếu) và hướng (thuận/nghịch) của mối liên hệ giữa chúng. Công thức hệ số tương quan trông như thế này:


Để dễ hiểu hơn, chúng ta hãy chia nó thành nhiều phần đơn giản.

Một mối quan hệ trực tiếp mạnh mẽ được xác định giữa các biến.

Hàm CORREL tích hợp giúp tránh các phép tính phức tạp. Hãy tính hệ số tương quan cặp trong Excel bằng cách sử dụng nó. Gọi trình hướng dẫn chức năng. Chúng tôi tìm thấy một trong những quyền. Các đối số của hàm là một mảng các giá trị y và một mảng các giá trị x:

Hãy hiển thị giá trị của các biến trên biểu đồ:


Có thể thấy được mối liên hệ chặt chẽ giữa y và x, bởi vì các đường chạy gần như song song với nhau. Mối quan hệ trực tiếp: y tăng - x tăng, y giảm - x giảm.



Cặp ma trận hệ số tương quan trong Excel

Ma trận tương quan là một bảng ở giao điểm của các hàng và cột trong đó có các hệ số tương quan giữa các giá trị tương ứng. Sẽ rất hợp lý khi xây dựng nó cho một số biến.

Ma trận các hệ số tương quan trong Excel được xây dựng bằng công cụ “Tương quan” trong gói “Phân tích dữ liệu”.


Một mối quan hệ trực tiếp mạnh mẽ đã được tìm thấy giữa các giá trị của y và x1. Giữa x1 và x2 có sự liên kết mạnh Nhận xét. Thực tế không có mối liên hệ nào với các giá trị trong cột x3.