Áp dụng phép kiểm χ2 để kiểm định giả thuyết về sự bằng nhau của hai hay nhiều cổ phiếu. Kiểm tra các giả thuyết đơn giản bằng phép kiểm tra chi bình phương Pearson trong MS EXCEL Điều kiện và hạn chế của việc sử dụng phép kiểm tra chi bình phương Pearson

Kiểm tra thống kê

Quy tắc theo đó giả thuyết I0 bị bác bỏ hay chấp nhận được gọi là tiêu chí thống kê. Tên của tiêu chí, theo quy tắc, chứa một chữ cái biểu thị đặc điểm được biên soạn đặc biệt từ khoản 2 của thuật toán kiểm tra giả thuyết thống kê (xem khoản 4.1), được tính toán trong tiêu chí. Trong các điều kiện của thuật toán này, tiêu chí sẽ được gọi là "V-tiêu chuẩn".

Khi kiểm định các giả thuyết thống kê, có thể xảy ra hai loại lỗi:

  • - Lỗi loại I(bạn có thể bác bỏ giả thuyết I 0 khi nó thực sự đúng);
  • - Lỗi loại II(bạn có thể chấp nhận giả thuyết I 0 khi nó thực sự không đúng).

Xác suất MỘT mắc lỗi loại đầu tiên được gọi là mức ý nghĩa tiêu chí.

Nếu cho R biểu thị xác suất mắc lỗi loại thứ hai, khi đó (l - R) - xác suất không mắc lỗi loại thứ hai, được gọi là sức mạnh của tiêu chí

Kiểm tra mức độ phù hợp x 2 của Pearson

Có một số loại giả thuyết thống kê:

  • - về quy luật phân phối;
  • - tính đồng nhất của mẫu;
  • - giá trị số của các tham số phân phối, v.v.

Chúng ta sẽ xem xét giả thuyết về quy luật phân phối bằng cách sử dụng ví dụ về phép thử mức độ phù hợp x 2 của Pearson.

Tiêu chí thỏa thuậnđược gọi là tiêu chí thống kê để kiểm tra giả thuyết không về quy luật giả định của một phân phối chưa biết.

Thử nghiệm mức độ phù hợp của Pearson dựa trên sự so sánh tần suất quan sát thực nghiệm (được quan sát) và lý thuyết của các quan sát được tính toán theo giả định của một quy luật phân phối nhất định. Giả thuyết số 0 ở đây được xây dựng như sau: theo đặc điểm đang được nghiên cứu, dân số có phân bố chuẩn.

Thuật toán kiểm tra giả thuyết thống kê số 0 cho tiêu chí x 1 Lề:

  • 1) chúng tôi đưa ra giả thuyết I 0 - theo đặc điểm đang được nghiên cứu, dân số nói chung có phân bố chuẩn;
  • 2) tính giá trị trung bình mẫu và độ lệch chuẩn mẫu V;

3) theo cỡ mẫu có sẵn P chúng tôi tính toán một đặc tính được biên soạn đặc biệt,

trong đó: i là tần số thực nghiệm, - tần số lý thuyết,

P - cỡ mẫu,

h- kích thước của khoảng (sự khác biệt giữa hai tùy chọn liền kề),

Giá trị chuẩn hóa của đặc tính được quan sát,

- chức năng bảng. Ngoài ra tần số lý thuyết

có thể được tính bằng hàm MS Excel tiêu chuẩn NORMIDIST bằng công thức;

4) bằng cách sử dụng phân phối mẫu, chúng tôi xác định giá trị tới hạn của đặc tính được biên dịch đặc biệt xl P

5) khi giả thuyết số 0 bị bác bỏ, khi giả thuyết số 0 được chấp nhận.

Ví dụ. Chúng ta hãy xem xét dấu hiệu X- giá trị của các chỉ số kiểm tra đối với người bị kết án ở một trong các khu cải huấn về một số đặc điểm tâm lý, được trình bày dưới dạng chuỗi biến thiên:

Với mức ý nghĩa 0,05, hãy kiểm định giả thuyết về phân bố chuẩn của tổng thể.

1. Dựa trên phân bố thực nghiệm, có thể đưa ra giả thuyết H 0: theo tiêu chí nghiên cứu “giá trị của chỉ số kiểm tra đối với một đặc điểm tâm lý nhất định”, dân số nói chung

dự kiến ​​được phân phối bình thường. Giả thuyết thay thế 1: theo tiêu chí được nghiên cứu “giá trị của chỉ số kiểm tra đối với một đặc điểm tâm lý nhất định”, dân số chung của những người bị kết án không được phân phối bình thường.

2. Hãy tính các đặc tính mẫu số:

Khoảng thời gian

x g y

X) học

3. Hãy tính đặc tính được biên dịch đặc biệt j 2 . Để làm điều này, ở cột áp chót của bảng trước, chúng ta tìm thấy tần số lý thuyết bằng cách sử dụng công thức và ở cột cuối cùng

Hãy tính đặc điểm % 2. Chúng tôi nhận được x 2 = 0,185.

Để rõ ràng, chúng tôi sẽ xây dựng một đa giác phân bố theo kinh nghiệm và một đường cong chuẩn tắc dựa trên tần số lý thuyết (Hình 6).

Cơm. 6.

4. Xác định số bậc tự do S: k = 5, t = 2, s = 5-2-1 = 2.

Theo bảng hoặc sử dụng hàm MS Excel chuẩn “HI20BR” cho số bậc tự do 5=2 và mức ý nghĩa một = 0,05 chúng ta sẽ tìm được giá trị tới hạn của tiêu chí xl P.=5,99. Về mức ý nghĩa MỘT= 0,01 giá trị tiêu chí quan trọng X%. = 9,2.

5. Giá trị tiêu chí quan sát X=0,185 nhỏ hơn tất cả các giá trị tìm thấy Hk R.-> do đó, giả thuyết I 0 được chấp nhận ở cả hai mức ý nghĩa. Sự khác biệt giữa tần số thực nghiệm và lý thuyết là không đáng kể. Do đó, dữ liệu quan sát phù hợp với giả thuyết về phân bố dân số bình thường. Do đó, theo tiêu chí được nghiên cứu “giá trị của chỉ số kiểm tra đối với một đặc điểm tâm lý nhất định”, dân số chung của những người bị kết án được phân bổ bình thường.

  • 1. Koryachko A.V., Kulichenko A.G. Toán cao cấp và các phương pháp toán trong tâm lý học: hướng dẫn các lớp học thực hành cho sinh viên Khoa Tâm lý học. Ryazan, 1994.
  • 2. Nasledov A.D. Phương pháp toán học nghiên cứu tâm lý học. Phân tích và giải thích dữ liệu: Sách giáo khoa, sổ tay. St Petersburg, 2008.
  • 3. Sidorenko E.V. Các phương pháp xử lý toán học trong tâm lý học. St Petersburg, 2010.
  • 4. Soshnikova L.A. và những nội dung khác Phân tích thống kê đa biến trong kinh tế học: Sách giáo khoa, cẩm nang dành cho đại học. M., 1999.
  • 5. Sukhodolsky E.V. Phương pháp toán học trong tâm lý học. Kharkov, 2004.
  • 6. Shmoilova R.A., Minashkin V.E., Sadovnikova N.A. Hội thảo lý thuyết thống kê: Sách giáo khoa, sổ tay. M., 2009.
  • Gmurman V.E. Lý thuyết xác suất và thống kê toán học. P. 465.

OPR. Tần số thực nghiệm là tần số thực tế được quan sát.

KIỂM TRA GIẢ THUYẾT VỀ PHÂN BỔ DÂN SỐ. TIÊU CHÍ PEARSON

Như đã lưu ý trước đó, các giả định về loại phân phối có thể được thực hiện dựa trên các tiền đề lý thuyết. Tuy nhiên, cho dù luật phân phối lý thuyết được chọn tốt đến đâu thì sự khác biệt là không thể tránh khỏi giữa phân phối thực nghiệm và phân phối lý thuyết. Câu hỏi đặt ra một cách tự nhiên: những khác biệt này chỉ được giải thích bởi các trường hợp ngẫu nhiên liên quan đến một số lượng quan sát hạn chế, hay chúng có ý nghĩa quan trọng và có liên quan đến thực tế là luật phân phối lý thuyết được chọn kém. Tiêu chí đồng ý được sử dụng để trả lời câu hỏi này, tức là.

OPR. Tiêu chí thỏa thuậnđược gọi là tiêu chí để kiểm định một giả thuyết về quy luật giả định của một phân phối chưa biết.

Đối với mỗi tiêu chí, tức là phân phối tương ứng, các bảng thường được biên soạn từ đó chúng được tìm thấy k kr (xem phụ lục). Sau khi tìm được điểm tới hạn, giá trị quan sát của tiêu chí được tính toán từ dữ liệu mẫu ĐẾN quan sát. Nếu như ĐẾN quan sát > k kr thì giả thuyết không bị bác bỏ, nếu ngược lại thì được chấp nhận.

Chúng ta hãy mô tả việc áp dụng tiêu chí Pearson để kiểm tra giả thuyết về phân bố chuẩn của tổng thể. Tiêu chí Pearson trả lời câu hỏi liệu sự khác biệt giữa tần suất thực nghiệm và lý thuyết có phải là do ngẫu nhiên hay không?

Tiêu chí Pearson, giống như bất kỳ tiêu chí nào, không chứng minh tính hợp lệ của giả thuyết mà chỉ thiết lập, ở mức ý nghĩa được chấp nhận, sự đồng tình hay không đồng tình của giả thuyết đó với dữ liệu quan sát.

Vì vậy, hãy lấy phân phối thực nghiệm từ mẫu có kích thước n. Ở mức ý nghĩa a, cần kiểm định giả thuyết không: tổng thể có phân bố chuẩn.

Biến ngẫu nhiên c 2 = được lấy làm tiêu chí để kiểm định giả thuyết không, trong đó tần số thực nghiệm là bao nhiêu; - tần số lý thuyết.

SV này có phân bố c2 với k - bậc tự do. Số bậc tự do được tìm theo đẳng thức k=m –r -1, m – số khoảng lấy mẫu từng phần; r - số lượng tham số phân phối. Đối với phân phối chuẩn r=2 (a và s), thì k=m –3.

Để kiểm tra giả thuyết không ở một mức ý nghĩa nhất định: dân số có phân phối chuẩn, bạn cần:

1. Tính giá trị trung bình mẫu và độ lệch chuẩn mẫu.

2.Tính tần số lý thuyết,

trong đó n là cỡ mẫu; h – bước (sự khác biệt giữa hai phương án lân cận); ; Các giá trị của hàm được xác định bởi ứng dụng.

3. So sánh tần suất thực nghiệm và lý thuyết bằng phép thử Pearson. Đối với điều này:



a) tìm giá trị quan sát được của tiêu chí;

b) sử dụng bảng các điểm tới hạn của phân bố c 2, sử dụng mức ý nghĩa a cho trước và số bậc tự do k, tìm được điểm tới hạn.

Nếu như< - нет оснований отвергнуть нулевую гипотезу. Если >- giả thuyết không bị bác bỏ.

Bình luận.Ít tần số (<5) следует объединить; в этом случае и соответствующие им теоретические частоты также надо сложить. Если производилось объединение частот, то при определении числа степеней свободы следует в качестве m принять число групп выборки, оставшихся после объединения частот.

thử nghiệm h2-Pearson

Các tiêu chí xác định việc lựa chọn luật phân phối thành công hay không thành công thường được gọi là tiêu chí thỏa thuận. Tiêu chí K. Pearson phần 2 là tiêu chí được sử dụng thường xuyên nhất để kiểm định một giả thuyết đơn giản về quy luật phân phối. Nó dựa trên việc sử dụng làm thước đo độ lệch của dữ liệu thử nghiệm so với phân bố giả thuyết, cùng một giá trị dùng để xây dựng vùng tin cậy cho mật độ không xác định, thay thế các giá trị thực chưa biết của xác suất rơi vào các khoảng bằng xác suất được tính toán từ phân phối giả định. Giả sử rằng phạm vi các giá trị có thể có của một biến ngẫu nhiên được chia thành các khoảng r (đa chiều, tức là hình chữ nhật, trong trường hợp biến vectơ). Gọi là tần số ngẫu nhiên rơi vào các khoảng này, thu được từ kết quả của n thí nghiệm, P1,...,Pr - xác suất rơi vào các khoảng giống nhau, được tính từ phân bố giả thuyết.

Trong trường hợp tổng quát, các xác suất này là hàm ước lượng các tham số chưa biết thu được từ cùng một dữ liệu thực nghiệm và do đó cũng là các biến ngẫu nhiên. Giả sử rằng các ước tính về các tham số chưa biết của phân bố giả định được tính toán từ cùng một mẫu được phân cụm với tần số. Khi đó các xác suất Р1,…,Рr sẽ là một số hàm của tần số và để đánh giá độ lệch của dữ liệu thực nghiệm so với phân bố giả thuyết, hãy lấy đại lượng

trong đó Р1,…,Рr là các hàm tần số nhất định.

Neyman và Pearson đã chỉ ra rằng nếu sử dụng ước tính tiệm cận hiệu quả và chuẩn tắc tiệm cận của tham số s chiều chưa biết của phân bố giả thuyết trên một mẫu được nhóm để tính xác suất P1,...,Pr, thì giá trị của Z, được xác định bởi công thức (1), trong giới hạn là n ->? có phân bố h2 với bậc tự do r-s-1.

Sử dụng định lý này, người ta có thể đánh giá sự khác biệt giữa dữ liệu thực nghiệm và phân phối giả định bằng bảng phân phối h2. Chúng ta hãy chọn một xác suất p đủ nhỏ để một sự kiện có xác suất như vậy có thể được coi là không thể xảy ra trên thực tế và xác định từ phương trình

Nếu việc hiện thực hóa =2 của giá trị Z thu được do thử nghiệm vượt quá hoặc bằng =2 thì phân bố giả thuyết được coi là không nhất quán với dữ liệu thực nghiệm, vì với phân bố này hầu như không thể đạt được =2 với một vật mẫu. Xác suất của một sự kiện như vậy với số lượng lớn thí nghiệm n xấp xỉ bằng p, tức là. không đáng kể. Trong trường hợp này, họ nói rằng có sự sai lệch đáng kể giữa dữ liệu thực nghiệm so với phân bố giả thuyết. Nếu =2 thì người ta tin rằng phân bố giả thuyết không mâu thuẫn với dữ liệu thực nghiệm và nhất quán với chúng.

Giá trị này được gọi là mức ý nghĩa dự án 100p của độ lệch của mẫu so với phân bố giả thuyết. Thông thường, mức ý nghĩa 5, 1 và 0,1 phần trăm được sử dụng, tùy thuộc vào bản chất của vấn đề.

Ngoài ra, để kiểm tra tính nhất quán của dữ liệu thực nghiệm với phân bố giả thuyết, sẽ rất hữu ích khi tính xác suất mà đối với một phân bố giả thuyết nhất định, giá trị của Z sẽ lớn hơn giá trị thu được do thử nghiệm với việc thực hiện nó = 2, P (Z > 2) Xác suất này càng lớn thì sự phù hợp của mẫu với phân bố giả thuyết càng tốt, thì sự khác biệt thu được giữa mẫu và phân bố giả thuyết càng ít đáng kể. Thật vậy, nếu xác suất P(Z > 2) cao thì khi lặp lại chuỗi thí nghiệm này, nếu giả thuyết được chọn về phân bố là đúng thì các giá trị của Z thường sẽ thu được thậm chí còn lớn hơn giá trị =2 thu được là kết quả của các thí nghiệm.

Chúng ta hãy chú ý đến thực tế là, đã nhận được = 2< и даже получив высокую вероятность P(Z >2), chúng tôi không đưa ra kết luận chắc chắn rằng giả thuyết đã chọn về phân bố là hợp lệ mà chỉ nói rằng giả thuyết này không mâu thuẫn với các kết quả thực nghiệm thu được, nó phù hợp với chúng, do đó nó có thể được chấp nhận . Để có được bằng chứng đủ mạnh rằng một biến ngẫu nhiên thực sự tuân theo quy luật phân phối giả thuyết, cần phải lặp lại chuỗi thí nghiệm này với số lần đủ lớn và đảm bảo rằng sự thống nhất thu được giữa giả thuyết và kết quả thực nghiệm là ổn định.

Tiêu chí Kolmogorov

Tiêu chí Kolmogorov - tiêu chí phụ

Là một tiêu chí phụ để kiểm tra tính đồng nhất trong phân phối giá trị P của tiêu chí chính trong công việc này, chúng tôi sử dụng tiêu chí Kolmogorov.

Tiêu chí Kolmogorov xét giá trị cực đại của mô đun chênh lệch giữa hàm phân phối thống kê F^* (x) và hàm phân phối lý thuyết tương ứng F(x), tức là D = max|F^* (x)-F(x )|.

Bước tiếp theo là xác định giá trị l=D. Sử dụng các bảng thống kê (trong môi trường matcalc với hàm pvKolm(u)), xác suất tìm thấy, do các nguyên nhân hoàn toàn ngẫu nhiên, chênh lệch tối đa giữa F^* (x) và F(x) sẽ không nhỏ hơn thực tế đã quan sát thấy một. Nếu xác suất P(l) tương đối cao thì giả thuyết nên được chấp nhận; nếu nó rất nhỏ thì giả thuyết đó sẽ bị bác bỏ vì không hợp lý.

​ Thử nghiệm χ 2 của Pearson là một phương pháp phi tham số cho phép chúng ta đánh giá tầm quan trọng của sự khác biệt giữa số kết quả thực tế (được tiết lộ) hoặc đặc điểm định tính của mẫu thuộc từng loại và con số lý thuyết có thể được mong đợi trong nghiên cứu. nhóm nếu giả thuyết không là đúng. Nói một cách đơn giản, phương pháp cho phép bạn đánh giá ý nghĩa thống kê của sự khác biệt giữa hai hoặc nhiều chỉ số tương đối (tần số, tỷ lệ).

1. Lịch sử phát triển của tiêu chí χ 2

Bài kiểm tra chi bình phương để phân tích các bảng dự phòng được phát triển và đề xuất vào năm 1900 bởi một nhà toán học, nhà thống kê, nhà sinh vật học và triết gia người Anh, người sáng lập thống kê toán học và một trong những người sáng lập sinh trắc học. Karl Pearson(1857-1936).

2. Tại sao sử dụng phép thử χ 2 của Pearson?

Kiểm định chi bình phương có thể được sử dụng trong phân tích Bảng ngẫu nhiên chứa thông tin về tần suất xảy ra tùy thuộc vào sự hiện diện của yếu tố rủi ro. Ví dụ, bảng dự phòng bốn trường như sau:

Có một kết quả (1) Không có kết quả (0) Tổng cộng
Có yếu tố rủi ro (1) MỘT B A+B
Không có yếu tố rủi ro (0) C D C+D
Tổng cộng A+C B+D A+B+C+D

Làm thế nào để điền vào một bảng dự phòng như vậy? Hãy xem xét một ví dụ nhỏ.

Một nghiên cứu đang được tiến hành về ảnh hưởng của việc hút thuốc đối với nguy cơ phát triển bệnh tăng huyết áp động mạch. Với mục đích này, hai nhóm đối tượng đã được chọn - nhóm đầu tiên bao gồm 70 người hút ít nhất 1 bao thuốc lá mỗi ngày, nhóm thứ hai bao gồm 80 người không hút thuốc ở cùng độ tuổi. Trong nhóm đầu tiên, 40 người bị huyết áp cao. Trong lần thứ hai, tăng huyết áp động mạch được quan sát thấy ở 32 người. Theo đó, huyết áp bình thường ở nhóm hút thuốc là ở 30 người (70 - 40 = 30) và ở nhóm không hút thuốc là ở 48 (80 - 32 = 48).

Chúng tôi điền vào bảng dự phòng bốn trường với dữ liệu ban đầu:

Trong bảng dự phòng thu được, mỗi dòng tương ứng với một nhóm đối tượng cụ thể. Cột hiển thị số người bị tăng huyết áp động mạch hoặc huyết áp bình thường.

Nhiệm vụ được đặt ra cho nhà nghiên cứu là: liệu có sự khác biệt có ý nghĩa thống kê giữa tần suất người bị huyết áp giữa người hút thuốc và người không hút thuốc? Câu hỏi này có thể được trả lời bằng cách tính toán kiểm tra chi bình phương Pearson và so sánh giá trị kết quả với giá trị tới hạn.

3. Điều kiện và hạn chế áp dụng phép kiểm chi bình phương Pearson

  1. Các chỉ số so sánh phải được đo lường bằng quy mô danh nghĩa(ví dụ: giới tính của bệnh nhân là nam hoặc nữ) hoặc thứ tự(ví dụ: mức độ tăng huyết áp động mạch, lấy giá trị từ 0 đến 3).
  2. Phương pháp này cho phép bạn phân tích không chỉ các bảng bốn trường, khi cả yếu tố và kết quả đều là biến nhị phân, nghĩa là chúng chỉ có hai giá trị có thể (ví dụ: giới tính nam hoặc nữ, sự hiện diện hay vắng mặt của một bệnh nào đó trong tiền sử...). Kiểm tra chi bình phương Pearson cũng có thể được sử dụng trong trường hợp phân tích các bảng nhiều trường, khi một yếu tố và (hoặc) kết quả có ba giá trị trở lên.
  3. Các nhóm được so sánh phải độc lập, nghĩa là không nên sử dụng phép kiểm định chi bình phương khi so sánh các quan sát trước-sau. bài kiểm tra McNemar(khi so sánh hai quần thể liên quan) hoặc được tính toán Bài kiểm tra Q của Cochran(trong trường hợp so sánh từ 3 nhóm trở lên).
  4. Khi phân tích bảng bốn trường Các giá trị dự kiến trong mỗi ô phải có ít nhất 10. Nếu trong ít nhất một ô, hiện tượng dự kiến ​​có giá trị từ 5 đến 9 thì phải tính toán kiểm tra chi bình phương với sửa đổi của Yates. Nếu trong ít nhất một ô hiện tượng dự kiến ​​nhỏ hơn 5 thì phân tích nên sử dụng Kiểm tra chính xác của Fisher.
  5. Khi phân tích các bảng nhiều trường, số lượng quan sát dự kiến ​​không được nhỏ hơn 5 trong hơn 20% số ô.

4. Làm thế nào để tính toán kiểm tra chi bình phương Pearson?

Để tính toán kiểm tra chi bình phương bạn cần:

Thuật toán này có thể áp dụng cho cả bảng bốn trường và bảng nhiều trường.

5. Làm thế nào để diễn giải giá trị của phép thử chi bình phương Pearson?

Nếu giá trị thu được của tiêu chí χ 2 lớn hơn giá trị tới hạn, chúng tôi kết luận rằng có mối quan hệ thống kê giữa yếu tố rủi ro được nghiên cứu và kết quả ở mức ý nghĩa phù hợp.

6. Ví dụ tính toán kiểm tra chi bình phương Pearson

Chúng ta hãy xác định ý nghĩa thống kê về ảnh hưởng của yếu tố hút thuốc lá đến tỷ lệ mắc bệnh tăng huyết áp động mạch bằng cách sử dụng bảng đã thảo luận ở trên:

  1. Chúng tôi tính toán các giá trị mong đợi cho từng ô:
  2. Tìm giá trị của phép kiểm tra chi bình phương Pearson:

    χ 2 = (40-33,6) 2 /33,6 + (30-36,4) 2 /36,4 + (32-38,4) 2 /38,4 + (48-41,6) 2 /41,6 = 4,396.

  3. Số bậc tự do f = (2-1)*(2-1) = 1. Sử dụng bảng, chúng ta tìm thấy giá trị tới hạn của phép thử chi bình phương Pearson, ở mức ý nghĩa p=0,05 và số bậc tự do 1 là 3,841.
  4. Chúng tôi so sánh giá trị thu được của phép thử chi bình phương với giá trị tới hạn: 4,396 > 3,841, do đó, sự phụ thuộc của tỷ lệ mắc bệnh tăng huyết áp động mạch vào sự hiện diện của việc hút thuốc là có ý nghĩa thống kê. Mức ý nghĩa của mối quan hệ này tương ứng với p<0.05.

Các ghi chú trước đã mô tả các quy trình kiểm tra các giả thuyết về dữ liệu số và phân loại: , một số , và cũng cho phép bạn nghiên cứu một hoặc . Trong lưu ý này, chúng tôi sẽ xem xét các phương pháp kiểm tra các giả thuyết về sự khác biệt giữa các phần của một tính trạng trong quần thể nói chung dựa trên một số mẫu độc lập.

Để minh họa các phương pháp được sử dụng, một kịch bản được sử dụng để đánh giá mức độ hài lòng của khách tại các khách sạn thuộc sở hữu của T.S. Resort Properties. Hãy tưởng tượng bạn là người quản lý của một công ty sở hữu năm khách sạn nằm trên hai hòn đảo nghỉ dưỡng. Nếu khách hài lòng với dịch vụ thì khả năng cao họ sẽ quay lại vào năm sau và giới thiệu bạn bè nghỉ tại khách sạn của bạn. Để đánh giá chất lượng dịch vụ, khách được yêu cầu điền vào bảng câu hỏi và cho biết liệu họ có hài lòng với sự hiếu khách hay không. Bạn cần phân tích dữ liệu khảo sát để xác định mức độ hài lòng chung của khách, ước tính khả năng khách sẽ quay lại vào năm tới và xác định lý do có thể khiến một số khách hàng không hài lòng. Ví dụ: trên một trong những hòn đảo, công ty sở hữu các khách sạn Beachcomber và Windsurfer. Dịch vụ ở những khách sạn này có giống nhau không? Nếu không, làm thế nào thông tin này có thể được sử dụng để cải thiện hiệu suất của công ty? Hơn nữa, nếu một số khách nói rằng họ sẽ không đến với bạn nữa, lý do nào họ đưa ra thường xuyên hơn những người khác? Có thể nói rằng những lý do này chỉ liên quan đến một khách sạn cụ thể và không áp dụng cho toàn bộ công ty?

Các ký hiệu sau đây được sử dụng ở đây: X 1 - số lần thành công trong nhóm đầu tiên, X 2 - số lần thành công ở nhóm thứ hai, N 1 X 1 - số lần thất bại trong nhóm đầu tiên, N 2 X 2 - số lần thất bại trong nhóm thứ hai, X =X 1 + X 2 - tổng số thành công, NX = (N 1 X 1 ) + (N 2 X 2 ) - tổng số lần thất bại, N 1 - thể tích của mẫu đầu tiên, N 2 - thể tích của mẫu thứ hai, N = N 1 + N 2 - tổng cỡ mẫu. Bảng hiển thị có hai hàng và hai cột, đó là lý do tại sao nó được gọi là bảng hệ số 2x2. Các ô được hình thành bởi giao điểm của mỗi hàng và cột chứa số lần thành công hoặc thất bại.

Hãy để chúng tôi minh họa việc sử dụng bảng dự phòng bằng ví dụ về kịch bản được mô tả ở trên. Giả sử câu hỏi "Năm sau bạn có quay lại không?" 163 trong số 227 khách tại khách sạn Beachcomber và 154 trong số 262 khách tại khách sạn Windsurfer đã phản hồi tích cực. Có sự khác biệt có ý nghĩa thống kê giữa sự hài lòng của khách lưu trú tại khách sạn (khả năng khách sẽ quay lại vào năm tới) nếu mức ý nghĩa là 0,05?

Cơm. 2. Bảng hệ số 2x2 đánh giá chất lượng phục vụ khách

Dòng đầu tiên cho biết số lượng khách tại mỗi khách sạn cho biết họ muốn quay lại vào năm tới (thành công); ở dòng thứ hai - số lượng khách bày tỏ sự không hài lòng (thất bại). Các ô nằm trong cột Tổng cộng chứa tổng số khách dự định quay lại khách sạn trong năm tới, cũng như tổng số khách không hài lòng với dịch vụ. Các ô nằm trong hàng “Tổng cộng” chứa tổng số khách được khảo sát tại mỗi khách sạn. Tỷ lệ khách dự định quay lại được tính bằng cách chia số lượng khách đã nói như vậy cho tổng số khách của khách sạn được khảo sát. Sau đó, phép thử χ 2 được sử dụng để so sánh các cổ phần được tính toán.

Để kiểm tra các giả thuyết vô giá trị và thay thế H 0: p 1 = p 2; Н 1: р 1 ≠ р 2 chúng tôi sử dụng phép thử χ 2 -statistics.

Kiểm định Chi bình phương để so sánh hai tỷ lệ. Kiểm định χ 2 -statistic bằng tổng bình phương của sự khác biệt giữa số lần thành công được quan sát và số lần thành công dự kiến, chia cho số lần thành công dự kiến ​​trong mỗi ô của bảng:

Ở đâu f 0- số lượng thành công hoặc thất bại quan sát được trong một ô cụ thể của bảng đặc điểm dự phòng, f e

Kiểm định thống kê χ 2 được tính gần đúng bằng phân phối χ 2 với một bậc tự do.

Hoặc thất bại ở từng ô của bảng dự phòng, bạn cần hiểu rõ ý nghĩa của chúng. Nếu giả thuyết khống là đúng, tức là tỷ lệ thành công ở hai nhóm dân số là bằng nhau, tỷ lệ mẫu được tính cho mỗi nhóm trong số hai nhóm có thể khác nhau chỉ vì lý do ngẫu nhiên và cả hai tỷ lệ đều là ước tính tham số chung của dân số R. Trong trường hợp này, một thống kê kết hợp cả hai tỷ lệ thành một ước tính tham số tổng thể (trung bình) R , biểu thị tổng tỷ lệ thành công trong các nhóm kết hợp (nghĩa là bằng tổng số lần thành công chia cho tổng cỡ mẫu). Sự bổ sung của cô ấy, 1 – , biểu thị tỷ lệ thất bại chung trong các nhóm kết hợp. Sử dụng các ký hiệu có ý nghĩa được mô tả trong bảng ở Hình 2. 1. Bạn có thể rút ra công thức (2) để tính tham số :

Ở đâu - Tỷ lệ trung bình của tính trạng

Để tính số lần thành công dự kiến fe(tức là nội dung dòng đầu tiên của bảng dự phòng), cần nhân cỡ mẫu với tham số . Để tính toán số lần thất bại dự kiến f e(tức là nội dung hàng thứ hai của bảng dự phòng), cần nhân cỡ mẫu với tham số 1 – .

Thống kê kiểm tra được tính toán bằng công thức (1) được tính gần đúng bằng phân bố χ 2 với một bậc tự do. Đối với một mức ý nghĩa α cho trước, giả thuyết không bị bác bỏ nếu thống kê χ 2 được tính toán lớn hơn χ U 2, giá trị tới hạn trên của phân bố χ 2 với một bậc tự do. Do đó, quy tắc quyết định như sau: giả thuyết H 0 bị bác bỏ nếu χ 2 > χ U 2 , ngược lại giả thuyết H 0 không bị lệch (Hình 3).

Cơm. 3. Vùng tới hạn của kiểm định χ 2 để so sánh các cổ phần ở mức ý nghĩa α

Nếu giả thuyết không là đúng thì thống kê χ 2 được tính gần bằng 0 vì bình phương của chênh lệch giữa giá trị quan sát được f 0 và mong đợi fe Các giá trị trong mỗi ô rất nhỏ. Mặt khác, nếu giả thuyết không H 0 là sai và có sự khác biệt đáng kể giữa tỷ lệ thành công trong các quần thể, thì thống kê χ 2 được tính toán phải lớn. Điều này được giải thích bởi sự khác biệt giữa số lần thành công hoặc thất bại được quan sát và dự kiến ​​trong mỗi ô, sự khác biệt này tăng lên khi bình phương. Tuy nhiên, sự đóng góp của sự khác biệt giữa giá trị dự kiến ​​và giá trị quan sát được vào thống kê χ 2 tổng thể có thể không giống nhau. Sự khác biệt thực tế giống nhau giữa f 0f e có thể có tác động lớn hơn đến thống kê χ 2 nếu ô chứa kết quả của một số lượng quan sát nhỏ hơn sự khác biệt tương ứng với số lượng quan sát lớn hơn.

Để minh họa tiêu chí χ 2 để kiểm tra giả thuyết hai cổ phần bằng nhau, chúng ta hãy quay lại kịch bản được mô tả trước đó, kết quả của nó được thể hiện trong Hình 2. 2. Giả thuyết khống (H 0: p 1 = p 2) cho rằng khi so sánh chất lượng dịch vụ ở hai khách sạn, tỷ lệ khách dự định quay lại vào năm sau gần như giống nhau. Để ước tính tham số R, đại diện cho tỷ lệ khách dự định quay lại khách sạn, nếu giả thuyết khống đúng thì giá trị được sử dụng , được tính bằng công thức

Tỷ lệ khách không hài lòng với dịch vụ = 1 – 0,6483 = 0,3517. Nhân hai tỷ lệ này với số lượng khách Beachcomber được khảo sát sẽ cho chúng ta số lượng khách dự kiến ​​​​sẽ quay lại vào mùa tới, cũng như số lượng khách du lịch sẽ không ở lại khách sạn này nữa. Tỷ lệ dự kiến ​​của khách tại khách sạn Windsurfer được tính tương tự:

Có - Beachcomber: = 0,6483, N 1 = 227 do đó f e = 147,16.
Có - Người lướt ván buồm: = 0,6483, N 2 = 262 do đó f e = 169,84.
Không - Beachcomber: 1 – = 0,3517, N 1 = 227 do đó f e = 79,84.
Không - Người lướt ván buồm: 1 – = 0,3517, N 2 = 262 do đó f e = 92,16.

Các tính toán được trình bày trong hình. 4.

Cơm. 4. χ2 thống kê cho khách sạn: (a) dữ liệu ban đầu; (b) Bảng hệ số 2x2 để so sánh quan sát ( f 0 ) và kỳ vọng ( fe) số lượng khách hài lòng và không hài lòng với dịch vụ; (c) tính toán thống kê χ2 khi so sánh tỷ lệ khách hài lòng với dịch vụ; (d) tính toán giá trị tới hạn của phép thử χ 2 -statistic

Để tính giá trị tới hạn của thống kê kiểm tra χ 2, hàm Excel =CHI2.OBR() được sử dụng. Nếu mức ý nghĩa là α = 0,05 (xác suất được thay thế vào hàm CH2.OBR là 1 –α) và phân bố χ 2 cho bảng nhân tố 2×2 có một bậc tự do thì giá trị tới hạn của thống kê χ 2 là 3,841. Vì giá trị thống kê χ 2 được tính toán là 9,053 (Hình 4c) lớn hơn 3,841 nên giả thuyết không bị bác bỏ (Hình 5).

Cơm. 5. Xác định giá trị tới hạn của phép kiểm định χ 2 - thống kê với một bậc tự do với mức ý nghĩa α = 0,05

Xác suất R rằng giả thuyết khống là đúng với thống kê χ 2 bằng 9,053 (và một bậc tự do) được tính trong Excel bằng hàm =1 – CH2.DIST(9.053;1;TRUE) = 0,0026. R-giá trị 0,0026 là xác suất để chênh lệch giữa tỷ lệ mẫu khách hàng hài lòng với dịch vụ tại khách sạn Beachcomber và Windsurfer bằng hoặc lớn hơn 0,718 – 0,588 = 0,13, nếu trên thực tế tỷ lệ của họ trong cả hai quần thể là như nhau . Do đó, có bằng chứng chắc chắn rằng có sự khác biệt có ý nghĩa thống kê về dịch vụ khách giữa hai khách sạn. Nghiên cứu cho thấy số lượng khách hài lòng với dịch vụ tại khách sạn Beachcomber cao hơn số lượng khách dự định quay lại khách sạn Windsurfer lần nữa.

Kiểm tra các giả định liên quan đến bảng hệ số 2x2.Để có được kết quả chính xác từ dữ liệu cho trong bảng 2x2, số lần thành công hoặc thất bại phải lớn hơn 5. Nếu không đáp ứng điều kiện này, kết quả chính xác sẽ Thử nghiệm Fisher.

Khi so sánh tỷ lệ phần trăm khách hàng hài lòng với chất lượng dịch vụ ở hai khách sạn, phép thử Z và χ 2 đều cho kết quả như nhau. Điều này có thể được giải thích bằng sự tồn tại của mối quan hệ chặt chẽ giữa phân phối chuẩn hóa và phân phối χ 2 với một bậc tự do. Trong trường hợp này, thống kê χ 2 luôn là thống kê Z bình phương. Ví dụ: khi đánh giá sự hài lòng của khách, chúng tôi thấy rằng Z-statistic là +3,01 và χ 2 -statistic là 9,05. Bỏ qua các lỗi làm tròn, có thể dễ dàng xác minh rằng giá trị thứ hai là bình phương của giá trị thứ nhất (tức là 3,01 2 = 9,05). Ngoài ra, bằng cách so sánh các giá trị tới hạn của cả hai thống kê ở mức ý nghĩa α = 0,05, chúng ta có thể thấy rằng giá trị χ 1 2 bằng 3,841 là bình phương của giá trị tới hạn trên của thống kê Z bằng + 1,96 (tức là χ 1 2 = Z 2). Hơn thế nữa, R-giá trị của cả hai tiêu chí đều giống nhau.

Vì vậy, có thể lập luận rằng khi kiểm tra các giả thuyết vô giá trị và thay thế H 0: p 1 = p 2; Н 1: р 1 ≠ р 2 tiêu chí Z và χ 2 là tương đương. Tuy nhiên, nếu cần thiết không chỉ để phát hiện sự khác biệt mà còn để xác định phần nào lớn hơn (p 1 > p 2), nênáp dụng phép thử Z với một vùng tới hạn được giới hạn bởi phần cuối của phân bố chuẩn hóa đã được chuẩn hóa. Tiếp theo, chúng tôi sẽ mô tả việc sử dụng phép thử χ 2 để so sánh tỷ lệ của một tính trạng trong một số nhóm. Cần lưu ý rằng tiêu chí Z không thể được áp dụng trong tình huống này.

Ứng dụng phép kiểm χ2 để kiểm định giả thuyết về sự bằng nhau của một số cổ phiếu

Kiểm định chi bình phương có thể được mở rộng cho trường hợp tổng quát hơn và được sử dụng để kiểm định giả thuyết về sự bằng nhau của một số phần của một đặc tính. Chúng ta hãy biểu thị số lượng quần thể độc lập được phân tích bằng chữ cái Với. Bây giờ bảng đặc điểm dự phòng bao gồm hai dòng và Với cột. Để kiểm tra các giả thuyết vô giá trị và thay thế H 0: p 1 = p 2 = … = trang 2, H1: Không phải tất cả Rj bằng nhau (j = 1, 2, …, c), thống kê kiểm định χ 2 được sử dụng:

Ở đâu f 0- số lần thành công hoặc thất bại được quan sát trong một ô cụ thể của bảng hệ số 2* Với, fe- số lần thành công hoặc thất bại về mặt lý thuyết hoặc dự kiến ​​trong một ô cụ thể của bảng dự phòng, với điều kiện giả thuyết không là đúng.

Để tính số lần thành công hoặc thất bại dự kiến ​​trong mỗi ô của bảng dự phòng, bạn phải ghi nhớ những điều sau. Nếu giả thuyết khống là đúng và tỷ lệ thành công trong tất cả các quần thể là bằng nhau thì tỷ lệ mẫu tương ứng có thể khác nhau chỉ vì những lý do ngẫu nhiên, vì tất cả các tỷ lệ đều thể hiện ước tính về tỷ lệ đặc điểm. R trong dân chúng nói chung. Trong trường hợp này, một thống kê kết hợp tất cả các tỷ lệ thành một ước tính tham số tổng thể (hoặc trung bình) R, chứa nhiều thông tin hơn từng thông tin riêng biệt. Thống kê này, ký hiệu là , biểu thị tỷ lệ thành công tổng thể (hoặc trung bình) trong mẫu gộp.

Tính tỷ trọng bình quân:

Để tính số lần thành công dự kiến f eở hàng đầu tiên của bảng dự phòng, cần nhân thể tích của từng mẫu với tham số. Để tính toán số lần thất bại dự kiến f eở dòng thứ hai của bảng dự phòng cần nhân thể tích của từng mẫu với thông số 1 – . Thống kê kiểm tra được tính toán bằng công thức (1) được tính gần đúng bằng phân bố χ 2. Số bậc tự do của phân bố này được cho bởi số lượng (r – 1)(c – 1) , Ở đâu r- số hàng trong bảng hệ số, Với- số cột trong bảng. Đối với bảng nhân tố 2*s số bậc tự do bằng nhau (2 – 1)(s – 1) = s – 1. Đối với mức ý nghĩa α cho trước, giả thuyết không bị bác bỏ nếu thống kê χ 2 được tính toán lớn hơn giá trị tới hạn trên χ U 2 vốn có trong phân phối χ 2 với s – 1 bậc tự do. Do đó, quy tắc quyết định như sau: giả thuyết H 0 bị bác bỏ nếu χ 2 > χ U 2 (Hình 6), nếu không thì giả thuyết bị bác bỏ.

Cơm. 6. Vùng tới hạn của kiểm định χ 2 để so sánh với tỷ trọng ở mức ý nghĩa α

Kiểm tra các giả định liên quan đến bảng hệ số 2*c.Để có được kết quả chính xác dựa trên số liệu cho trong bảng hệ số 2* Với, số lần thành công hay thất bại cần phải đủ lớn. Một số nhà thống kê tin rằng thử nghiệm sẽ cho kết quả chính xác nếu tần số dự kiến ​​lớn hơn 0,5. Các nhà nghiên cứu thận trọng hơn yêu cầu không quá 20% ô trong bảng dự phòng chứa các giá trị kỳ vọng nhỏ hơn 5 và không có ô nào được chứa giá trị kỳ vọng nhỏ hơn một. Điều kiện cuối cùng đối với chúng ta dường như là một sự thỏa hiệp hợp lý giữa những thái cực này. Để thỏa mãn điều kiện này, các danh mục chứa giá trị mong đợi nhỏ phải được kết hợp thành một. Sau này, tiêu chí trở nên chính xác hơn. Nếu vì lý do nào đó việc kết hợp nhiều loại là không thể, nên sử dụng các thủ tục thay thế.

Để minh họa phép thử χ 2 nhằm kiểm tra giả thuyết về sự bình đẳng về cổ phần trong một số nhóm, chúng ta hãy quay lại kịch bản được mô tả ở đầu chương. Hãy xem xét một cuộc khảo sát tương tự trong đó khách của ba khách sạn thuộc công ty T.S. Resort Resources tham gia (Hình 7a).

Cơm. 7. Bảng hệ số 2x3 để so sánh số lượng khách hài lòng và không hài lòng với dịch vụ: (a) số lượng thành công hay thất bại quan sát được - f 0; (b) số lần thành công hoặc thất bại dự kiến ​​– fe; (c) tính thống kê χ2 khi so sánh tỷ lệ khách hài lòng với dịch vụ

Giả thuyết khống cho rằng tỷ lệ khách hàng dự định quay lại trong năm tới gần như giống nhau ở tất cả các khách sạn. Để ước tính tham số R, đại diện cho tỷ lệ khách dự định quay lại khách sạn, giá trị được sử dụng R = X /N= 513/700 = 0,733. Tỷ lệ khách không hài lòng với dịch vụ là 1 – 0,733 = 0,267. Nhân ba phần chia sẻ với số lượng khách được khảo sát ở mỗi khách sạn, chúng tôi có được số lượng khách dự kiến ​​​​sẽ quay lại vào mùa tới, cũng như số lượng khách hàng sẽ không lưu trú tại khách sạn này nữa (Hình 7b).

Để kiểm tra các giả thuyết null và giả thuyết thay thế, số liệu thống kê kiểm tra χ 2 được sử dụng, tính toán bằng cách sử dụng các giá trị kỳ vọng và quan sát được theo công thức (1) (Hình 7c).

Giá trị tới hạn của phép thử χ 2 -statistic được xác định theo công thức =HI2.OBR(). Vì khách của ba khách sạn tham gia khảo sát nên thống kê χ 2 có (2 – 1)(3 – 1) = 2 bậc tự do. Ở mức ý nghĩa α = 0,05, giá trị tới hạn của thống kê χ 2 là 5,991 (Hình 7d). Vì thống kê χ 2 được tính toán là 40,236 vượt quá giá trị tới hạn nên giả thuyết không bị bác bỏ (Hình 8). Mặt khác, xác suất R thực tế là giả thuyết khống đúng với số liệu thống kê χ 2 bằng 40,236 (và hai bậc tự do) được tính trong Excel bằng cách sử dụng hàm =1-CHI2.DIST() = 0,000 (Hình 7d). R-giá trị là 0,000 và nhỏ hơn mức ý nghĩa α = 0,05. Vì vậy, giả thuyết không bị bác bỏ.

Cơm. 8. Lĩnh vực chấp nhận và bác bỏ giả thuyết về sự bằng nhau của ba cổ phần ở mức ý nghĩa 0,05 và hai bậc tự do

Bác bỏ giả thuyết không khi so sánh các tỷ lệ nêu ở bảng nhân tố 2* Với, chỉ có thể nói rằng tỷ lệ khách hài lòng với dịch vụ ở 3 khách sạn không trùng nhau. Để tìm ra thùy nào khác với thùy khác, cần sử dụng các phương pháp khác, chẳng hạn như thủ thuật Marascuilo.

Thủ tục Marascuilo cho phép bạn so sánh tất cả các nhóm theo cặp. Ở giai đoạn đầu tiên của quy trình, sự khác biệt p s j – p s j ’ được tính toán (trong đó jj) giữa s(s – 1)/2 theo cặp cổ phiếu. Các phạm vi tới hạn tương ứng được tính bằng công thức:


Ở mức ý nghĩa tổng thể α, giá trị là căn bậc hai của giá trị tới hạn trên của phân bố chi bình phương có s – 1 bậc tự do. Đối với mỗi cặp phần mẫu, phải tính toán một phạm vi tới hạn riêng biệt. Ở giai đoạn cuối, mỗi s(s – 1)/2 các cặp cổ phiếu được so sánh với phạm vi tới hạn tương ứng. Các cổ phiếu tạo thành một cặp cụ thể được coi là khác biệt có ý nghĩa thống kê nếu chênh lệch tuyệt đối của các cổ phiếu mẫu |p s j – p s j | vượt quá phạm vi quan trọng.

Chúng ta hãy minh họa quy trình của Marascuilo bằng ví dụ về cuộc khảo sát khách của ba khách sạn (Hình 9a). Sử dụng phép kiểm định chi bình phương, chúng tôi thấy rằng có sự khác biệt có ý nghĩa thống kê giữa tỷ lệ khách lưu trú tại khách sạn dự định quay lại vào năm tới. Vì cuộc khảo sát bao gồm khách từ ba khách sạn nên cần thực hiện 3(3 – 1)/2 = 3 so sánh theo cặp và tính toán ba phạm vi quan trọng. Đầu tiên, hãy tính ba phần chia mẫu (Hình 9b). Ở mức ý nghĩa tổng thể là 0,05, giá trị tới hạn trên của thống kê kiểm tra χ 2 đối với phân bố chi bình phương có (c – 1) = 2 bậc tự do được xác định bởi công thức =CI2.ORB(0,95;2) = 5,991. Vì vậy, = 2,448 (Hình 9c). Tiếp theo, chúng tôi tính toán ba cặp chênh lệch tuyệt đối và phạm vi tới hạn tương ứng. Nếu chênh lệch tuyệt đối lớn hơn phạm vi tới hạn của nó thì các cổ phiếu tương ứng được coi là khác biệt đáng kể (Hình 9d).

Cơm. 9. Kết quả của thủ tục Marascuilo để kiểm định giả thuyết về sự bình đẳng về tỷ trọng khách hài lòng của ba khách sạn: (a) dữ liệu khảo sát; (b) tỷ lệ mẫu; (c) giá trị tới hạn trên của kiểm định χ 2 - thống kê đối với phân bố chi bình phương; (d) ba cặp sai khác tuyệt đối và khoảng tới hạn tương ứng

Như chúng ta thấy, với mức ý nghĩa 0,05, mức độ hài lòng của khách nghỉ tại khách sạn Palm Royal (p s2 = 0,858) cao hơn so với khách nghỉ tại khách sạn Golden Palm (p s1 = 0,593) và Palm Princess. khách sạn (ps3 = 0,738). Ngoài ra, mức độ hài lòng của khách tại khách sạn Palm Princess cao hơn so với khách tại khách sạn Golden Palm. Những kết quả này buộc ban quản lý phải phân tích nguyên nhân của những khác biệt này và cố gắng xác định lý do tại sao mức độ hài lòng của khách tại khách sạn Golden Palm lại thấp hơn đáng kể so với khách của các khách sạn khác.

Tài liệu từ cuốn sách Levin và cộng sự Thống kê dành cho nhà quản lý được sử dụng. – M.: Williams, 2004. – tr. 708–730