Bách khoa toàn thư lớn về dầu khí. Ý nghĩa thống kê của các tham số hồi quy và tương quan

Trang 1


Ý nghĩa của mô hình giải quyết các vấn đề nghiên cứu cụ thể nằm ở chỗ nó cho phép chúng ta đưa ra đánh giá định lượng thông số ẩn, phản ánh động lực của hệ thống hai sản phẩm. Khi giải những bài toán như vậy, các khái niệm về bên trong (sản phẩm loại một) và bên ngoài (sản phẩm loại hai) có thể thay đổi. Do đó, trong mô hình sinh tổng hợp protein do V.M. Glushkov và cộng sự xây dựng (1979), vai trò của các sản phẩm loại một và loại hai được đảm nhận bởi các protein điều hòa và cấu trúc, trong mô hình đáp ứng miễn dịch - tế bào gốc và tế bào lympho, tương ứng, trong mô hình điều hòa các cơn co thắt của tim - các chất được vận chuyển tương ứng vào tế bào cơ tim qua mạch vành và qua động mạch chủ.

Việc đánh giá tầm quan trọng của mô hình được đưa ra thông qua tiêu chí /- và /J2 cho từng phương trình riêng biệt.

Giả định về tầm quan trọng của mô hình dựa trên hai điều khoản.

Tất cả điều này không làm giảm tầm quan trọng của mô hình. Đương nhiên, không có iotas thì sự tồn tại của âm nhạc là điều không thể tưởng tượng được.

Cuối cùng, hạn chế tối đa về tầm quan trọng của mô hình hợp đồng như vậy đã được tạo điều kiện thuận lợi bởi thực tế là hầu hết tất cả các quy tắc có hiệu lực trong lĩnh vực này đều có tính chất bắt buộc (bắt buộc) tuyệt đối.

Việc sử dụng phân tích phương sai bên cạnh hồi quy cho phép chúng ta đánh giá không chỉ tầm quan trọng của toàn bộ mô hình mà còn cả tầm quan trọng của các phụ thuộc cụ thể.

Từ dữ liệu được trình bày, cũng cho thấy rằng khi khoan đá cứng hơn, ý nghĩa của mô hình sẽ cao hơn. Bằng chứng về tầm quan trọng của mô hình kết quả xác nhận giả thuyết rằng sự phụ thuộc tuyến tính các thông số đang được xem xét.

Bất chấp những thành công trong việc phát triển lý thuyết ra quyết định, rõ ràng lý thuyết này sẽ vẫn tồn tại trong một thời gian dài ở vị trí trung gian giữa nghệ thuật - khả năng đưa ra quyết định vốn có của nghệ thuật. đến phương tiện này các quyết định - và khoa học như một hệ thống các nguyên tắc, các quy định chung, thủ tục và phương pháp. Tuy nhiên, điều này không làm giảm mức độ liên quan của cuốn sách: số lượng hệ thống máy tính của con người sẽ tăng lên, tầm quan trọng của việc ra quyết định trong các tình huống phức tạp sẽ tăng lên và việc một người giải quyết các vấn đề tương ứng bằng cách sử dụng cũ ( phương pháp chính xác và xác suất). Do đó, tầm quan trọng của các mô hình sử dụng độ bất định được hình thức hóa dựa trên những ý tưởng khác ngoài toán học về cơ hội chỉ có thể tăng lên.

Với cách tiếp cận quy nạp, đặc trưng của quá trình mô hình hóa trong khuôn khổ phân tích hoạt động kinh doanh, mô hình có được bằng cách khái quát hóa các quan sát về các sự kiện cụ thể riêng lẻ, việc xem xét chúng được coi là quan trọng đối với việc ra quyết định. Các mô hình được phát triển theo phương pháp quy nạp để giải quyết vấn đề cụ thể Quản lý kinh tế. Các mô hình bao gồm việc tính đến các thuộc tính cụ thể được hình thành trong lịch sử của quá trình được mô hình hóa. Vấn đề chính của việc xây dựng các mô hình quy nạp là việc lựa chọn từ một tập hợp các quan sát riêng lẻ của những quan sát xác định bản chất của quyết định được đưa ra cũng như trình bày cấu trúc và mối liên hệ của chúng dưới dạng chính thức. Tầm quan trọng của các mô hình quy nạp là bằng cách đơn giản hóa việc mô tả các mối quan hệ, thông tin chứa trong một tập hợp lớn các quan sát sẽ được trình bày dưới dạng trực quan và ngắn gọn. Chất lượng của các mô hình quy nạp không được xác định bởi độ chính xác của việc sao chép thực tế phức tạp thông qua các hệ thống ký hiệu, mà phụ thuộc vào mức độ có thể, một mặt, đơn giản hóa mô hình theo cách đạt được giải pháp cho vấn đề tại một chi phí có thể chấp nhận được nhưng mặt khác lại phản ánh những đặc tính cơ bản của thực tế.

Nếu những loại thỏa thuận lao động này ấn định mức lương, thì khi mức lương thị trường lệch khỏi mức mà người lao động và người sử dụng lao động mong đợi khi họ ký hợp đồng, thì điều tối ưu cho cả người lao động và người sử dụng lao động là thay đổi mức lương danh nghĩa cố định. Do đó, do điều kiện thị trường lao động liên tục thay đổi, sẽ hợp lý khi cho rằng theo thời gian những hợp đồng lao động như vậy sẽ không còn tồn tại. Người lao động và người sử dụng lao động sẽ mong đợi rằng tiền lương danh nghĩa cần được điều chỉnh hàng ngày, dẫn đến tiền lương danh nghĩa sẽ dao động co giãn để đáp ứng với sự thay đổi của cung và cầu trên thị trường lao động. Trên thực tế, sự thật của những lời chỉ trích đó là sự sụt giảm mạnh mẽ trong hoạt động công đoàn trong các ngành công nghiệp Hoa Kỳ vào cuối những năm 1970 và 1980. Tất nhiên, những người lao động không thuộc công đoàn thường có các thỏa thuận lao động chính thức hoặc không chính thức với người sử dụng lao động của họ, nhưng một số nhà kinh tế tin rằng sự sụt giảm tỷ lệ người lao động có công đoàn này là bằng chứng cho thấy tầm quan trọng của mô hình thương lượng tập thể đối với nền kinh tế Hoa Kỳ đang suy giảm.

Hệ số xác định là một thống kê vì các giá trị của nó được tính toán từ dữ liệu quan sát được. Dựa trên hệ số xác định, một quy trình thống kê được xây dựng để kiểm tra mức độ quan trọng của mối quan hệ tuyến tính giữa các yếu tố.

Thống kê kiểm tra tầm quan trọng của toàn bộ phương trình hồi quy là:

Chúng tôi nhận được:

Việc tăng giá trị thống kê tương ứng với việc tăng giá trị thống kê, do đó, một giả thuyết không được chấp nhận khi = không được chấp nhận nếu bất đẳng thức được thỏa mãn, trong đó

Xác suất bác bỏ giả thuyết không chính xác là bằng nhau.

Hãy tính các giá trị tới hạn cho số lượng quan sát khác nhau.

Hãy xem xét một hồi quy tuyến tính đơn giản, vì vậy

Giá trị quan trọng thu được tùy thuộc vào số lượng quan sát:

Nghĩa là, với số lượng quan sát đáng kể, ngay cả những sai lệch nhỏ của giá trị thực tế so với 0 cũng có ý nghĩa quan trọng đối với việc nhận biết. ý nghĩa thống kê hệ số hồi quy, với một biến giải thích có ý nghĩa.

Giá trị trùng với bình phương của hệ số tương quan giữa các biến, kết luận tương tự cũng đúng với hệ số tương quan:

Bây giờ chúng ta xét các hệ số xác định R 2 cho mô hình đầy đủ và mô hình rút gọn. Trong mô hình đầy đủ, giá trị của R2 luôn lớn hơn trong mô hình rút gọn, bởi vì trong một mô hình hoàn chỉnh với m biến giải thích, chúng ta giảm thiểu tổng

cho tất cả các giá trị hệ số. Ví dụ, khi xem xét một mô hình rút gọn, không có biến giải thích thứ m, thì giá trị tối thiểu của tổng được tìm kiếm.

đối với tất cả các giá trị hệ số, giá trị tối thiểu thu được không thể giá trị lớn hơn, thu được bằng cách giảm thiểu tổng độ lệch trên tất cả các giá trị, bao gồm cả các giá trị. Đây là nơi mà thuộc tính hệ số xuất phát.

Để thuận tiện cho quá trình lựa chọn mô hình sử dụng, đề xuất sử dụng biểu mẫu đã điều chỉnh của nó để thay thế

trong đó đưa ra một hình phạt liên quan đến việc tăng số lượng các biến giải thích. Chúng tôi nhận được:

Do đó, một trong những mô hình cạnh tranh có giá trị tối đa có thể được công nhận là mô hình tốt nhất.

Khi so sánh các mô hình cạnh tranh, nếu việc ước tính được thực hiện bằng cách sử dụng cùng một số lượng quan sát thì việc so sánh các mô hình theo độ lớn tương đương với việc so sánh các mô hình đó theo giá trị hoặc. Trong trường hợp này, một mô hình thay thế được chọn với giá trị tối thiểu(hoặc).

Ngoài các hệ số xác định đã được điều chỉnh, khi chọn một trong nhiều mô hình thay thế tiêu chí thông tin được sử dụng, chẳng hạn như tiêu chí Schwartz, tiêu chí Akaike, “phạt” việc tăng các biến giải thích, nhưng sử dụng các phương pháp hơi khác nhau.

Tiêu chí Akaike (Akaike"sinformationcriterion-AIC). Sử dụng tiêu chí này mô hình tuyến tính với các yếu tố giải thích được xây dựng từ các quan sát được so sánh với giá trị

Tổng bình phương còn lại. Bởi vì Khi số lượng biến giải thích tăng lên, số hạng thứ nhất giảm và số hạng thứ hai tăng lên, sau đó từ các mô hình thay thế chúng ta chọn mô hình có giá trị nhỏ nhất, như vậy đạt được sự thỏa hiệp giữa tổng bình phương dư và số lượng giải thích. các nhân tố.

Tiêu chí Schwarz (Schwarz"sinformationcriterion-SC, SIC). Sử dụng tiêu chí này, một mô hình tuyến tính với các yếu tố giải thích, được xây dựng từ các quan sát, được so sánh với giá trị

Và ở đây, cũng giống như khi sử dụng tiêu chí Akaike, việc tăng số lượng các yếu tố giải thích dẫn đến giảm số hạng đầu tiên ở vế phải và tăng số hạng thứ hai. Từ các mô hình thay thế đầy đủ và rút gọn, mô hình có giá trị nhỏ nhất được chọn.

25/07/16 Irina Anichina

33095 0

Trong bài viết này, chúng tôi sẽ nói về cách hiểu liệu chúng tôi đã xây dựng được một mô hình chất lượng cao hay chưa. Rốt cuộc thì đó là mô hình chất lượng cao sẽ cung cấp cho chúng tôi dự báo chất lượng cao.

Nền tảng Prognoz có một danh sách phong phú các mô hình để xây dựng và phân tích. Mỗi mô hình có chi tiết cụ thể riêng và được sử dụng trong các điều kiện khác nhau.

Đối tượng “Model” cho phép bạn xây dựng các mô hình hồi quy sau:

  • Hồi quy tuyến tính (ước lượng bình phương tối thiểu);
  • Hồi quy tuyến tính (ước lượng biến công cụ);
  • Mô hình lựa chọn nhị phân (ước tính khả năng tối đa);
  • Hồi quy phi tuyến tính (ước lượng bình phương tối thiểu phi tuyến tính).

Hãy bắt đầu với mô hình hồi quy tuyến tính. Phần lớn những gì đã nói sẽ áp dụng cho các loài khác.

Mô hình hồi quy tuyến tính (ước lượng OLS)

Ở đâu y- loạt giải thích, x 1 , …, xk- loạt giải thích, e– vectơ lỗi mô hình, b 0 , b 1 , …, b k– hệ số mô hình.

Vậy nên tìm ở đâu?

Hệ số mô hình

Đối với mỗi hệ số trong bảng “Phương trình xác định”, một số thống kê được tính toán: lỗi tiêu chuẩnt-số liệu thống kê, xác suất có ý nghĩa hệ số. Cái sau là phổ biến nhất và cho thấy xác suất loại bỏ một yếu tố tương ứng với một hệ số nhất định khỏi mô hình sẽ không có ý nghĩa đáng kể.

Chúng ta mở bảng và nhìn vào cột cuối cùng, vì đó là cột sẽ cho chúng ta biết ngay về tầm quan trọng của các hệ số.

Không nên có yếu tố nào có xác suất không đáng kể cao trong mô hình.

Như bạn có thể thấy, khi loại trừ yếu tố cuối cùng, các hệ số của mô hình hầu như không thay đổi.

Các vấn đề có thể xảy ra: Phải làm gì nếu theo mô hình lý thuyết của bạn, phải tồn tại một yếu tố có xác suất không đáng kể cao? Có nhiều cách khác để xác định tầm quan trọng của các hệ số. Ví dụ, hãy xem ma trận tương quan nhân tố.

Ma trận tương quan

Bảng tương quan yếu tố chứa Ma trận tương quan giữa tất cả các biến mô hình và cũng xây dựng một đám mây quan sát cho một cặp giá trị đã chọn.

Hệ số tương quan cho thấy sức mạnh của mối quan hệ tuyến tính giữa hai biến. Nó thay đổi từ -1 đến 1. Độ gần với -1 biểu thị mối quan hệ tuyến tính âm, độ gần bằng 1 biểu thị mối quan hệ dương.

Đám mây quan sát cho phép bạn xác định một cách trực quan xem liệu sự phụ thuộc của biến này vào biến khác có phải là tuyến tính hay không.

Nếu có những yếu tố tương quan chặt chẽ với nhau, hãy loại trừ một trong số chúng. Nếu muốn, thay vì mô hình hồi quy tuyến tính thông thường, bạn có thể xây dựng mô hình với các biến công cụ, bao gồm các yếu tố bị loại trừ do tương quan trong danh sách các biến công cụ.

Ma trận tương quan không có ý nghĩa đối với mô hình hồi quy phi tuyến vì nó chỉ thể hiện cường độ tuyến tính sự phụ thuộc.

Tiêu chuẩn chất lượng

Ngoài việc kiểm tra từng hệ số của mô hình, điều quan trọng là phải biết nó tốt đến mức nào về tổng thể. Để thực hiện việc này, hãy tính toán số liệu thống kê nằm trong bảng “Đặc điểm thống kê”.

Hệ số xác định (R 2 ) – thống kê phổ biến nhất để đánh giá chất lượng của một mô hình. R 2 được tính bằng công thức sau:

Ở đâu N- số lượng quan sát; ừ tôi- giá trị của biến giải thích; - giá trị trung bình của biến giải thích; Tôi— các giá trị mô hình được xây dựng từ các tham số ước tính.

R 2 nhận giá trị từ 0 đến 1 và hiển thị tỷ lệ phương sai được giải thích của chuỗi được giải thích. Gần gũi hơn R 2 đến 1 thì mô hình tốt hơn, tỷ lệ không giải thích được càng nhỏ.

Các vấn đề có thể xảy ra: Vấn đề khi sử dụng R 2 là giá trị của nó không giảm khi thêm các thừa số vào phương trình, cho dù chúng tệ đến đâu. Nó được đảm bảo bằng 1 nếu chúng ta thêm nhiều yếu tố vào mô hình bằng số lượng quan sát được. Vì vậy, so sánh các mô hình với số lượng khác nhau yếu tố sử dụng R 2 , vô nghĩa.

Để đánh giá đầy đủ hơn về mô hình, chúng tôi sử dụng hệ số xác định được điều chỉnh (Tính từ R 2 ) . Đúng như tên gọi, chỉ báo này là phiên bản điều chỉnh R 2 , áp dụng “hình phạt” cho từng yếu tố được thêm vào:

Ở đâu k– Số lượng các yếu tố có trong mô hình.

hệ số Tính từ R 2 cũng nhận các giá trị từ 0 đến 1, nhưng sẽ không bao giờ lớn hơn giá trị R 2 .

Tương tự t-thống kê hệ số là Thống kê Fisher (F -số liệu thống kê). Tuy nhiên, nếu t- Thống kê kiểm tra giả thuyết về mức độ không đáng kể của một hệ số, sau đó F-statistics kiểm tra giả thuyết rằng tất cả các yếu tố (trừ hằng số) đều không có ý nghĩa. Nghĩa F-số liệu thống kê cũng được so sánh với số liệu quan trọng và đối với nó, chúng ta cũng có thể nhận được xác suất không đáng kể. Đáng để hiểu rằng bài kiểm tra này kiểm tra giả thuyết rằng tất cả các yếu tố đồng thời là không đáng kể. Do đó, với sự có mặt của các yếu tố không đáng kể, toàn bộ mô hình có thể có ý nghĩa.

Các vấn đề có thể xảy ra: Hầu hết các số liệu thống kê được xây dựng cho trường hợp mô hình bao gồm một hằng số. Tuy nhiên, trong Nền tảng Prognoz, chúng tôi có cơ hội xóa một hằng số khỏi danh sách các hệ số ước tính. Cần hiểu rằng những thao tác như vậy dẫn đến thực tế là một số đặc điểm có thể mang những giá trị không thể chấp nhận được. Vì thế, R 2 Tính từ R 2 trong trường hợp không có hằng số, chúng có thể nhận giá trị âm. Trong trường hợp này, chúng không thể được hiểu là phân số nhận giá trị từ 0 đến 1 nữa.

Đối với các mô hình không có hằng số trong Nền tảng Prognoz, chúng được tính toán hệ số xác định không tập trung(R 2 Tính từ R 2 ). Công thức được sửa đổi đưa giá trị của chúng vào phạm vi từ 0 đến 1, ngay cả trong mô hình không có hằng số.

Hãy xem xét các giá trị của tiêu chí được mô tả cho mô hình trên:

Như chúng ta có thể thấy, hệ số xác định khá lớn nhưng vẫn còn một lượng đáng kể phương sai không giải thích được. Thống kê của Fisher chỉ ra rằng tập hợp các yếu tố chúng tôi đã chọn là có ý nghĩa.

Tiêu chí so sánh

Ngoài các tiêu chí cho phép chúng ta nói về chất lượng của chính mô hình, còn có một số đặc điểm cho phép chúng ta so sánh các mô hình với nhau (với điều kiện là chúng ta đang giải thích cùng một chuỗi trong cùng một khoảng thời gian).

Hầu hết các mô hình hồi quy đều giảm xuống vấn đề tối thiểu hóa tổng số dư bình phương (Tổng của bình phương dư lượng , SSR ) . Do đó, bằng cách so sánh các mô hình theo chỉ số này, có thể xác định mô hình nào giải thích tốt hơn chuỗi đang nghiên cứu. Mô hình này sẽ tương ứng với giá trị nhỏ nhất của tổng bình phương phần dư.

Các vấn đề có thể xảy ra:Điều đáng chú ý là với sự gia tăng số lượng các yếu tố, chỉ số này giống như R 2 , sẽ có xu hướng về giá trị biên (SSR rõ ràng có giá trị biên là 0).

Một số mô hình tập trung vào việc tối đa hóa logarit của hàm khả năng tối đa (Nhật kýL ) . Đối với mô hình hồi quy tuyến tính, những vấn đề này dẫn đến cùng một giải pháp. Dựa trên Nhật kýL Các tiêu chí thông tin được xây dựng thường được sử dụng để giải quyết bài toán lựa chọn cả mô hình hồi quy và mô hình làm mịn:

  • Tiêu chí thông tin Akaike (Akaike Thông tin tiêu chuẩn, AIC)
  • Tiêu chí Schwarz (Schwarz Tiêu chuẩn, S.C.)
  • Phép thử Hannan-Quinn (Hán Nam- Quinn Tiêu chuẩn, trụ sở chính)

Tất cả các tiêu chí đều tính đến số lượng quan sát và số lượng tham số mô hình và khác nhau ở dạng “hàm phạt” đối với số lượng tham số. Quy tắc về tiêu chí thông tin là: Mô hình tốt nhất có giá trị tiêu chí thấp nhất.

Hãy so sánh mô hình của chúng tôi với phiên bản đầu tiên (có hệ số “bổ sung”):

Bạn có thể thấy, Mô hình này mặc dù nó cho tổng số dư bình phương nhỏ hơn, nhưng hóa ra nó lại tệ hơn về mặt tiêu chí thông tin và bằng hệ số xác định đã điều chỉnh.

Phân tích dư lượng

Một mô hình được coi là có chất lượng tốt nếu các phần dư của mô hình không tương quan với nhau. Mặt khác, sẽ có tác động một chiều liên tục lên biến giải thích của các yếu tố không được tính đến trong mô hình. Điều này ảnh hưởng đến chất lượng ước tính của mô hình, khiến chúng không hiệu quả.

Thống kê được sử dụng để kiểm tra phần dư về khả năng tự tương quan bậc một (sự phụ thuộc của giá trị hiện tại vào giá trị trước đó) Durbin-Watson (DW ) . Giá trị của nó nằm trong khoảng từ 0 đến 4. Trong trường hợp không có hiện tượng tự tương quan DW gần bằng 2. Gần bằng 0 biểu thị tự tương quan dương, gần bằng 4 biểu thị tự tương quan âm.

Hóa ra, mô hình của chúng tôi chứa đựng sự tự tương quan của phần dư. Bạn có thể loại bỏ hiện tượng tự tương quan bằng cách áp dụng phép biến đổi “Sự khác biệt” cho biến được giải thích hoặc bằng cách sử dụng một loại mô hình khác - mô hình ARIMA hoặc mô hình ARMAX.

Các vấn đề có thể xảy ra: Thống kê Durbin-Watson không thể áp dụng cho các mô hình không có hằng số, cũng như cho các mô hình sử dụng các giá trị trễ của biến được giải thích làm hệ số. Trong những trường hợp này, số liệu thống kê có thể cho thấy sự vắng mặt của hiện tượng tự tương quan khi nó tồn tại.

Mô hình hồi quy tuyến tính (phương pháp biến công cụ)

Mô hình hồi quy tuyến tính với các biến công cụ là:

Ở đâu y- loạt giải thích, x 1 , …, xk- loạt giải thích, x1 , …,x̃ k– chuỗi giải thích được mô hình hóa bằng cách sử dụng các biến công cụ, z 1 , …, z tôi– các biến công cụ, e, j– vectơ lỗi mô hình, b 0 , b 1 , …, b k– hệ số mô hình, c 0 j, c 1 j, …, c lj – các hệ số của mô hình đối với chuỗi giải thích.

Sơ đồ kiểm tra chất lượng của mô hình cũng tương tự, chỉ có điều nó được thêm vào tiêu chí chất lượng J -số liệu thống kê- tương tự F- Thống kê có tính đến các biến công cụ.

Mô hình lựa chọn nhị phân

Biến giải thích trong mô hình lựa chọn nhị phân là một giá trị chỉ nhận hai giá trị – 0 hoặc 1.

Ở đâu y- loạt giải thích, x 1 , …, xk- loạt giải thích, e– vectơ lỗi mô hình, b 0 , b 1 , …, b k– hệ số mô hình, F– hàm không giảm trả về các giá trị từ 0 đến 1.

Các hệ số của mô hình được tính toán bằng phương pháp tối đa hóa giá trị của hàm khả năng tối đa. Đối với mô hình này, các tiêu chí chất lượng sau sẽ có liên quan:

  • Hệ số xác định McFadden (McFadden R 2 ) - tương tự như thông thường R 2 ;
  • LR-số liệu thống kê và xác suất của nó là tương tự F-số liệu thống kê;
  • Tiêu chí so sánh: Nhật kýL , AIC, S.C., Trụ sở chính.

Hồi quy phi tuyến

Theo mô hình hồi quy tuyến tính, chúng tôi muốn nói đến một mô hình có dạng:

Ở đâu y- loạt giải thích, x 1 , …, xk- loạt giải thích, e– vectơ lỗi mô hình, b– vectơ hệ số của mô hình.

Các hệ số của mô hình được tính toán bằng phương pháp cực tiểu hóa giá trị tổng bình phương của phần dư. Đối với mô hình này, các tiêu chí tương tự sẽ có liên quan như đối với hồi quy tuyến tính, ngoại trừ việc kiểm tra ma trận tương quan. Cũng lưu ý rằng thống kê F sẽ kiểm tra xem toàn bộ mô hình có ý nghĩa so với mô hình hay không y = b 0 + e, ngay cả khi trong mô hình ban đầu hàm f (x 1 , …, xk, b) không có số hạng nào tương ứng với hằng số.

Kết quả

Hãy tóm tắt và trình bày danh sách các đặc điểm được kiểm tra dưới dạng bảng:

Tôi hy vọng bài viết này hữu ích cho độc giả! Lần tới chúng ta sẽ nói về các loại mô hình khác, cụ thể là ARIMA, ARMAX.

Chất lượng của mô hình sẽ được đánh giá bằng tiêu chí Sinh viên và Fisher bằng cách so sánh các giá trị được tính toán với các giá trị được lập bảng.

Để đánh giá chất lượng của mô hình bằng tiêu chí Sinh viên, giá trị thực tế của tiêu chí này (t quan sát)

so với giá trị tới hạn t crđược lấy từ bảng giá trị t có tính đến mức ý nghĩa đã cho ( α = 0,05) và số bậc tự do (n - 2).

Nếu như t quan sát > t cr, thì giá trị thu được của hệ số tương quan cặp được coi là đáng kể.

Giá trị tới hạn tại và bằng .

Hãy kiểm tra ý nghĩa của hệ số xác định bằng cách sử dụng F-Tiêu chí Fisher.

Hãy tính số liệu thống kê F theo công thức:

m = 3– số tham số trong phương trình hồi quy;

N=37– số quan sát trong quần thể mẫu.

Mô hình toán học phân phối thống kê F-statistics là phân phối Fisher với bậc tự do. Giá trị tới hạn của thống kê này đối với và bậc tự do bằng .

tiêu chí Fisher
canxi F F cr Phương trình hồi quy
8916.383 3.276 đầy đủ

Vì vậy, mô hình giải thích 99.8% tổng phương sai tính trạng Y. Điều này cho thấy mô hình được trang bị là phù hợp.


Tính toán các giá trị dự đoán và tổng bình phương độ lệch.

Hãy nhập vào ô Q2 công thức =$F$54*N2+$E$54*O2(tính toán các giá trị dự đoán), sau đó sao chép nó vào các ô Q3:Q38. Đến ô R2 công thức =(P2-Q2)^2(tính tổng bình phương độ lệch), sau đó chép vào các ô R3:R38, và tính tổng các giá trị thu được trong ô R39.

X 2 X 5 Y y(x) (Y - y(x)) 2
605.1 2063.2 1626.7 1589.7 1367.523
620.1 2143.7 1602.5 1650.5 2303.318
2447.7 1880.7 1914.5 1144.709
862.1 2406.4 1982.7 1876.9 11189.53
958.4 2592.9 2026.7 106.5821
1488.9 2193.9 2180.4 182.342
1231.5 2529.7 2152.1 2020.4 17335.88
1429.6 2644.9 2133.1 8814.026
1679.5 2793.7 2344.4 2277.8 4436.216
1326.2 2669.2 2341.7 2135.8 42415.15
1456.8 2211.9 2282.7 5014.463
2523.6 2990.5 2629.8 2543.9 7377.384
2659.8 2017.5 2059.0 1722.637
923.8 2636.6 2009.4 2053.4 1939.955
1173.3 2943.1 2312.8 2792.24
1156.7 2890.9 2400.1 2272.4 16298.85
1450.2 3051.5 2508.1 2432.0 5784.146
1845.2 2684.1 2633.3 2581.453
1566.4 3052.6 2736.6 2449.8 82275.65
1729.7 3349.7 2824.5 2689.8 18152.31
1987.3 3456.3 2880.2 2804.9 5676.928
1902.7 3731.2 2812.9 2992.6 32297.9
1839.1 3517.8 2704.2 2828.0 15336.69
3953.7 3823.1 3224.2 3358.1 17922.28
1351.2 3482.9 2584.7 2731.6 21584.07
1185.3 3347.6 2466.7 2609.0 20246.66
1715.5 3585.4 2928.3 2859.2 4768.047
1536.4 3678.3 3036.4 2900.8 18389.81
1823.1 3801.6 3021.1 3032.3 124.6986
2452.1 4002.1 3237.6 3269.8 1034.273
2076.6 3990.3 3247.1 3206.5 1647.633
2129.2 3436.9 3375.5 3767.099
2502.7 4154.2 3472.8 3387.8 7220.377
2238.7 4322.7 3504.1 3472.0 1028.291
2417.6 4623.1 3357.1 3716.7 129321.2
3838.4 4817.9 4034.7 4065.3 937.7363
1468.6 3450.4 3585.0 18128.14
532666.2



Mẫu báo cáo

Tùy chọn

Biểu phí quảng cáo và đặc điểm tạp chí
Tên tạp chí Y, thuế quan (một trang quảng cáo màu), USD. X 1, khán giả dự kiến, nghìn người X 2, tỷ lệ nam giới X 3, thu nhập trung bình của gia đình, đô la
Audubon 25 315 51,1 38 787
Ngôi nhà và khu vườn tốt hơn 198 000 34 797 22,1
Tuần kinh doanh 68,1 63 667
khắp thế giới 15 452 17,3 44 237
Elle 55 540 12,5 47 211
doanh nhân 40 355 2 476 60,4 47 579
Ngài 71,3 44 715
Vòng tròn gia đình 147 500 24 539 38 759
đầu tiên dành cho phụ nữ 28 059 3 856 3,6 43 850
Forbes 59 340 68,8 66 606
Vận may 3 891 68,8 58 402
Sự hào nhoáng 85 080 7,8
Thông báo Goff 6 250 78,9
Dịch vụ dọn phòng tốt 166 080 25 306 12,6 38 335
người sành ăn 49 640 29,6 57 060
chợ Harper 52 805 2 621 11,5 44 992
Inc. 70 825 66,9
Tài chính cá nhân của Kiplinger 65,1 63 876
Tạp chí Trang chủ Ladies" 127 000 6,8
Mạng sống 63 750 14 220 46,9
tiểu thư 55 910
Cuộc sống của Martha Stewart 93 328 4 849 16,6
McCalls 7,6 33 823
Tiền bạc 98 250 60,6
Xu hướng xe máy 79 800 5 281 88,5 48 739
Địa lý Quốc gia 44 326
Lịch sử tự nhiên
tuần tin tức 148 800 20 720 53,5 53 025
Tạp chí phụ huynh 72 820 18,2
Máy tính PC 40 675 57 916
Mọi người 125 000 33 668
Cơ học phổ biến 86,9
Thông báo của độc giả 42,4 38 060
Sổ đỏ 95 785 13 212 8,9 41 156
Đá lăn 78 920 8 638 59,8 43 212
Thế giới của Á hậu 36 850 2 078 62,9 60 222
khoa học Mỹ 37 500 2 704
mười bảy 71 115 5 738 37 034
Trượt tuyết 32 480 2 249 64,5 58 629
Tiền thông minh 42 900 2 224 63,4
Smithsonian 73 075 8 253 47,9
Bản tóm tắt Opera xà phòng 35 070 7 227 10,3
Những môn thể thao được minh họa 162 000 78,8 45 897
Hoàng hôn 56 000 5 276 38,7 52 524
Thiếu niên 53 250 3 057 15,4
Cái mới người York 62 435 3 223 48,9
Thời gian 162 000 22 798 52,4
Câu chuyện có thật 12,2
Hướng dẫn sử dụng tivi 42,8 37 396
CHÚNG TA. Tin tức & Báo cáo Thế giới 98 644 9 825 57,5 52 018
Hội chợ phù phiếm 67 890 4 307 27,7
tạp chí thời trang 63 900 12,9 44 242
Ngày của phụ nữ 137 000 22 747 6,7
Phụ nữ làm việc 87 500 6,3 44 674
YM 73 270 14,4 43 696
Giá trị trung bình 83 534 39,7 47 710
Độ lệch chuẩn 25,9 10 225

Câu hỏi kiểm soát

Hồi quy theo cặp

1. Hồi quy cặp nghĩa là gì?

2. Khi xây dựng phương trình hồi quy cần giải quyết những vấn đề gì?

3. Sử dụng phương pháp nào để lựa chọn loại mô hình hồi quy?

4. Hàm nào thường được sử dụng nhất để xây dựng phương trình cặp?

5. Nô-ê hồi quy?

6. Hệ phương trình chuẩn của phương pháp cực tiểu có dạng như thế nào?

7. Hình vuông trong trường hợp hồi quy tuyến tính?

8. Chỉ số xác định được tính như thế nào và nó thể hiện điều gì?

9. Tầm quan trọng của phương trình hồi quy được kiểm tra như thế nào?

10. Kiểm tra ý nghĩa của các hệ số phương trình hồi quy như thế nào?

11. Khái niệm khoảng tin cậy của hệ số hồi quy.

12. Khái niệm điểm và dự báo khoảng thời gian theo phương trình hồi quy tuyến tính.

13. Cách tính hệ số đàn hồi và nó thể hiện điều gì E, hệ số trung bìnhđộ đàn hồi Ý ?

Hồi quy bội

1. Hồi quy bội có nghĩa là gì?

2. Mô hình hồi quy tuyến tính bội khác với mô hình hồi quy tuyến tính ghép đôi như thế nào? Viết phương trình hồi quy tuyến tính bội.

3. Khi xây dựng phương trình hồi quy cần giải quyết những vấn đề gì?

4. Vấn đề gì được giải quyết khi xác định mô hình?

5. Các yêu cầu đối với các yếu tố có trong phương trình hồi quy là gì?

6. Sự cộng tuyến của các yếu tố có ý nghĩa gì?

7. Kiểm tra tính cộng tuyến như thế nào?

8. Những phương pháp nào được sử dụng để khắc phục mối tương quan giữa các yếu tố?

9. Hàm nào thường được sử dụng nhất để xây dựng phương trình? hồi quy bội?

10. Công thức nào được sử dụng để tính chỉ số tương quan bội?

11. Chỉ số xác định bội số được tính như thế nào?

12. Hệ số xác định là gì? Làm thế nào nó có thể được sử dụng để đánh giá tính phù hợp của mô hình?

13. Nó có nghĩa là gì giá trị thấp hệ số tương quan bội?

14. Tầm quan trọng của phương trình hồi quy và các hệ số riêng lẻ được kiểm tra như thế nào?

15. Các giả thuyết được xây dựng như thế nào để kiểm tra tầm quan trọng của các tham số mô hình?

16. Phương trình hồi quy từng phần được xây dựng như thế nào?

17. Hệ số đàn hồi từng phần trung bình được tính như thế nào?

18. Khoảng tin cậy được xây dựng cho các tham số mô hình như thế nào?

19. Tính đồng nhất của một dãy số dư có nghĩa là gì?

20. Giả thuyết về tính đồng nhất của một số phần dư được kiểm định như thế nào?

21. Biến phụ thuộc trong mô hình được gọi là gì?

22. Các biến độc lập được gọi trong mô hình là gì?

23. Kể tên phương pháp chính để xây dựng mô hình.

24. Viết mô hình hồi quy bội trong nhìn chung với 3 biến độc lập

25. Viết tổng bình phương độ lệch của mô hình (công thức)

26. RSS là gì? (định nghĩa và công thức)

27. Làm thế nào để kiểm tra ý nghĩa tổng thể của mô hình được xây dựng?

28. Làm thế nào để kiểm tra ý nghĩa của hệ số đối với biến X_3?

29. Xây dựng ý nghĩa kinh tế của hệ số ví dụ với biến X_5

30. “Mô hình ngắn” của hồi quy bội là gì

Văn học

1. Shanchenko, N. I. Kinh tế lượng: xưởng thí nghiệm: hướng dẫn/N. I. Shanchenko. – Ulyanovsk: Đại học Kỹ thuật Bang Ulyanovsk, 2011. – 117 tr.

2. Davnis V.V., Tinyakova V.I. Hội thảo máy tính về mô hình kinh tế lượng. Voronezh, 2003. - 63 tr.


Dữ liệu ban đầu mô tả giá bán của một sản phẩm nhất định tại một số thời điểm nhất định. Cần phải được xây dựng mô hình hồi quyđộng lực của sự thay đổi chỉ số này. Các yếu tố được cho là ảnh hưởng đến giá trị này bao gồm giá bán của sản phẩm thay thế, khối lượng bán sản phẩm, số lượng chi phí quảng cáo và chi phí quảng cáo trung bình.

Giá bán là một đại lượng phụ thuộc, ký hiệu là Y.

Các yếu tố ảnh hưởng (có lẽ) đến giá trị của Y sẽ được ký hiệu là X i: X 1 – giá của sản phẩm thay thế, X 2 – khối lượng bán hàng, X 3 – khối lượng chi phí quảng cáo, X 4 – chi phí quảng cáo trung bình.

Dữ liệu ban đầu

Kiểm tra tầm quan trọng của mô hình bằng cách sử dụng thử nghiệm tỷ lệ khả năng (thử nghiệm Wald) bắt đầu bằng việc đưa ra giả thuyết chính:

Để kiểm tra giả thuyết này, số liệu thống kê mẫu được tính toán

Ở đây lnL là giá trị logarit lớn nhất của hàm khả năng và lnL0 là giá trị logarit của hàm khả năng nếu giả thuyết chính là đúng.

Nếu giả thuyết chính là đúng thì thống kê mẫu (4.7.1) được phân bố theo định luật 2 với (m-1) bậc tự do. Ranh giới của vùng tới hạn bên phải K2 được tìm bằng cách sử dụng bảng các điểm tới hạn chi bình phương theo mức ý nghĩa (1-b) và (m-1) bậc tự do. Nếu bất đẳng thức xảy ra:

thì giả thuyết chính bị bác bỏ, giả thuyết thay thế được chấp nhận và chúng ta nói, rằng mô hình có ý nghĩa thống kê. Ngược lại, họ chấp nhận giả thuyết rằng mô hình không có ý nghĩa và tiến hành sửa đổi nó.

Đối với các mô hình lựa chọn nhị phân, tầm quan trọng của các yếu tố được kiểm tra bằng cách kiểm tra từng giả thuyết хi, i=1,…, (m-1) có dạng:

Số liệu thống kê mẫu được sử dụng để kiểm tra các giả thuyết này có tính chất tiệm cận phân phối bình thường và được gọi là thống kê z. Ranh giới của vùng tới hạn hai phía được tìm kiếm bằng cách sử dụng bảng Laplace ở mức ý nghĩa cho trước (1-b).

Nếu bất đẳng thức xảy ra:

K 1

khi đó họ chấp nhận giả thuyết chính về sự khác biệt không đáng kể so với 0 của hệ số i và kết luận rằng hệ số tương ứng là không đáng kể đối với mô hình.

Đối với các mô hình lựa chọn nhị phân, khái niệm hệ số xác định không được xác định. Tuy nhiên, cái gọi là hệ số xác định giả được xác định cho chúng, hệ số này không còn đặc trưng cho khả năng giải thích của mô hình nữa.

Định nghĩa 4.7.1. Hệ số giả của việc xác định là giá trị sau:

Định nghĩa 4.7.2. Chỉ số tỷ lệ khả năng McFadden là đặc điểm:

Cần nhấn mạnh rằng nếu các tham số của mô hình lựa chọn nhị phân không khác biệt đáng kể so với 0 thì cả hai hệ số được đưa ra đều bằng 0.

Trong bài giảng, chúng ta đã xem xét các mô hình hồi quy phi tuyến, đặc biệt là các mô hình cho biến phụ thuộc nhị phân. Chúng tôi đã kiểm tra các mô hình này để tìm hai hàm hồi quy: logit (chúng tôi đã sử dụng hàm logistic) và probit (chúng tôi đã sử dụng hàm phân phối của luật phân phối chuẩn chuẩn). Ước tính tham số cho các hàm hồi quy như vậy được lấy bằng phương pháp khả năng tối đa. Mô hình được kiểm tra bằng phép thử Wald, dựa trên số liệu thống kê có phân bố chi bình phương. Khi nghiên cứu các mô hình hồi quy đa biến, chúng tôi giải thích các ước lượng tham số trong j là tác động biên của các biến độc lập lên y. Hãy quay trở lại mô hình lựa chọn nhị phân. Nếu chúng ta cố gắng tìm đạo hàm của P(Y=1|X), chúng ta sẽ đi đến biểu thức sau:

trong đó Z= 0+1x1+...m-1xm-1.

Theo định lý về đạo hàm của hàm phức và từ tính chất mật độ (đạo hàm của hàm phân bố là mật độ phân bố f(Z)), ta thu được:

hoặc sử dụng ký hiệu thứ hai để ước tính tham số:

P(Y=1|X)=вjf(Z)

Như trước đây, bj biểu thị ước tính của các tham số chưa biết.

Khi đó, chúng ta có thể suy luận như sau: mật độ phân bố luôn không âm nên dấu của đạo hàm

sẽ chỉ phụ thuộc vào dấu của các ước lượng tham số, nhưng sẽ là hàm của tất cả các biến độc lập. Hơn nữa, nếu ước lượng tham số là dương thì việc tăng biến xj sẽ dẫn đến tăng xác suất

và nếu ước tính tham số là âm thì xác suất được chỉ định sẽ giảm.

Bình luận. Nếu yếu tố x là một biến nhị phân thì khái niệm tác động cận biên không thể được đưa ra cho nó.

Đối với mỗi biến x (định lượng!!!), cái gọi là hiệu ứng biên trung bình được đưa ra. Để làm điều này, hãy tính giá trị trung bình mẫu cho các biến định lượng và tỷ lệ phần trăm “1” cho các biến nhị phân, rồi thay chúng vào biểu thức cho mật độ phân bố thay vì các biến.

Một câu hỏi thảo luận khác: làm thế nào để dự đoán giá trị của y sau khi ước lượng các tham số của mô hình logit (probit)? Ví dụ, tiến hành như sau. Thay thế các giá trị tìm thấy của ước tính tham số và các giá trị của xj vào Z và tính giá trị của biến. Nếu Z>0 thì coi Y=1, nếu Z<0, то считают, что У=0. Замечание. Мы рассмотрели ситуацию, когда переменная у была измерена в номинальной шкале, но принимала всего два значения: 0 и 1. В общем случае, когда у может принимать несколько значений, например 0, 1, 2, 3, используют множественный (по у!!) логит или пробит. Кроме того, у может быть измерен в порядковой шкале, тогда в Стате используют порядковый логит (пробит) ologit (oprobit).

Bình luận. Rất thường xuyên trong nghiên cứu cần phải tiến hành nghiên cứu trên một mẫu cắt ngắn. Ví dụ: nếu nghiên cứu về thu nhập hộ gia đình, sẽ có những trường hợp người trả lời có thu nhập rất cao (ví dụ: hơn 1 triệu rúp) phải bị loại khỏi nghiên cứu, tức là

Trong những trường hợp như vậy, mô hình Tobit được sử dụng.

F(0+1x1+...m-1xm-1)

F(0+1x1+...m-1xm-1)

F(0+1x1+...m-1xm-1)

F(0+1x1+...m-1xm-1) - (F(0+1x1+...m-1xm-1))2