Các loại dữ liệu thống kê Chủ đề thống kê, thuật ngữ cơ bản và chức năng của thống kê. Bản chất của thống kê. Sai số trong quan sát thống kê

Khái niệm “thống kê” xuất phát từ tiếng Latin “trạng thái”, dịch ra có nghĩa là vị trí, điều kiện, trật tự của các hiện tượng.

Sự phát triển của số học chính trị (Anh) và khoa học nhà nước

(Đức) đã dẫn đến sự xuất hiện của khoa học thống kê.

Thuật ngữ “thống kê” được các nhà toán học tại Đại học Göttingen đưa vào lưu hành khoa học vào thế kỷ 18 (Gottfried Achenwall (1719-1772)).

Hiện nay có khoảng 150 định nghĩa về thống kê như một ngành khoa học. Một trong những định nghĩa hay nhất về thống kê được đưa ra bởi nhà toán học người Áo Abraham Wald: “Thống kê là một tập hợp các phương pháp cho phép chúng ta đưa ra quyết định tối ưu trong những điều kiện không chắc chắn”.

Trong số các định nghĩa khác nhau về số liệu thống kê cho y học thực hành, định nghĩa sau đây được áp dụng nhiều nhất:

"Số liệu thống kê là khoa học thu thập, phân loại và định lượng dữ liệu để có được kết luận, dự đoán và quyết định đáng tin cậy."

Số liệu thống kê nghiên cứu hiện tượng khối lượng ngẫu nhiên. Hiện tượng khối lượng- đây là những hiện tượng xảy ra với số lượng lớn nhưng khác nhau về mức độ của một đặc điểm nhất định. Số lượng đối tượng được nghiên cứu càng nhiều thì kết luận thống kê càng đáng tin cậy.

Thống kê bao gồm thống kê lý thuyết (tổng quát) và thống kê ứng dụng

thống kê (kinh tế, xã hội, ngành).

Thống kê ngành bao gồm khí tượng (thống kê dự báo thời tiết), giao thông, kinh tế, sinh học và y tế.

Thống kê lý thuyết được chia thành mô tả(mô tả) và phân tích (quy nạp).

Thống kê mô tả- Đây là những số liệu thống kê để thu thập dữ liệu chung. Nó là một tập hợp các phương pháp để thu thập, nhóm, phân loại dữ liệu nguồn và trình bày chúng dưới dạng thuận tiện cho việc xử lý tiếp theo (bảng, biểu đồ).

Thống kê phân tích là thống kê các suy luận và dự đoán dựa trên việc xử lý toán học các kết quả được cung cấp bởi thống kê mô tả. Nó bao gồm các phương pháp để thu được các kết luận và kết luận thống kê khác nhau nhằm mục đích ứng dụng thực tế.

Thống kê y tế là thống kê ngành, một tập hợp các phương pháp thống kê ứng dụng được sử dụng trong y học khoa học, thực tiễn và chăm sóc sức khỏe.

Nhiệm vụ chính của thống kê y tế:

ü thống kê về mức sinh và mức chết;

ü thống kê bệnh tật;

ü thống kê về hoạt động của các cơ sở chăm sóc sức khỏe.

Thống kê mô tả và phân tích cùng nhau giải quyết vấn đề sau:

ü thu thập dữ liệu và mô tả chúng dưới dạng thuận tiện cho việc xử lý thống kê;

ü xử lý kết quả bằng phương pháp thống kê lý thuyết (tổng quát);

ü phân tích kết quả thu được, dự báo, phát triển các giải pháp tối ưu.

2. CÁC KHÁI NIỆM CƠ BẢN VỀ THỐNG KÊ MÔ TẢ

VÀ ĐẶC ĐIỂM CỦA HỌ.

Các khái niệm cơ bản của thống kê mô tả bao gồm:

ü dân số thống kê (chung và mẫu);

ü số lượng dân số;

ü tùy chọn thống kê;

ü dấu thống kê;

ü tần số thống kê (tần số tuyệt đối);

ü tần số (tần số tương đối).

Thống kê dân số- đây là tập hợp các đối tượng được kết hợp theo một đặc điểm nào đó để nghiên cứu thống kê.

Các loại cốt liệu:

  1. Dân số nói chung (hữu hạn hoặc vô hạn).
  2. Dân số mẫu (mẫu).

Dân số- đây là tổng thể của tất cả các đối tượng của bộ thống kê được chọn để nghiên cứu.

Dân số hữu hạn- một quần thể thống kê trong đó số lượng đối tượng nghiên cứu có đặc điểm nhất định bị hạn chế.

Ví dụ: số lượng sinh viên trong học viện, số lượng cư dân trong thành phố, số lượng phép đo trong các thí nghiệm.

Dân số vô hạn là một tập hợp thống kê trong đó số lượng đối tượng bằng vô cùng. Được sử dụng trong tính toán lý thuyết như một sự trừu tượng hóa toán học.

Dân số mẫu (mẫu)- đây là một phần dân số nói chung được dùng để nghiên cứu tĩnh.

Mật độ dân số là số lượng đối tượng có trong bộ sưu tập.

Quy mô dân số được biểu thị bằng ký hiệu N và chọn lọc - N .

Tùy chọn thống kê là một đối tượng trong tổng thể, một quan sát hoặc phép đo đơn lẻ.

Các tùy chọn được ký hiệu bằng các chữ cái Latinh x, y, z với các chỉ số dưới chỉ số tùy chọn.

Ví dụ: x 1 - đối tượng hoặc chiều thứ nhất,

x 2 - đối tượng hoặc chiều thứ hai, v.v.

Tùy chọn không chỉ định số được gọi khái quátlựa chọn và được biểu thị bằng một chữ cái Latinh có chỉ số dưới, ví dụ: x tôi .

Các biến thể (đối tượng) của một tổng thể thống kê được đặc trưng bởi nhiều đặc điểm khác nhau, bao gồm cả những đặc điểm mà trên cơ sở đó chúng được kết hợp thành một tổng thể.

Một đặc điểm làm thay đổi ý nghĩa của nó từ vật này sang vật khác được gọi là dấu hiệu thay đổi, và hiện tượng đó được gọi là biến thể.

Đặc điểm định tính- đây là những dấu hiệu không có biểu hiện định lượng. Đây là những thuộc tính không thể đo lường được.

Ví dụ: màu sắc, mùi vị, mùi vị.

Đặc điểm định lượng- Đây là những đặc điểm có thể đo lường được thể hiện bằng một con số nhất định.

Ví dụ: trọng lượng, chiều dài, mật độ, nhiệt độ.

Đặc điểm định lượng rời rạc- Đây là những đặc điểm định lượng được thể hiện bằng số nguyên.

Ví dụ: số học sinh trong một nhóm, số hành khách trên xe buýt, số cánh hoa trên một bông hoa.

Đặc điểm định lượng liên tục- đây là những đặc điểm định lượng được thể hiện bằng cả số nguyên và số phân số.

Ví dụ: dưa hấu nặng 7 kg, dưa nặng 1,7 kg.

Dấu ngắt là một đặc tính định lượng, giá trị số của nó nằm trong các ranh giới nhất định gọi là khoảng.

Ví dụ: khi đo chiều cao của học sinh, có thể phân biệt các nhóm khoảng 160 - 169 cm, 170 - 179 cm, 180 - 190 cm.

Tần suất xuất hiện (tần số tuyệt đối)- một con số cho biết số lần một đối tượng có giá trị số cho trước của một đặc tính xuất hiện trong một quần thể hoặc khoảng của nó.

Tần số tuyệt đối được biểu thị bằng ký hiệu và tôi (µi).

Tổng của tất cả các tần số tuyệt đối bằng thể tích của quần thể N mà tần số được tính: ∑n i = N

Ví dụ: số nam và số nữ trong một nhóm phải bằng tổng số học sinh của nhóm đó.

Tần số (tần số tương đối)- một con số bằng tỉ số giữa tần số tuyệt đối và thể tích của dân số.

Tần số được biểu thị bằng ký hiệu f và được tính bằng công thức:

theo phân số của một đơn vị: tôi = ,

theo tỷ lệ phần trăm: tôi = 100%

Đây và tôi - tần số tuyệt đối, N - khối lượng dân số, bằng tổng của tất cả các tần số tuyệt đối.

Tổng của tất cả các tần số tương đối bằng 1: ∑ tôi = 1

Ví dụ: trong một nhóm sinh viên gồm 15 người (số dân N=15) 12 nữ sinh (tần suất tuyệt đối N 1 =12) và 3 học sinh (tần suất tuyệt đối N 2 =3). Tính thường xuyên f 1 sẽ bằng 15/12 và tần số f 2 = 15/3. Trong trường hợp này, tổng tần số hoặc tần số tương đối bằng đơn vị.

Trong thống kê, tần số hoặc tần số tương đối được gọi là trọng số.

3. CÁC DÒNG PHÂN PHỐI, LOẠI VÀ PHƯƠNG PHÁP TRÌNH BÀY.

Phạm vi phân phối là một dãy số biểu thị giá trị định tính hoặc định lượng của một đặc tính và tần suất xuất hiện của nó.

Các loại chuỗi phân phối được phân loại theo các nguyên tắc khác nhau.

Theo mức độ đặt hàng, các hàng được chia thành:

ü rối loạn

ü đã ra lệnh

Hàng không có thứ tự- đây là một chuỗi trong đó các giá trị của một đặc tính được viết theo thứ tự các tùy chọn xuất hiện trong quá trình nghiên cứu.

Ví dụ: Khi nghiên cứu chiều cao của một nhóm học sinh, giá trị của nó được ghi bằng cm (175,170,168,173,179).

Chuỗi đặt hàng- đây là một chuỗi thu được từ một chuỗi không có thứ tự trong đó các giá trị của đặc tính được viết lại theo thứ tự tăng dần hoặc giảm dần. Một chuỗi có thứ tự được gọi là xếp hạng và thủ tục xếp hạng

(thứ tự) được gọi là sắp xếp.

Ví dụ: (Chiều cao 168,170,173,175,179)

Theo loại đặc điểm, chuỗi phân phối được chia thành:

ü thuộc tính

ü biến thể.

Chuỗi thuộc tính- đây là một bộ truyện được biên soạn trên cơ sở đặc tính định tính.

Chuỗi biến thể- đây là một bộ truyện được biên soạn trên cơ sở đặc tính định lượng.

Chuỗi biến thể được chia thành rời rạc, liên tục và khoảng thời gian.

Chuỗi biến thể rời rạc, liên tục và tích phân được đặt tên theo đặc điểm tương ứng làm cơ sở cho việc biên soạn chuỗi. Ví dụ: chuỗi theo cỡ giày là rời rạc theo trọng lượng cơ thể - liên tục.

Các phương pháp biểu diễn chuỗi trong y học thực tiễn và khoa học được chia thành ba nhóm:

  1. Trình bày dưới dạng bảng;
  2. Biểu diễn phân tích (dưới dạng công thức);
  3. Biểu diễn đồ họa.

phương pháp thống kê

phương pháp thống kê- Phương pháp phân tích dữ liệu thống kê. Có các phương pháp thống kê ứng dụng có thể được sử dụng trong mọi lĩnh vực nghiên cứu khoa học và bất kỳ lĩnh vực nào của nền kinh tế quốc dân, cũng như các phương pháp thống kê khác mà khả năng áp dụng của chúng bị giới hạn trong một hoặc một lĩnh vực khác. Điều này đề cập đến các phương pháp như kiểm soát chấp nhận thống kê, kiểm soát thống kê các quy trình công nghệ, độ tin cậy và thử nghiệm cũng như lập kế hoạch thí nghiệm.

Phân loại phương pháp thống kê

Các phương pháp thống kê phân tích dữ liệu được sử dụng trong hầu hết các lĩnh vực hoạt động của con người. Chúng được sử dụng bất cứ khi nào cần thiết để đạt được và biện minh cho bất kỳ phán đoán nào về một nhóm (đối tượng hoặc chủ thể) có tính không đồng nhất bên trong.

Nên phân biệt ba loại hoạt động khoa học và ứng dụng trong lĩnh vực phương pháp thống kê phân tích dữ liệu (theo mức độ đặc thù của các phương pháp liên quan đến việc đi sâu vào các vấn đề cụ thể):

a) phát triển và nghiên cứu các phương pháp có mục đích chung mà không tính đến các chi tiết cụ thể của lĩnh vực ứng dụng;

b) phát triển và nghiên cứu các mô hình thống kê về các hiện tượng và quá trình thực tế phù hợp với nhu cầu của một lĩnh vực hoạt động cụ thể;

c) áp dụng các phương pháp và mô hình thống kê để phân tích thống kê các dữ liệu cụ thể.

Thống kê áp dụng

Mô tả về loại dữ liệu và cơ chế tạo ra nó là bước khởi đầu của bất kỳ nghiên cứu thống kê nào. Cả hai phương pháp xác định và xác suất đều được sử dụng để mô tả dữ liệu. Sử dụng các phương pháp xác định, chỉ có thể phân tích dữ liệu có sẵn cho nhà nghiên cứu. Ví dụ, với sự trợ giúp của họ, các bảng đã được tính toán bởi các cơ quan thống kê chính thức của nhà nước dựa trên các báo cáo thống kê do các doanh nghiệp và tổ chức đệ trình. Các kết quả thu được có thể được chuyển giao cho một quần thể rộng hơn và chỉ được sử dụng để dự đoán và kiểm soát trên cơ sở mô hình thống kê xác suất. Vì vậy, chỉ những phương pháp dựa trên lý thuyết xác suất mới được đưa vào thống kê toán học.

Chúng tôi không cho rằng có thể đối chiếu các phương pháp xác định và thống kê xác suất. Chúng tôi coi chúng là các bước phân tích thống kê tuần tự. Ở giai đoạn đầu tiên, cần phân tích dữ liệu có sẵn và trình bày nó ở dạng dễ đọc bằng bảng và biểu đồ. Sau đó, nên phân tích dữ liệu thống kê trên cơ sở các mô hình xác suất và thống kê nhất định. Lưu ý rằng khả năng hiểu sâu hơn về bản chất của một hiện tượng hoặc quá trình thực tế được đảm bảo bằng sự phát triển của một mô hình toán học đầy đủ.

Trong tình huống đơn giản nhất, dữ liệu thống kê là giá trị của một số đặc tính đặc trưng của đối tượng đang được nghiên cứu. Các giá trị có thể mang tính định lượng hoặc cung cấp dấu hiệu về danh mục mà đối tượng có thể được phân loại. Trong trường hợp thứ hai, họ nói về một dấu hiệu định tính.

Khi đo bằng một số đặc điểm định lượng hoặc định tính, chúng ta thu được một vectơ làm dữ liệu thống kê về một đối tượng. Nó có thể được coi là một loại dữ liệu mới. Trong trường hợp này, mẫu bao gồm một tập hợp các vectơ. Có một phần tọa độ - số và một phần - dữ liệu định tính (được phân loại), sau đó chúng ta đang nói về một vectơ gồm các loại dữ liệu khác nhau.

Một phần tử của mẫu, tức là một chiều, có thể là toàn bộ hàm. Ví dụ, mô tả động lực học của chỉ báo, tức là sự thay đổi của nó theo thời gian, là điện tâm đồ của bệnh nhân hoặc biên độ nhịp của trục động cơ. Hoặc một chuỗi thời gian mô tả động lực hoạt động của một công ty cụ thể. Sau đó, mẫu bao gồm một tập hợp các chức năng.

Các phần tử mẫu cũng có thể là các đối tượng toán học khác. Ví dụ, mối quan hệ nhị phân. Vì vậy, khi khảo sát các chuyên gia, họ thường sử dụng thứ tự (xếp hạng) các đối tượng kiểm tra - mẫu sản phẩm, dự án đầu tư, các phương án đưa ra quyết định quản lý. Tùy theo quy định của nghiên cứu chuyên gia, các phần tử lấy mẫu có thể là các loại quan hệ nhị phân (thứ tự, phân vùng, dung sai), tập hợp, tập mờ, v.v..

Vì vậy, bản chất toán học của các phần tử mẫu trong các bài toán thống kê ứng dụng khác nhau có thể rất khác nhau. Tuy nhiên, có thể phân biệt hai loại dữ liệu thống kê - số và phi số. Theo đó, thống kê ứng dụng được chia thành hai phần - thống kê số và thống kê phi số.

Thống kê số là số, vectơ, hàm. Chúng có thể được cộng và nhân với các hệ số. Vì vậy, trong thống kê số, các khoản tiền khác nhau có tầm quan trọng rất lớn. Công cụ toán học để phân tích tổng các phần tử ngẫu nhiên của một mẫu là các định luật (cổ điển) về số lớn và định lý giới hạn trung tâm.

Dữ liệu thống kê phi số là dữ liệu được phân loại, vectơ thuộc các loại đối tượng khác nhau, quan hệ nhị phân, tập hợp, tập mờ, v.v. Chúng không thể cộng và nhân với các hệ số. Vì vậy, sẽ vô nghĩa khi nói về tổng các số liệu thống kê không phải là số. Chúng là các phần tử của không gian toán học phi số (tập hợp). Bộ máy toán học để phân tích dữ liệu thống kê phi số dựa trên việc sử dụng khoảng cách giữa các phần tử (cũng như thước đo độ gần, chỉ số khác biệt) trong các không gian đó. Với sự trợ giúp của khoảng cách, các giá trị trung bình thực nghiệm và lý thuyết được xác định, định luật số lớn được chứng minh, các ước tính phi tham số về mật độ phân bố xác suất được xây dựng, các vấn đề chẩn đoán và phân tích cụm được giải quyết, v.v. (xem).

Nghiên cứu ứng dụng sử dụng nhiều loại dữ liệu thống kê. Điều này đặc biệt là do các phương pháp để có được chúng. Ví dụ: nếu việc thử nghiệm một số thiết bị kỹ thuật tiếp tục cho đến một thời điểm nhất định, thì chúng ta sẽ nhận được cái gọi là. dữ liệu được kiểm duyệt bao gồm một bộ số - thời gian hoạt động của một số thiết bị trước khi hỏng hóc và thông tin cho thấy các thiết bị còn lại vẫn tiếp tục hoạt động khi kết thúc thử nghiệm. Dữ liệu được kiểm duyệt thường được sử dụng trong việc đánh giá và giám sát độ tin cậy của các thiết bị kỹ thuật.

Thông thường, các phương pháp thống kê để phân tích dữ liệu thuộc ba loại đầu tiên được xem xét riêng biệt. Hạn chế này là do thực tế đã lưu ý ở trên là bộ máy toán học để phân tích dữ liệu có tính chất phi số khác biệt đáng kể so với dữ liệu ở dạng số, vectơ và hàm.

Mô hình thống kê xác suất

Khi áp dụng các phương pháp thống kê vào các lĩnh vực tri thức, lĩnh vực cụ thể của nền kinh tế quốc dân, chúng ta thu được các ngành khoa học và thực tiễn như “phương pháp thống kê trong công nghiệp”, “phương pháp thống kê trong y học”… Từ góc nhìn này, kinh tế lượng là “phương pháp thống kê”. các phương pháp kinh tế”. Các môn học thuộc nhóm b) này thường dựa trên các mô hình thống kê xác suất được xây dựng phù hợp với đặc điểm của lĩnh vực ứng dụng. Sẽ rất hữu ích khi so sánh các mô hình thống kê xác suất được sử dụng trong các lĩnh vực khác nhau để khám phá những điểm tương đồng của chúng và đồng thời lưu ý một số khác biệt. Vì vậy, người ta có thể thấy sự giống nhau giữa các tuyên bố vấn đề và phương pháp thống kê được sử dụng để giải quyết chúng trong các lĩnh vực như nghiên cứu y học khoa học, nghiên cứu xã hội học cụ thể và nghiên cứu tiếp thị, hay nói tóm lại là trong y học, xã hội học và tiếp thị. Chúng thường được nhóm lại với nhau dưới tên "nghiên cứu mẫu".

Sự khác biệt giữa nghiên cứu mẫu và nghiên cứu chuyên gia trước hết được thể hiện ở số lượng đối tượng hoặc đối tượng được khảo sát - trong nghiên cứu mẫu, chúng ta thường nói đến hàng trăm, và trong nghiên cứu chuyên gia - khoảng hàng chục. Nhưng công nghệ nghiên cứu của chuyên gia phức tạp hơn nhiều. Tính đặc hiệu càng rõ rệt hơn trong các mô hình nhân khẩu học hoặc logistic, khi xử lý thông tin tường thuật (văn bản, biên niên sử) hoặc khi nghiên cứu ảnh hưởng lẫn nhau của các yếu tố.

Các vấn đề về độ tin cậy, an toàn của thiết bị kỹ thuật và công nghệ, lý thuyết xếp hàng được bàn luận chi tiết trong nhiều công trình khoa học.

Phân tích thống kê dữ liệu cụ thể

Việc áp dụng các phương pháp và mô hình thống kê để phân tích thống kê các dữ liệu cụ thể gắn liền với các vấn đề của lĩnh vực liên quan. Kết quả của phần thứ ba trong số các loại hoạt động khoa học và ứng dụng được xác định là sự giao thoa của các ngành học. Chúng có thể được coi là ví dụ về ứng dụng thực tế của các phương pháp thống kê. Nhưng không ít lý do để gán chúng cho lĩnh vực hoạt động tương ứng của con người.

Ví dụ, kết quả của một cuộc khảo sát người tiêu dùng cà phê hòa tan đương nhiên được quy cho hoạt động tiếp thị (đó là những gì họ làm khi giảng về nghiên cứu tiếp thị). Nghiên cứu động lực tăng trưởng giá sử dụng chỉ số lạm phát được tính toán từ thông tin được thu thập độc lập được quan tâm chủ yếu từ quan điểm kinh tế và quản lý nền kinh tế quốc dân (cả ở cấp độ vĩ mô và cấp độ tổ chức riêng lẻ).

Triển vọng phát triển

Lý thuyết về phương pháp thống kê nhằm giải quyết các vấn đề thực tế. Do đó, các công thức mới của các vấn đề toán học để phân tích dữ liệu thống kê liên tục nảy sinh trong đó và các phương pháp mới được phát triển và chứng minh. Việc chứng minh thường được thực hiện bằng các phương tiện toán học, tức là bằng cách chứng minh các định lý. Thành phần phương pháp luận đóng một vai trò quan trọng - cách đặt vấn đề một cách chính xác, những giả định nào được chấp nhận cho mục đích nghiên cứu toán học sâu hơn. Vai trò của công nghệ thông tin hiện đại, đặc biệt là thí nghiệm máy tính, là rất lớn.

Một nhiệm vụ cấp thiết là phân tích lịch sử các phương pháp thống kê để xác định xu hướng phát triển và áp dụng vào dự báo.

Văn học

2. Naylor T. Thí nghiệm mô phỏng máy với mô hình hệ thống kinh tế. - M.: Mir, 1975. - 500 tr.

3. Kramer G. Phương pháp thống kê toán học. - M.: Mir, 1948 (tái bản lần 1), 1975 (tái bản lần 2). - 648 tr.

4. Bolshev L. N., Smirnov N. V. Bảng thống kê toán học. - M.: Nauka, 1965 (tái bản lần 1), 1968 (tái bản lần 2), 1983 (tái bản lần 3).

5. Smirnov N. V., Dunin-Barkovsky I. V. Khóa học về lý thuyết xác suất và thống kê toán học cho các ứng dụng kỹ thuật. Ed. Thứ 3, khuôn mẫu. - M.: Nauka, 1969. - 512 tr.

6. Norman Draper, Harry Smith Phân tích hồi quy ứng dụng. Hồi quy bội = Phân tích hồi quy ứng dụng. - tái bản lần thứ 3. - M.: “Biện chứng”, 2007. - P. 912. - ISBN 0-471-17082-8

Xem thêm

Quỹ Wikimedia. 2010.

  • Yat Kha
  • Hỗn hống (định hướng)

Xem “Phương pháp thống kê” là gì trong các từ điển khác:

    PHƯƠNG PHÁP THỐNG KÊ- PHƯƠNG PHÁP THỐNG KÊ Phương pháp khoa học mô tả và nghiên cứu các hiện tượng khối lượng cho phép biểu diễn định lượng (bằng số). Từ "thống kê" (từ trạng thái Igal. stato) có nguồn gốc chung với từ "trạng thái". Ban đầu nó... ... Bách khoa toàn thư triết học

    PHƯƠNG PHÁP THỐNG KÊ -- các phương pháp khoa học mô tả và nghiên cứu các hiện tượng khối lượng cho phép biểu hiện định lượng (bằng số). Từ “statistics” (từ tiếng Ý stato – state) có nguồn gốc chung với từ “state”. Ban đầu nó liên quan đến khoa học quản lý và... Bách khoa toàn thư triết học

    phương pháp thống kê- (trong sinh thái học và sinh học) phương pháp thống kê biến đổi, cho phép nghiên cứu tổng thể (ví dụ, phytocenosis, dân số, năng suất) theo tổng hợp từng phần của nó (ví dụ, theo dữ liệu thu được tại các địa điểm đăng ký) và đánh giá mức độ chính xác.... Từ điển sinh thái

    phương pháp thống kê- (trong tâm lý học) (từ trạng thái Latin) một số phương pháp thống kê toán học ứng dụng, được sử dụng trong tâm lý học chủ yếu để xử lý các kết quả thực nghiệm. Mục đích chính của việc sử dụng S. m. là để tăng tính hợp lệ của các kết luận trong ... ... Bách khoa toàn thư tâm lý lớn

    phương pháp thống kê- 20.2. Phương pháp thống kê Các phương pháp thống kê cụ thể được sử dụng để tổ chức, điều chỉnh và kiểm tra các hoạt động bao gồm nhưng không giới hạn ở các phương pháp sau: a) thiết kế thí nghiệm và phân tích nhân tố; b) phân tích phương sai và... Sách tham khảo từ điển thuật ngữ quy chuẩn và tài liệu kỹ thuật

    PHƯƠNG PHÁP THỐNG KÊ- Phương pháp nghiên cứu đại lượng. các khía cạnh của xã hội đại chúng. hiện tượng và quá trình. S. m. giúp mô tả đặc điểm của những thay đổi đang diễn ra trong xã hội bằng thuật ngữ kỹ thuật số. quá trình, nghiên cứu khác nhau. các hình thức kinh tế - xã hội. mô hình, thay đổi... ... Từ điển bách khoa nông nghiệp

    PHƯƠNG PHÁP THỐNG KÊ- Một số phương pháp thống kê toán ứng dụng dùng để xử lý kết quả thực nghiệm. Một số phương pháp thống kê đã được phát triển đặc biệt để kiểm tra chất lượng của các bài kiểm tra tâm lý, để sử dụng trong các hoạt động chuyên môn... ... Giáo dục chuyên nghiệp. Từ điển

    PHƯƠNG PHÁP THỐNG KÊ- (trong tâm lý học kỹ thuật) (từ trạng thái Latin) một số phương pháp thống kê ứng dụng được sử dụng trong tâm lý học kỹ thuật để xử lý kết quả thực nghiệm. Mục đích chính của việc sử dụng S. m. là để tăng tính hợp lệ của các kết luận trong ... ... Từ điển bách khoa tâm lý học và sư phạm

Các đặc điểm thống kê cơ bản được chia thành hai nhóm chính: thước đo xu hướng trung tâm và đặc điểm biến thiên.

Xu hướng trung tâm của mẫu cho phép chúng tôi đánh giá các đặc điểm thống kê như trung bình số học, mốt, trung vị.

Thước đo dễ dàng nhất để đo lường xu hướng trung tâm là chế độ. Thời trang (Mo)– đây là giá trị trong một tập hợp các quan sát xảy ra thường xuyên nhất. Trong tập hợp các giá trị (2, 6, 6, 8, 7, 33, 9, 9, 9, 10), chế độ là 9 vì nó xuất hiện thường xuyên hơn bất kỳ giá trị nào khác. Trong trường hợp tất cả các giá trị trong một nhóm xuất hiện thường xuyên như nhau thì nhóm này được coi là không có chế độ.

Khi hai giá trị liền kề trong một chuỗi xếp hạng có cùng tần số và chúng lớn hơn tần số của bất kỳ giá trị nào khác thì chế độ là trung bình của hai giá trị.

Nếu hai giá trị không liền kề trong một nhóm có tần số bằng nhau và chúng lớn hơn tần số của bất kỳ giá trị nào thì có hai chế độ (ví dụ: trong tập hợp các giá trị 10, 11, 11, 11, 12, 13, 14, 14, 14, 17, các chế độ là 11 và 14); trong trường hợp như vậy, nhóm đo lường hoặc ước tính là lưỡng kim.

Chế độ lớn nhất trong nhóm là giá trị duy nhất thỏa mãn định nghĩa của chế độ. Tuy nhiên, có thể có một số chế độ nhỏ hơn trong nhóm. Các chế độ nhỏ hơn này đại diện cho các đỉnh cục bộ của phân bố tần số.

Trung Bình (Tôi)– ở giữa dãy kết quả đo được xếp hạng. Nếu dữ liệu chứa số chẵn các giá trị riêng biệt thì trung vị là điểm nằm ở giữa hai giá trị trung tâm khi chúng được sắp xếp theo thứ tự.

trung bình số họcđối với một loạt các phép đo không có thứ tự được tính bằng công thức:

Ở đâu . Ví dụ: đối với dữ liệu 4.1; 4,4; 4,5; 4,7; 4.8 hãy tính:

.

Mỗi thước đo trung tâm được tính toán ở trên là phù hợp nhất để sử dụng trong những điều kiện nhất định.

Chế độ được tính toán đơn giản nhất - nó có thể được xác định bằng mắt. Hơn nữa, đối với các nhóm dữ liệu rất lớn, đây là thước đo khá ổn định về trung tâm phân phối.

Trung vị là trung gian giữa mode và giá trị trung bình về mặt tính toán. Biện pháp này đặc biệt dễ dàng đạt được trong trường hợp dữ liệu được xếp hạng.

Tập dữ liệu trung bình bao gồm hầu hết các phép tính số học.

Giá trị trung bình bị ảnh hưởng bởi giá trị của tất cả các kết quả. Trung vị và mốt không bắt buộc phải xác định tất cả các giá trị. Hãy xem điều gì xảy ra với giá trị trung bình, trung vị và mốt khi giá trị lớn nhất trong tập hợp sau tăng gấp đôi:

Bộ 1: 1, 3, 3, 5, 6, 7, 8 33/7 5 3

Bộ 2: 1, 3, 3, 5, 6, 7, 16 41/7 5 3

Giá trị trung bình bị ảnh hưởng đặc biệt bởi các kết quả được gọi là “giá trị ngoại lệ”, tức là. dữ liệu nằm xa trung tâm của nhóm ước tính.

Tính toán mode, trung vị hay giá trị trung bình là một thủ tục thuần túy mang tính kỹ thuật. Tuy nhiên, việc lựa chọn trong số ba thước đo này và cách giải thích chúng thường đòi hỏi phải suy nghĩ kỹ. Trong quá trình lựa chọn, bạn nên thiết lập những điều sau:

– trong các nhóm nhỏ, thời trang có thể hoàn toàn không ổn định. Ví dụ: mode của nhóm: 1, 1, 1, 3, 5, 7, 7, 8 bằng 1; nhưng nếu một trong hai cái biến thành 0 và cái kia biến thành hai, thì chế độ sẽ bằng 7;

– trung vị không bị ảnh hưởng bởi các giá trị “lớn” và “nhỏ”. Ví dụ: trong một nhóm gồm 50 giá trị, giá trị trung vị sẽ không thay đổi nếu giá trị lớn nhất tăng gấp ba lần;

– giá trị trung bình bị ảnh hưởng bởi từng giá trị. Nếu một giá trị thay đổi c đơn vị, nó sẽ thay đổi theo cùng hướng c/n đơn vị;

– Một số bộ dữ liệu không có xu hướng trung tâm, điều này thường gây hiểu nhầm khi chỉ tính toán một thước đo xu hướng trung tâm. Điều này đặc biệt đúng đối với các nhóm có nhiều hơn một chế độ;

– khi một nhóm dữ liệu được coi là mẫu từ một nhóm đối xứng lớn, thì giá trị trung bình mẫu có thể gần với tâm của nhóm lớn hơn là trung vị và mốt.

Tất cả các đặc tính trung bình cung cấp mô tả chung về một số kết quả đo. Trong thực tế, chúng ta thường quan tâm đến việc mỗi kết quả sai lệch bao xa so với mức trung bình. Tuy nhiên, dễ dàng hình dung rằng hai nhóm kết quả đo có cùng giá trị trung bình nhưng có giá trị đo khác nhau. Ví dụ: đối với hàng 3, 6, 3 – trung bình = 4; đối với chuỗi 5, 2, 5 – cũng là giá trị trung bình = 4, mặc dù có sự khác biệt đáng kể giữa các chuỗi này.

Vì vậy, các đặc điểm trung bình phải luôn được bổ sung bằng các chỉ số về sự biến thiên, hay tính biến thiên.

Đến đặc điểm biến thể, hoặc biến động, kết quả đo bao gồm khoảng biến thiên, độ phân tán, độ lệch chuẩn, hệ số biến thiên, sai số chuẩn của trung bình số học.

Đặc điểm đơn giản nhất của sự biến thiên là phạm vi biến đổi. Nó được định nghĩa là sự khác biệt giữa kết quả đo lớn nhất và nhỏ nhất. Tuy nhiên, nó chỉ nắm bắt được những sai lệch cực độ và không nắm bắt được những sai lệch của tất cả các kết quả.

Để đưa ra đặc điểm chung, có thể tính toán độ lệch so với kết quả trung bình. Ví dụ: đối với hàng 3, 6, 3 giá trị sẽ như sau: 3 – 4 = – 1; 6 – 4 = 2; 3 – 4 = – 1. Tổng các độ lệch này (– 1) + 2 + (– 1) luôn bằng 0. Để tránh điều này, giá trị của mỗi độ lệch được bình phương: (– 1) 2 + 2 2 + (- 1) 2 = 6.

Giá trị này làm cho độ lệch so với mức trung bình trở nên rõ ràng hơn: độ lệch nhỏ thậm chí còn nhỏ hơn (0,5 2 = 0,25) và độ lệch lớn thậm chí còn lớn hơn (5 2 = 25). Số tiền thu được được gọi là tổng độ lệch bình phương. Chia tổng này cho số lần đo sẽ có độ lệch bình phương trung bình, hoặc sự phân tán. Nó được ký hiệu là s 2 và được tính theo công thức:

.

Nếu số lượng phép đo không quá 30, tức là. n 30 thì sử dụng công thức:

.

Đại lượng n – 1 = k được gọi là số bậc tự do, trong đó đề cập đến số lượng thành viên thay đổi tự do của dân số. Người ta đã chứng minh rằng khi tính toán các chỉ số biến thiên, một thành viên của tổng thể thực nghiệm luôn không có bậc tự do.

Những công thức này được sử dụng khi kết quả được biểu thị bằng mẫu không có thứ tự (thông thường).

Trong số các đặc tính dao động, đặc tính được sử dụng phổ biến nhất là độ lệch chuẩn, được định nghĩa là giá trị dương của căn bậc hai của giá trị phương sai, tức là:

.

Độ lệch chuẩn hoặc độ lệch chuẩnđặc trưng cho mức độ sai lệch của kết quả so với giá trị trung bình tính theo đơn vị tuyệt đối và có cùng đơn vị đo với kết quả đo.

Tuy nhiên, đặc điểm này không phù hợp để so sánh độ biến thiên của hai hoặc nhiều quần thể có đơn vị đo lường khác nhau.

Hệ số biến thiênđược định nghĩa là tỷ lệ của độ lệch chuẩn với giá trị trung bình số học, được biểu thị bằng phần trăm. Nó được tính theo công thức:

.

Trong luyện tập thể thao, độ biến thiên của kết quả đo phụ thuộc vào giá trị của hệ số biến thiên được coi là nhỏ
(0 – 10%), trung bình (11 – 20%) và lớn (V > 20%).

Hệ số biến thiên có tầm quan trọng lớn trong việc xử lý thống kê các kết quả đo, bởi vì, là một giá trị tương đối (được đo bằng phần trăm), nó cho phép người ta so sánh độ biến thiên của các kết quả đo có đơn vị đo khác nhau. Hệ số biến thiên chỉ có thể được sử dụng nếu phép đo được thực hiện trên thang tỷ lệ.

2.4.2. Phân tích số liệu thống kê trong MS Excel. Công cụ phân tích: thống kê mô tả, tương quan.

Bảng tính Microsoft Excel bao gồm cái gọi là gói phân tích - một bộ công cụ được thiết kế để giải quyết các vấn đề thống kê phức tạp. Gói này phân tích dữ liệu thống kê bằng cách sử dụng các hàm macro và cho phép, bằng cách thực hiện một hành động, thu được một số lượng lớn kết quả. Gói phân tích của Excel bao gồm các phần Thống kê mô tả và Tương quan, cùng với các công cụ phân tích khác.

Công cụ Thống kê mô tả cho phép chúng ta thu được một danh sách quan trọng các đặc tính thống kê được tính toán cho một số lượng lớn chuỗi số. Sử dụng công cụ Tương quan, chúng ta thu được ma trận tương quan chứa tất cả các hệ số tương quan theo cặp có thể có. Đối với dãy k sẽ thu được hệ số tương quan k(k – 1)/2.

Gói phân tích được gọi bằng cách sử dụng mục menu Công cụ – Phân tích dữ liệu... Nếu mục menu này bị thiếu, có nghĩa là gói phân tích chưa được cài đặt. Để cài đặt nó, bạn cần gọi mục menu Công cụ – Tiện ích bổ sung... và kích hoạt tiện ích bổ sung “Gói phân tích”, OK (xem Hình 1).

Hình 1. Hộp thoại bật/tắt các tiện ích bổ sung

Sau khi kích hoạt tiện ích bổ sung “Gói phân tích”, mục menu Công cụ – Phân tích dữ liệu... Khi được chọn, hộp thoại sau sẽ xuất hiện (Hình 2).

Hình 2. Hộp thoại lựa chọn công cụ phân tích dữ liệu

Sau khi chọn công cụ Descriptive Stats và nhấn OK, một hộp thoại khác sẽ xuất hiện (Hình 3), yêu cầu bạn nhập dữ liệu đầu vào và nơi xuất kết quả. Ở đây chỉ cần nhập phạm vi ô chứa dữ liệu nguồn vào trường “Khoảng thời gian đầu vào” là đủ. Bạn có thể chỉ định một phạm vi có tiêu đề cột, trong trường hợp đó bạn sẽ cần bật hộp kiểm “Nhãn ở hàng đầu tiên”. Để chỉ định khoảng đầu ra, chỉ cần chỉ định ô phía trên bên trái của phạm vi là đủ. Kết quả tính toán sẽ tự động chiếm đủ số hàng, cột theo yêu cầu trong bảng.

Hình 3. Hộp thoại công cụ Thống kê mô tả

Hãy xem công việc của công cụ phân tích “Thống kê mô tả” bằng ví dụ sau. Trong quá trình kiểm tra một nhóm học sinh (n = 21), các chỉ số sau được đo: chiều cao, cân nặng, động lực học của cánh tay phải và tay trái, dung tích sống, bài kiểm tra Stange và bài kiểm tra Genci. Kết quả được lập bảng (Hình 4).

Để có được các đặc điểm thống kê, chúng tôi sẽ sử dụng gói phân tích, công cụ “Thống kê mô tả”. Trong trường “Khoảng thời gian đầu vào”, nhập phạm vi ô B1:H22. Vì khoảng nhập đã chọn chứa các tiêu đề cột, hãy bật hộp kiểm “Nhãn ở hàng đầu tiên”. Để dễ dàng làm việc, hãy chọn “Bảng tính mới” làm vị trí đầu ra cho kết quả. Đối với dữ liệu đầu ra, hãy chọn hộp kiểm “Thống kê cuối cùng” và “Mức độ tin cậy: 95%”. Hộp kiểm cuối cùng sẽ cho phép bạn hiển thị các tham số của khoảng tin cậy với xác suất tin cậy là 0,95. Kết quả thu được sau khi định dạng một chút sẽ như hình 5.

Hình 4. Kết quả khảo sát một nhóm học sinh

Hình 5. Kết quả của công cụ Thống kê mô tả

Sau khi chọn công cụ "Tương quan" và nhấp OK trong hộp thoại "Phân tích dữ liệu" (Hình 2, 6), một hộp thoại khác sẽ xuất hiện (Hình 7), yêu cầu dữ liệu đầu vào và nơi xuất kết quả. Ở đây chỉ cần nhập phạm vi ô chứa dữ liệu nguồn vào trường “Khoảng thời gian đầu vào” là đủ. Bạn có thể chỉ định một phạm vi có tiêu đề cột, trong trường hợp đó bạn sẽ cần bật hộp kiểm “Nhãn ở hàng đầu tiên”. Để chỉ định khoảng đầu ra, chỉ cần chỉ định ô phía trên bên trái của phạm vi là đủ. Kết quả tính toán sẽ tự động chiếm đủ số hàng, cột theo yêu cầu trong bảng.

Hình 6. Hộp thoại lựa chọn công cụ phân tích dữ liệu

Hình 7. Hộp thoại công cụ tương quan

Hãy xem xét hoạt động của công cụ phân tích “Tương quan” bằng ví dụ được trình bày trong Hình 4.

Để có được ma trận tương quan, chúng tôi sẽ sử dụng gói phân tích, công cụ “Tương quan”. Trong trường “Khoảng thời gian đầu vào”, nhập phạm vi ô B1:H22. Vì khoảng nhập đã chọn chứa các tiêu đề cột, hãy bật hộp kiểm “Nhãn ở hàng đầu tiên”. Để dễ dàng làm việc, hãy chọn “Bảng tính mới” làm vị trí đầu ra cho kết quả. Kết quả thu được sau một chút định dạng sẽ trông như trong Hình 8.

Hình 8. Ma trận tương quan

Như vậy, bằng cách thực hiện các thao tác đơn giản, chúng ta thu được một số lượng lớn kết quả tính toán. Điều đáng chú ý là mặc dù công nghệ thông tin mở ra khả năng cho nhà nghiên cứu thu được lượng thông tin khổng lồ để phân tích, nhưng việc lựa chọn các kết quả có nhiều thông tin nhất, giải thích và đưa ra kết luận cuối cùng là công việc của chính nhà nghiên cứu.

Các khái niệm cơ bản về phân tích tương quan của dữ liệu thực nghiệm. Ước tính hệ số tương quan từ dữ liệu thực nghiệm.

Trong nghiên cứu thể thao, người ta thường tìm thấy mối quan hệ giữa các chỉ số được nghiên cứu. Sự xuất hiện của nó khác nhau. Ví dụ: xác định gia tốc từ dữ liệu tốc độ đã biết, định luật thứ hai của Newton và các định luật khác đặc trưng cho cái gọi là chức năng sự phụ thuộc hoặc mối quan hệ, trong đó mỗi giá trị của một chỉ báo tương ứng với một giá trị được xác định chặt chẽ của chỉ báo khác.

Ví dụ, một loại mối quan hệ khác bao gồm sự phụ thuộc của trọng lượng vào chiều dài cơ thể. Một giá trị chiều dài cơ thể có thể tương ứng với nhiều giá trị trọng lượng và ngược lại. Trong những trường hợp như vậy, khi một giá trị của một chỉ báo tương ứng với một số giá trị của chỉ báo khác thì mối quan hệ được gọi là thống kê.

Người ta chú ý nhiều đến việc nghiên cứu mối quan hệ thống kê giữa các chỉ số khác nhau trong nghiên cứu thể thao, vì điều này giúp tiết lộ một số mô hình và sau đó mô tả chúng bằng cả lời nói và toán học nhằm mục đích sử dụng chúng trong công việc thực tế của huấn luyện viên và giáo viên. .

Trong số các mối quan hệ thống kê, quan trọng nhất là tương quan. Tương quan là sự phụ thuộc thống kê giữa các biến ngẫu nhiên, trong đó sự thay đổi của một trong các biến ngẫu nhiên sẽ dẫn đến sự thay đổi trong kỳ vọng toán học (giá trị trung bình) của biến kia. Ví dụ: bắn 3 kg và 5 kg. Sự cải thiện ở cú ném 3kg sẽ dẫn đến sự cải thiện (trung bình) ở cú ném 5kg.

Phương pháp thống kê được sử dụng để nghiên cứu các mối quan hệ được gọi là phân tích tương quan. Nhiệm vụ chính của nó là xác định hình dạng, độ kín và hướng mối liên hệ giữa các chỉ số nghiên cứu. Phân tích tương quan chỉ cho phép bạn khám phá các mối quan hệ thống kê. Nó được sử dụng rộng rãi trong lý thuyết kiểm tra để đánh giá độ tin cậy và nội dung thông tin của chúng. Các thang đo khác nhau yêu cầu các loại phân tích tương quan khác nhau.

Độ lớn của hệ số tương quan được tính toán có tính đến thang đo được sử dụng để đo lường.

Để đánh giá mối quan hệ, khi các phép đo được thực hiện theo tỷ lệ hoặc thang đo khoảng và dạng của mối quan hệ là tuyến tính, hệ số tương quan Bravais-Pearson được sử dụng (các hệ số tương quan cho các thang đo khác không được xem xét trong hướng dẫn này). Nó được ký hiệu bằng chữ cái Latinh - r. Giá trị của r thường được tính bằng công thức:

,

trong đó và là các giá trị trung bình số học của các chỉ số x và y và là độ lệch chuẩn, N– số lượng phép đo (đối tượng).

Trong một số trường hợp, mức độ chặt chẽ của mối quan hệ được xác định dựa trên hệ số sự quyết tâm D, được tính theo công thức:

.

Hệ số này đo lường phần biến thiên tổng thể trong một chỉ báo được giải thích bằng sự biến thiên trong một chỉ báo khác. Ví dụ: hệ số tương quan là r = –0,677 (giữa kết quả ở nội dung chạy 30 m và nhảy ba bước đứng). Hệ số xác định bằng:

Do đó, 45,8% sự phân tán của các môn thể thao trong môn nhảy ba lần được giải thích là do sự thay đổi kết quả trong cuộc chạy 30 m. Nói cách khác, cả hai đặc điểm được nghiên cứu đều bị ảnh hưởng bởi các yếu tố chung gây ra sự khác biệt trong các đặc điểm này và tỷ lệ của các yếu tố chung là 45,8%. 100% còn lại - 45,8% = 54,2% là do các yếu tố tác động có chọn lọc lên các đặc điểm đang nghiên cứu.

Đánh giá độ tin cậy thống kê của hệ số tương quan có nghĩa là xác định xem có tồn tại mối quan hệ tương quan tuyến tính giữa các quần thể nói chung hay không, hoặc xác định xem hệ số tương quan giữa các mẫu có khác biệt đáng kể hay không đáng kể so với 0 hay không. Vấn đề này có thể được giải quyết bằng cách sử dụng bảng phân bố các điểm tới hạn của hệ số tương quan theo thứ tự sau:

1. Các giả thuyết thống kê được đưa ra. Giả thuyết H 0 giả định không có mối quan hệ có ý nghĩa thống kê giữa các chỉ số nghiên cứu ( gen r= 0). Giả thuyết H 1 giả định rằng có mối quan hệ có ý nghĩa thống kê giữa các chỉ số ( gen r>0).

2. Giá trị quan sát của hệ số tương quan được tính r quan sát..

3. Giá trị tới hạn của hệ số tương quan được tìm từ bảng r chí mạng tùy thuộc vào kích thước mẫu N, mức ý nghĩa a và loại vùng tới hạn (một phía hoặc hai phía).

3. So sánh r quan sát.r chí mạng.

Nếu như r quan sát. < r chí mạng- không đáng tin cậy về mặt thống kê (không đáng kể). Giả thuyết H 0 được chấp nhận nếu r quan sát.r chí mạng, hệ số tương quan được coi là đáng tin cậy về mặt thống kê (có ý nghĩa). Giả thuyết H 1 được chấp nhận.

Số liệu thống kê phải được trình bày theo cách mà chúng có thể được sử dụng. Có 3 hình thức trình bày dữ liệu thống kê chính:

1) văn bản – đưa dữ liệu vào văn bản;

2) dạng bảng – trình bày dữ liệu dưới dạng bảng;

3) đồ họa – biểu diễn dữ liệu dưới dạng đồ thị.

Dạng văn bản được sử dụng khi có một lượng nhỏ dữ liệu số.

Dạng bảng được sử dụng thường xuyên nhất vì đây là dạng trình bày dữ liệu thống kê hiệu quả hơn. Không giống như các bảng toán học, dựa trên các điều kiện ban đầu, cho phép người ta thu được kết quả này hoặc kết quả khác, các bảng thống kê cho biết ngôn ngữ của các con số về các đối tượng đang được nghiên cứu.

Bảng thống kê là hệ thống hàng, cột trong đó các thông tin thống kê về các hiện tượng kinh tế - xã hội được trình bày theo một trình tự, mối liên hệ nhất định.

Bảng 2. Ngoại thương của Liên bang Nga giai đoạn 2000 – 2006, tỷ đô la.

Mục lục

Kim ngạch ngoại thương

Cán cân thương mại

bao gồm:

với nước ngoài

cán cân thương mại

Ví dụ, trong bảng. 2 trình bày thông tin về ngoại thương của Nga, những thông tin này sẽ không thể trình bày dưới dạng văn bản một cách hiệu quả.

Phân biệt chủ thểThuộc tính bảng thống kê. Chủ thể biểu thị đối tượng được mô tả - hoặc các đơn vị dân số, hoặc các nhóm đơn vị, hoặc toàn bộ dân số. Vị ngữ đưa ra các đặc điểm của chủ ngữ, thường ở dạng số. Yêu cầu tiêu đề bảng, cho biết dữ liệu bảng thuộc về danh mục nào và thời gian nào.

Theo tính chất của đề tài, bảng thống kê được chia thành đơn giản, nhómtổ hợp. Trong chủ đề của một bảng đơn giản, đối tượng nghiên cứu không được chia thành các nhóm mà có thể đưa ra danh sách tất cả các đơn vị dân số hoặc chỉ ra toàn bộ dân số (ví dụ: Bảng 11). Trong chủ đề bảng nhóm, đối tượng nghiên cứu được chia thành các nhóm theo một đặc điểm, vị ngữ chỉ số lượng đơn vị trong các nhóm (tuyệt đối hoặc phần trăm) và các chỉ tiêu tóm tắt cho các nhóm (ví dụ Bảng 4) . Trong chủ đề của bảng kết hợp, dân số được chia thành các nhóm không phải theo một mà theo một số đặc điểm (ví dụ: Bảng 2).

Khi xây dựng bảng, bạn phải được hướng dẫn như sau quy tắc chung.

1. Chủ ngữ của bảng nằm ở phần bên trái (ít thường xuyên hơn - trên) và vị ngữ - ở bên phải (ít thường xuyên hơn - dưới).

2. Tiêu đề cột ghi tên các chỉ tiêu và đơn vị đo lường.

3. Hàng cuối cùng hoàn thành bảng và nằm ở cuối bảng, nhưng đôi khi nó là hàng đầu tiên: trong trường hợp này, mục “bao gồm” được thực hiện ở hàng thứ hai và các hàng tiếp theo chứa các thành phần của hàng cuối cùng.

4. Dữ liệu số được ghi với độ chính xác như nhau trong mỗi cột, các chữ số của số được đặt phía dưới các chữ số và phần nguyên cách nhau bằng dấu thập phân.

5. Không được có ô trống trong bảng: nếu dữ liệu bằng 0 thì đặt dấu “–” (dấu gạch ngang); nếu không biết dữ liệu thì ghi “không có thông tin” hoặc đặt dấu “…” (dấu chấm lửng). Nếu giá trị của chỉ báo không bằng 0, nhưng chữ số có nghĩa đầu tiên xuất hiện sau mức độ chính xác được chấp nhận, thì mục nhập 0,0 sẽ được thực hiện (ví dụ: nếu mức độ chính xác là 0,1 được chấp nhận).

Đôi khi các bảng thống kê được bổ sung bằng đồ thị nhằm mục đích nhấn mạnh một số đặc điểm của dữ liệu và so sánh chúng. Hình thức đồ họa là hình thức trình bày dữ liệu hiệu quả nhất theo quan điểm nhận thức của họ. Với sự trợ giúp của đồ thị, có thể trực quan hóa các đặc điểm của cấu trúc, động lực học, mối quan hệ qua lại của các hiện tượng và sự so sánh của chúng.

Đồ thị thống kê– đây là những hình ảnh thông thường về số lượng và mối quan hệ của chúng bằng cách sử dụng các đường thẳng, hình dạng hình học, hình vẽ hoặc bản đồ địa lý. Hình thức đồ họa tạo điều kiện thuận lợi cho việc xem xét dữ liệu thống kê, làm cho chúng trở nên trực quan, biểu cảm và dễ nhìn. Tuy nhiên, biểu đồ có một số hạn chế nhất định: trước hết, biểu đồ không thể chứa nhiều dữ liệu như một bảng; Ngoài ra, biểu đồ luôn hiển thị dữ liệu được làm tròn - không chính xác nhưng gần đúng. Vì vậy, đồ thị chỉ được sử dụng để mô tả tình hình tổng thể chứ không phải chi tiết. Hạn chế cuối cùng là sự tốn thời gian của việc lập kế hoạch. Có thể khắc phục bằng cách sử dụng máy tính cá nhân (ví dụ: “Trình hướng dẫn sơ đồ” trong gói Microsoft Office Excel).

Theo phương pháp xây dựng đồ họa, chúng được chia thành sơ đồ, bản đồsơ đồ bản đồ.

Cách phổ biến nhất để biểu diễn dữ liệu bằng đồ họa là sơ đồ, có các loại sau: tuyến tính, hướng tâm, dấu chấm, mặt phẳng, thể tích và hình. Loại sơ đồ phụ thuộc vào loại dữ liệu được trình bày và nhiệm vụ xây dựng. Trong mọi trường hợp, biểu đồ phải kèm theo tiêu đề - bên trên hoặc bên dưới trường biểu đồ. Tiêu đề cho biết chỉ báo nào được hiển thị, cho lãnh thổ nào và vào thời gian nào.

Đồ thị tuyến tính được sử dụng để biểu diễn các biến định lượng: đặc điểm của các biến thể trong giá trị, động lực, mối quan hệ giữa các biến. Sự thay đổi dữ liệu được phân tích bằng cách sử dụng đa giác phân phối, tích lũy(đường cong “nhỏ hơn”) và ogive(đường cong “nhiều hơn”). Đa giác phân phối được thảo luận trong chủ đề 4 (ví dụ: Hình 5.). Để xây dựng các tích lũy, các giá trị của đặc tính thay đổi được vẽ dọc theo trục abscissa và tổng tần số hoặc tần số tích lũy (từ f1 lên tới ∑ f). Để xây dựng một đường ogive, tổng tần số tích lũy được đặt trên trục tọa độ theo thứ tự ngược lại (từ ∑ f trước f1). Tích lũy và ogive theo bảng. 4. được mô tả trong hình. 1.

Cơm. 1. Cộng dồn và phân bổ hàng hóa theo trị giá hải quan

Việc sử dụng biểu đồ đường trong phân tích động lực học được thảo luận trong chủ đề 5 (ví dụ: Hình 13) và việc sử dụng chúng để phân tích các mối quan hệ sẽ được thảo luận trong chủ đề 6 (ví dụ: Hình 21). Chủ đề 6 cũng đề cập đến việc sử dụng biểu đồ phân tán (ví dụ: Hình 20).

Đồ thị đường được chia thành một chiều, được sử dụng để biểu diễn dữ liệu trên một biến duy nhất và hai chiều– trên hai biến. Một ví dụ về đồ thị tuyến tính một chiều là đa giác phân phối và đồ thị hai chiều là đường hồi quy (ví dụ: Hình 21).

Đôi khi, với những thay đổi lớn về chỉ số, họ sử dụng thang đo logarit. Ví dụ: nếu các giá trị chỉ báo thay đổi từ 1 đến 1000, điều này có thể gây khó khăn khi xây dựng biểu đồ. Trong những trường hợp như vậy, chúng tôi chuyển sang logarit của các giá trị chỉ báo, các giá trị này sẽ không khác nhau nhiều: lg 1 = 0, lg 1000 = 3.

Giữa phẳng Theo tần suất sử dụng, biểu đồ thanh (biểu đồ) được phân biệt, trong đó chỉ báo được trình bày dưới dạng cột, chiều cao tương ứng với giá trị của chỉ báo (ví dụ: Hình 4).

Tỷ lệ diện tích của một hình hình học cụ thể với giá trị của chỉ báo làm cơ sở cho các loại sơ đồ phẳng khác: hình tam giác, quảng trường, hình hộp chữ nhật. Bạn cũng có thể sử dụng phép so sánh diện tích hình tròn - trong trường hợp này bán kính của hình tròn được chỉ định.

biểu đồ dải trình bày các chỉ báo dưới dạng hình chữ nhật kéo dài theo chiều ngang, nhưng không khác với biểu đồ thanh.

Trong các sơ đồ phẳng, nó thường được sử dụng biểu đồ tròn, được sử dụng để minh họa cấu trúc của dân số đang được nghiên cứu. Toàn bộ tập hợp được lấy là 100%, tổng diện tích của hình tròn tương ứng với nó, diện tích của các cung tương ứng với các phần của tập hợp. Chúng ta hãy xây dựng sơ đồ ngành về cơ cấu ngoại thương của Liên bang Nga năm 2006 theo số liệu ở Bảng. 2 (xem Hình 2). Khi sử dụng các chương trình máy tính, biểu đồ hình tròn được xây dựng ở dạng ba chiều, nghĩa là không phải ở hai mà ở ba mặt phẳng (xem Hình 3).

Cơm. 2. Biểu đồ tròn đơn giản Hình 2. 3. Biểu đồ hình tròn 3D

Sơ đồ hình (hình ảnh) nâng cao độ rõ nét của hình ảnh, vì chúng bao gồm bản vẽ của chỉ báo được mô tả, kích thước của nó tương ứng với kích thước của chỉ báo.

Khi xây dựng biểu đồ, mọi thứ đều quan trọng như nhau - việc lựa chọn chính xác hình ảnh đồ họa, tỷ lệ và tuân thủ các quy tắc thiết kế biểu đồ. Những vấn đề này được đề cập chi tiết hơn trong và.

Bản đồ và sơ đồ bản đồ được sử dụng để mô tả các đặc điểm địa lý của hiện tượng đang được nghiên cứu. Chúng cho thấy vị trí của hiện tượng đang được nghiên cứu, cường độ của nó trong một lãnh thổ nhất định - ở một nước cộng hòa, khu vực, khu kinh tế hoặc hành chính, v.v. Ví dụ: việc xây dựng bản đồ và sơ đồ bản đồ được thảo luận trong tài liệu chuyên ngành.

Quan sát thống kê- có tính quy mô lớn (bao gồm một số lượng lớn các trường hợp biểu hiện của hiện tượng đang nghiên cứu để có được số liệu thống kê trung thực), có tính hệ thống (được thực hiện theo kế hoạch đã xây dựng, bao gồm các vấn đề về phương pháp luận, tổ chức thu thập và kiểm soát độ tin cậy của thông tin), có hệ thống (được thực hiện một cách có hệ thống, liên tục hoặc thường xuyên), được tổ chức khoa học (để tăng độ tin cậy của dữ liệu, điều này phụ thuộc vào chương trình quan sát, nội dung của bảng câu hỏi, chất lượng chuẩn bị hướng dẫn) quan sát của các hiện tượng, quá trình của đời sống kinh tế - xã hội, bao gồm việc thu thập và ghi nhận những đặc điểm riêng của từng đơn vị dân cư.

Các giai đoạn quan sát thống kê

  1. Chuẩn bị cho quan sát thống kê(giải quyết các vấn đề khoa học, phương pháp, tổ chức và kỹ thuật).
  • xác định mục đích và đối tượng quan sát;
  • xác định thành phần đặc điểm được đăng ký;
  • xây dựng tài liệu để thu thập dữ liệu;
  • lựa chọn và đào tạo nhân lực thực hiện giám sát;

2. Thu thập thông tin

  • điền trực tiếp vào các biểu mẫu thống kê (biểu mẫu, bảng câu hỏi);

Thông tin thống kê là dữ liệu sơ cấp về hiện trạng các hiện tượng kinh tế - xã hội, được hình thành trong quá trình quan sát thống kê, sau đó được hệ thống hóa, tổng hợp, phân tích và khái quát hóa.

Thành phần của thông tin phần lớn được quyết định bởi nhu cầu của xã hội vào thời điểm hiện tại. Những thay đổi về hình thức sở hữu và phương pháp điều tiết nền kinh tế dẫn đến những thay đổi trong chính sách quan sát thống kê. Nếu trước đây thông tin chỉ được cung cấp cho các cơ quan chính phủ thì hiện nay trong hầu hết các trường hợp, thông tin đó đã được công khai. Người sử dụng thông tin thống kê chính là chính phủ, các tổ chức thương mại, các tổ chức quốc tế và công chúng.

Giám sát có tổ chức đặc biệt

Nó bao gồm việc thu thập dữ liệu, vì lý do này hay lý do khác, không được đưa vào báo cáo hoặc để xác minh dữ liệu báo cáo. Thể hiện việc thu thập dữ liệu thông qua các cuộc điều tra dân số và đếm một lần.

Đăng ký giám sát

Nó dựa trên việc duy trì một sổ đăng ký thống kê, với sự trợ giúp của nó, việc hạch toán thống kê liên tục được thực hiện cho các quy trình dài hạn có điểm bắt đầu, giai đoạn phát triển và kết thúc cố định.

Các hình thức nghiên cứu thống kê

Các loại quan sát thống kê Phương pháp thu thập thông tin thống kê
theo thời gian ghi dữ liệu bởi mức độ bao phủ hoàn chỉnh của các đơn vị dân cư
Báo cáo thống kê Quan sát hiện tại Quan sát liên tục Quan sát trực tiếp

Quan sát có tổ chức đặc biệt:

  • điều tra dân số
  • kế toán một lần

Quan sát định kỳ:

  • Quan sát một lần
  • Quan sát định kỳ

Quan sát giai thoại:

  • chọn lọc
  • Quan sát chuyên khảo
  • phương pháp mảng chính
  • phương pháp quan sát khoảnh khắc
Phim tài liệu
Đăng ký giám sát
  • phương pháp chuyển tiếp
  • phương pháp tự đăng ký
  • phương pháp tương ứng
  • Phương pháp bảng câu hỏi
  • Phương pháp xuất hiện

Các loại quan sát thống kê

Quan sát thống kê được chia thành các loại theo các tiêu chí sau:

  • theo thời điểm ghi dữ liệu;
  • bởi sự hoàn thiện của phạm vi bảo hiểm;

Các loại quan sát thống kê theo thời điểm đăng ký:

Giám sát liên tục (liên tục)- được thực hiện để nghiên cứu các hiện tượng và quá trình hiện tại. Các sự kiện được ghi lại khi chúng xảy ra. (đăng ký kết hôn và ly hôn gia đình)

Quan sát liên tục- được thực hiện khi cần thiết, trong khi cho phép có những khoảng trống tạm thời trong việc ghi dữ liệu:

  • định kỳ quan sát - được thực hiện trong khoảng thời gian tương đối bằng nhau (điều tra dân số).
  • Một lần quan sát - được thực hiện mà không quan sát tần suất nghiêm ngặt.
  • Dựa trên mức độ bao phủ đầy đủ của các đơn vị dân số, các loại quan sát thống kê sau đây được phân biệt:

    Quan sát liên tục- thể hiện việc thu thập và nhận thông tin về tất cả các đơn vị tổng thể đang được nghiên cứu. Nó được đặc trưng bởi chi phí vật liệu và lao động cao và hiệu quả thông tin không đủ. Nó được sử dụng trong điều tra dân số, khi thu thập dữ liệu dưới dạng báo cáo, bao gồm các doanh nghiệp lớn và vừa thuộc nhiều hình thức sở hữu khác nhau.

    Quan sát một phần- Dựa trên nguyên tắc lựa chọn ngẫu nhiên các đơn vị của tổng thể được nghiên cứu, trong đó tất cả các loại đơn vị có trong tổng thể phải có đại diện trong tổng thể mẫu. Nó có một số lợi thế so với việc quan sát liên tục: giảm chi phí về thời gian và tiền bạc.

    Quan sát liên tục được chia thành:
    • quan sát có chọn lọc- dựa trên sự lựa chọn ngẫu nhiên các đơn vị được quan sát.
    • Quan sát chuyên khảo- bao gồm việc kiểm tra các đơn vị riêng lẻ của một tổng thể được đặc trưng bởi các đặc tính định tính hiếm có. Một ví dụ về quan sát chuyên khảo: đặc điểm công việc của từng doanh nghiệp để xác định những tồn tại trong công việc hoặc xu hướng phát triển.
    • Phương pháp mảng chính- bao gồm việc nghiên cứu các đơn vị dân số lớn nhất, quan trọng nhất, theo đặc điểm chính của họ, có tỷ trọng lớn nhất trong dân số được nghiên cứu.
    • Phương pháp quan sát nhất thời- bao gồm việc tiến hành quan sát ở các khoảng thời gian ngẫu nhiên hoặc liên tục kèm theo các ghi chú về trạng thái của đối tượng được nghiên cứu vào lúc này hay lúc khác.

    Phương pháp quan sát thống kê

    Các cách để có được thông tin thống kê:

    Quan sát thống kê trực tiếp- quan sát trong đó chính người đăng ký, bằng cách đo, cân và đếm trực tiếp, xác lập sự việc cần ghi lại.

    Quan sát tài liệu- Căn cứ vào việc sử dụng các loại chứng từ kế toán.
    Bao gồm Báo cáo phương pháp quan sát - trong đó doanh nghiệp nộp báo cáo thống kê về hoạt động của mình một cách bắt buộc nghiêm ngặt.

    Sự khảo sát- bao gồm việc thu thập thông tin cần thiết trực tiếp từ người trả lời.

    Có các loại khảo sát sau:

    quân viễn chinh- người đăng ký nhận thông tin cần thiết từ những người được phỏng vấn và tự mình ghi lại thông tin đó vào biểu mẫu.

    Phương thức tự đăng ký— các biểu mẫu do người trả lời tự điền, người đăng ký chỉ phát các biểu mẫu và giải thích các quy tắc điền chúng.

    phóng viên- thông tin được cung cấp cho các cơ quan có thẩm quyền bởi đội ngũ phóng viên tự nguyện.

    Bảng câu hỏi- thông tin được thu thập dưới dạng bảng câu hỏi, là bảng câu hỏi đặc biệt, thuận tiện trong trường hợp không yêu cầu độ chính xác cao của kết quả.

    Riêng tư- bao gồm việc cung cấp thông tin trực tiếp cho các cơ quan có liên quan.

    Sai số trong quan sát thống kê

    Thông tin thu được trong quá trình quan sát thống kê có thể không tương ứng với thực tế và giá trị tính toán của các chỉ số có thể không tương ứng với giá trị thực tế.

    Sự khác biệt giữa giá trị tính toán và giá trị thực tế được gọi là lỗi quan sát.

    Tùy theo nguyên nhân xảy ra có thể phân biệt lỗi đăng ký và lỗi đại diện. Lỗi đăng ký là điển hình cho cả quan sát liên tục và không liên tục, và lỗi đại diện chỉ điển hình cho các quan sát không liên tục. Lỗi đăng ký, như lỗi đại diện, có thể ngẫu nhiên và có hệ thống.

    Lỗi đăng ký- thể hiện độ lệch giữa giá trị của chỉ tiêu thu được trong quá trình quan sát thống kê và giá trị thực tế của nó. Lỗi đăng ký có thể là ngẫu nhiên (kết quả của các yếu tố ngẫu nhiên - ví dụ: các chuỗi bị xáo trộn) và có tính hệ thống (chúng xuất hiện liên tục).

    Lỗi đại diện- phát sinh khi quần thể được chọn không tái tạo chính xác quần thể ban đầu. Chúng là đặc điểm của sự quan sát không đầy đủ và bao gồm độ lệch giá trị của chỉ số của phần dân số được nghiên cứu so với giá trị của nó trong dân số nói chung.

    Lỗi ngẫu nhiên- là kết quả của các yếu tố ngẫu nhiên.

    Lỗi hệ thống- luôn có cùng xu hướng tăng hoặc giảm chỉ báo cho từng đơn vị quan sát, do đó giá trị của chỉ báo đối với toàn bộ dân số sẽ bao gồm cả sai số tích lũy.

    Phương pháp kiểm soát:
    • Đếm (số học) - kiểm tra tính đúng đắn của phép tính số học.
    • Logic - dựa trên mối quan hệ ngữ nghĩa giữa các tính năng.