Định lý giới hạn trung tâm là gì?

Định lý giới hạn trung tâm là gì?
Anonim

Câu trả lời:

Định lý giới hạn trung tâm làm cho ý tưởng trực quan khắt khe rằng các ước tính về giá trị trung bình (ước tính từ một số mẫu) của một số phép đo liên quan đến một số dân số được cải thiện khi kích thước của mẫu tăng lên.

Giải trình:

Hãy tưởng tượng một khu rừng chứa 100 cây.

Bây giờ hãy tưởng tượng rằng (khá phi thực tế) rằng, tính bằng mét, một phần tư trong số họ có chiều cao là 2, một phần tư trong số họ có chiều cao là 3, một phần tư trong số họ có chiều cao là 4 và một phần tư trong số họ có chiều cao 5.

Hãy tưởng tượng đo chiều cao của mỗi cây trong rừng và sử dụng thông tin để xây dựng biểu đồ với kích thước thùng được chọn phù hợp (ví dụ: 1,5 đến 2,5, 2,5 đến 3,5, 3,5 đến 4,5 và 5,5 đến 6,5; Tôi nhận ra rằng tôi chưa chỉ định thùng mà ranh giới thuộc về nhưng nó không quan trọng ở đây).

Bạn có thể sử dụng biểu đồ để ước tính phân bố xác suất của cây. Rõ ràng, nó sẽ không phải là một bình thường.Trong thực tế, việc cung cấp các điểm cuối được chọn một cách thích hợp, nó sẽ là một điểm thống nhất bởi vì sẽ có số lượng cây bằng nhau tương ứng với một trong những độ cao được chỉ định trong mỗi thùng.

Bây giờ hãy tưởng tượng đi vào rừng và đo chiều cao chỉ bằng hai cái cây; tính chiều cao trung bình của hai cây này và ghi chú lại. Lặp lại thao tác đó nhiều lần, để bạn có một tập hợp các giá trị trung bình cho các mẫu có kích thước 2. Nếu bạn vẽ biểu đồ cho các ước tính của giá trị trung bình, nó sẽ không còn đồng nhất. Thay vào đó, có khả năng sẽ có nhiều phép đo hơn (ước tính giá trị trung bình dựa trên các mẫu có kích thước 2) gần chiều cao trung bình chung của tất cả các cây trong rừng (trong trường hợp cụ thể này,

#(2 + 3 + 4 + 5)/4 = 3.5# mét).

Như sẽ có nhiều hơn ước tính của giá trị trung bình gần ý nghĩa dân số thực sự (được biết đến trong ví dụ phi thực tế này), khác xa với giá trị trung bình, hình dạng của biểu đồ mới này sẽ gần với phân phối bình thường (với đỉnh gần trung bình).

Bây giờ hãy tưởng tượng đi vào rừng và lặp lại bài tập ngoại trừ việc bạn đo chiều cao của 3 cây, tính giá trị trung bình trong mỗi trường hợp và ghi chú lại. Biểu đồ mà bạn sẽ xây dựng sẽ có nhiều ước tính hơn về giá trị trung bình gần trung bình thực, với mức độ lan truyền ít hơn (cơ hội chọn ba cây trong bất kỳ một mẫu nào mà tất cả chúng đều đến từ một trong hai nhóm cuối --- cao hoặc rất ngắn --- ít hơn là chọn ba cây với độ cao lựa chọn). Hình dạng biểu đồ của bạn bao gồm ước tính kích thước trung bình (mỗi giá trị trung bình dựa trên ba phép đo) sẽ gần với phân bố bình thường và độ lệch chuẩn tương ứng (của ước tính trung bình, không phải của dân số cha mẹ) sẽ là nhỏ hơn

Lặp lại điều này cho 4, 5, 6, v.v., cây trên trung bình và biểu đồ mà bạn sẽ xây dựng sẽ trông giống như một bản phân phối bình thường (với kích thước mẫu lớn hơn dần dần), với giá trị trung bình của phân phối các ước tính của giá trị trung bình gần với giá trị trung bình thực và độ lệch chuẩn của các ước tính của giá trị trung bình ngày càng hẹp hơn.

Nếu bạn lặp lại bài tập cho trường hợp (thoái hóa) trong đó tất cả các cây được đo (trong một số trường hợp, ghi chú về giá trị trung bình trong mọi trường hợp), thì biểu đồ sẽ có ước tính về giá trị trung bình chỉ trong một trong các thùng (một giá trị tương ứng với giá trị trung bình thực), không có bất kỳ biến thể nào để độ lệch chuẩn của (phân phối xác suất ước tính) rằng "biểu đồ" sẽ bằng không.

Vì vậy, định lý giới hạn trung tâm lưu ý rằng giá trị trung bình của một số ước tính trung bình của một số dân số gần với giá trị trung bình thực và độ lệch chuẩn của ước tính của giá trị trung bình (chứ không phải độ lệch chuẩn của phân bố dân số cha mẹ) trở nên nhỏ dần cho kích thước mẫu lớn hơn.