Câu trả lời:
Định lý giới hạn trung tâm làm cho ý tưởng trực quan khắt khe rằng các ước tính về giá trị trung bình (ước tính từ một số mẫu) của một số phép đo liên quan đến một số dân số được cải thiện khi kích thước của mẫu tăng lên.
Giải trình:
Hãy tưởng tượng một khu rừng chứa 100 cây.
Bây giờ hãy tưởng tượng rằng (khá phi thực tế) rằng, tính bằng mét, một phần tư trong số họ có chiều cao là 2, một phần tư trong số họ có chiều cao là 3, một phần tư trong số họ có chiều cao là 4 và một phần tư trong số họ có chiều cao 5.
Hãy tưởng tượng đo chiều cao của mỗi cây trong rừng và sử dụng thông tin để xây dựng biểu đồ với kích thước thùng được chọn phù hợp (ví dụ: 1,5 đến 2,5, 2,5 đến 3,5, 3,5 đến 4,5 và 5,5 đến 6,5; Tôi nhận ra rằng tôi chưa chỉ định thùng mà ranh giới thuộc về nhưng nó không quan trọng ở đây).
Bạn có thể sử dụng biểu đồ để ước tính phân bố xác suất của cây. Rõ ràng, nó sẽ không phải là một bình thường.Trong thực tế, việc cung cấp các điểm cuối được chọn một cách thích hợp, nó sẽ là một điểm thống nhất bởi vì sẽ có số lượng cây bằng nhau tương ứng với một trong những độ cao được chỉ định trong mỗi thùng.
Bây giờ hãy tưởng tượng đi vào rừng và đo chiều cao chỉ bằng hai cái cây; tính chiều cao trung bình của hai cây này và ghi chú lại. Lặp lại thao tác đó nhiều lần, để bạn có một tập hợp các giá trị trung bình cho các mẫu có kích thước 2. Nếu bạn vẽ biểu đồ cho các ước tính của giá trị trung bình, nó sẽ không còn đồng nhất. Thay vào đó, có khả năng sẽ có nhiều phép đo hơn (ước tính giá trị trung bình dựa trên các mẫu có kích thước 2) gần chiều cao trung bình chung của tất cả các cây trong rừng (trong trường hợp cụ thể này,
Như sẽ có nhiều hơn ước tính của giá trị trung bình gần ý nghĩa dân số thực sự (được biết đến trong ví dụ phi thực tế này), khác xa với giá trị trung bình, hình dạng của biểu đồ mới này sẽ gần với phân phối bình thường (với đỉnh gần trung bình).
Bây giờ hãy tưởng tượng đi vào rừng và lặp lại bài tập ngoại trừ việc bạn đo chiều cao của 3 cây, tính giá trị trung bình trong mỗi trường hợp và ghi chú lại. Biểu đồ mà bạn sẽ xây dựng sẽ có nhiều ước tính hơn về giá trị trung bình gần trung bình thực, với mức độ lan truyền ít hơn (cơ hội chọn ba cây trong bất kỳ một mẫu nào mà tất cả chúng đều đến từ một trong hai nhóm cuối --- cao hoặc rất ngắn --- ít hơn là chọn ba cây với độ cao lựa chọn). Hình dạng biểu đồ của bạn bao gồm ước tính kích thước trung bình (mỗi giá trị trung bình dựa trên ba phép đo) sẽ gần với phân bố bình thường và độ lệch chuẩn tương ứng (của ước tính trung bình, không phải của dân số cha mẹ) sẽ là nhỏ hơn
Lặp lại điều này cho 4, 5, 6, v.v., cây trên trung bình và biểu đồ mà bạn sẽ xây dựng sẽ trông giống như một bản phân phối bình thường (với kích thước mẫu lớn hơn dần dần), với giá trị trung bình của phân phối các ước tính của giá trị trung bình gần với giá trị trung bình thực và độ lệch chuẩn của các ước tính của giá trị trung bình ngày càng hẹp hơn.
Nếu bạn lặp lại bài tập cho trường hợp (thoái hóa) trong đó tất cả các cây được đo (trong một số trường hợp, ghi chú về giá trị trung bình trong mọi trường hợp), thì biểu đồ sẽ có ước tính về giá trị trung bình chỉ trong một trong các thùng (một giá trị tương ứng với giá trị trung bình thực), không có bất kỳ biến thể nào để độ lệch chuẩn của (phân phối xác suất ước tính) rằng "biểu đồ" sẽ bằng không.
Vì vậy, định lý giới hạn trung tâm lưu ý rằng giá trị trung bình của một số ước tính trung bình của một số dân số gần với giá trị trung bình thực và độ lệch chuẩn của ước tính của giá trị trung bình (chứ không phải độ lệch chuẩn của phân bố dân số cha mẹ) trở nên nhỏ dần cho kích thước mẫu lớn hơn.
Ước tính dân số thế giới đang tăng với tốc độ trung bình hàng năm là 1,3%. Nếu dân số thế giới vào khoảng 6.472.416.997 vào năm 2005 thì dân số thế giới năm 2012 là bao nhiêu?
Dân số thế giới năm 2012 là 7.084.881.769 Dân số năm 2005 là P_2005 = 6472416997 Tỷ lệ tăng hàng năm là r = 1,3% Thời gian: n = 2012-2005 = 7 năm Dân số năm 2012 là P_2012 = P_2005 * (1 + r / 100) ^ n = 6472416997 * (1 + 0,013) ^ 7 = 6472416997 * (1.013) ^ 7 ~ ~ 7,084,881,769 [Trả lời]
Giá trị trung bình là thước đo trung tâm được sử dụng nhiều nhất, nhưng có những lúc nên sử dụng trung bình để hiển thị và phân tích dữ liệu. Khi nào có thể thích hợp để sử dụng trung bình thay vì trung bình?
Khi có một vài giá trị cực đoan trong tập dữ liệu của bạn. Ví dụ: Bạn có bộ dữ liệu gồm 1000 trường hợp với các giá trị không quá xa nhau. Trung bình của họ là 100, như là trung vị của họ. Bây giờ bạn thay thế chỉ một trường hợp bằng một trường hợp có giá trị 100000 (chỉ là cực đoan). Giá trị trung bình sẽ tăng đáng kể (đến gần 200), trong khi trung vị sẽ không bị ảnh hưởng. Tính toán: 1000 trường hợp, mean = 100, tổng giá trị = 100000 Mất một 100, thêm 100000, tổng các giá trị = 199900, mean =