1/30
Name | Mastery | Learn | Test | Matching | Spaced | Call with Kai |
|---|
No study sessions yet.
Central Limit Theorem
Định lý giới hạn trung tâm
Định lý khẳng định rằng tổng (và số
bình quân) của một tập hợp các biến
ngẫu nhiên tuân theo phân phối
chuẩn, khi mẫu được chọn có quy
mô đủ lớn, cho dù từng biến cá biệt
chấp nhận dạng phân phối nào
Chi-square distribution
Phân phối khi bình phương
Phân phối xác suất có tham số là n
bậc tự do. Phân phối này rất hữu ích
trong các công trình kinh tế lượng, vì
tổng bình phương của n biến chuẩn
độc lập có thể được coi là tuân theo
phân phối khi bình phương với n bậc
tự do
Confidence interval
Khoảng tin cậy
Một loại ước lượng khoảng, được
tính từ số liệu thống kê của dữ liệu
quan sát được, có thể bao hàm giá trị
thực của tham số tổng thể chưa biết
Convenience sampling
Lẫy mẫu thuận tiện
Lấy mẫu dựa trên sự thuận lợi hay
dựa trên tính dễ tiếp cận của đối
tượng, ở những nơi mà nhân viên
điều tra có nhiều khả năng gặp được
đối tượng
Data mining
Đào dữ liệu
Quá trình tính toán để tìm ra các
mẫu trong các bộ dữ liệu lớn liên
quan đến các phương pháp tại giao
điểm của máy học, thống kê và các
hệ thống cơ sở dữ liệu
Degree of confidence
Độ tin cậy
Độ tin cậy biểu thị tần số (tỷ lệ) của
các khoảng tin cậy có thể có chứa giá
trị thực của tham số quần thể chưa
biết
Degree of freedom
(df)
Số bậc tự do
Số giá trị trong phép tính cuối cùng
của một thống kê có thể tự do thay
đổi
Efficient
Hiệu quả
Biến ngẫu nhiên dao động quanh giá
trị kì vọng của nó. Nếu phương sai
V(x) càng bé, thì sự dao động càng
yếu. Vì vậy ta muốn phương sai của
ước lượng là nhỏ nhất có thể. Khi đó
ta nói ước lượng là hiệu quả
Estimator
Ước lượng
Một giá trị được tính toán từ một
mẫu thử và người ta hy vọng đó là
giá trị tiêu biểu cho giá trị cần xác
định trong tổng thể
F ratio (F statistic)
Tỷ lệ F (thống kê F)
Tỷ lệ biến thiên giữa các số trung
bình mẫu và sự biến thiên trong nội
bộ các mẫu. Nó được sử dụng trong
quá trình kiểm định giả thuyết khi
phải quyết định xem liệu các trường
hợp chênh lệch quan sát được giữa
số trung bình của nhiều mẫu có thể
coi là có tính ngẫu nhiên hay không
F-distribution
Phân phối Fisher
Một phân phối lệch phải (right-
skewed distribution) được sử dụng
phổ biến trong phân tích phương sai
Indexing
Phương pháp chỉ số
Một chiến lược đầu tư trong đó một
nhà đầu tư xây dựng một danh mục
đầu tư để phản ánh hiệu suất của
một chỉ số cụ thể
Intergenerational data mining
Khai phá dữ liệu giữa các thế hệ
Một dạng khai phá dữ liệu mà áp
dụng những thông tin được xây dựng
từ những người nghiên cứu trước, sử
dụng tập dữ liệu để hướng dẫn cho
nghiên cứu hiện tại sử dụng tập dữ
liệu giống nhau hoặc có liên quan
Longitudinal data
Dữ liệu theo chiều dọc
Dữ liệu bao gồm các quan sát lặp đi
lặp lại của cùng một biến trong một
khoảng thời gian
Look-ahead bias
Thiên lệch nhìn thẳng
Thiên lệch do sử dụng thông tin
không phù hợp vào ngày kiểm tra
Lower bound
Giới hạn dưới
Giới hạn trên của tập con S của một
tập hợp có thứ tự một phần là một
phần tử của K nhỏ hơn hoặc bằng
mọi phần tử của S
Monetary policy
Chính sách tiền tệ
Chính sách được cơ quan tiền tệ của
một quốc gia áp dụng kiểm soát lãi
suất phải trả khi vay rất ngắn hạn
hoặc cung tiền, thường nhắm mục
tiêu lạm phát hoặc lãi suất để đảm
bảo sự ổn định giá cả và niềm tin
chung vào tiền tệ
Out-of-sample test
Kiểm tra ngoài mẫu
Sự kiểm tra một chiến lược hoặc mô
hình sử dụng mẫu nằm ngoài khoảng
thời gian mà chiến lược hoặc mô
hình được xây dựng
Panel data
Số liệu hỗn hợp
Số liệu hỗn hợp gồm các quan sát về
nhiều biến rút ra qua nhiều thời
điểm khác nhau. Dữ liệu chuỗi thời
gian và dữ liệu chéo là các trường
hợp đặc biệt của số liệu hỗn hợp khi
mà chỉ xét một chiều
Point estimate
Ước tính điểm
Trong thống kê, ước tính điểm liên
quan đến việc sử dụng dữ liệu mẫu
để tính toán một giá trị duy nhất là
"dự đoán tốt nhất" hoặc "ước tính
tốt nhất" của một tham số tổng thể
chưa biết
Sampling
Lẫy mẫu
Quá trình thu thập mẫu nghiên cứu
Sampling error
Sai số chọn mẫu
Chênh lệch giữa mức độ được tính ra
từ tổng thể mẫu và mức độ tương
ứng của tổng thể chung
Simple random sample
Mẫu ngẫu nhiên đơn
Một tập hợp con của các cá thể được
lựa chọn từ một tập hợp lớn hơn
Stratified sampling
Lấy mẫu phân tầng
Một phương pháp lấy mẫu từ quần
thể nghiên cứu thành các nhóm riêng
rẽ, do có sự khác biệt về đặc tính
nghiên cứu của các cá thể ở các tầng
Survivorship bias
Thiên lệch sống sót
Ám chỉ xu hướng của con người tập
trung vào những người chiến thắng
trong một lĩnh vực đặc biệt và cố
gắng học hỏi từ họ trong khi hoàn
toàn bỏ qua những người thất bại
mà cũng đã từng áp dụng một chiến
lược hành động như vậy
Systematic sampling
Lẫy mẫu hệ thống
Một phương pháp thống kê liên
quan đến việc lựa chọn các yếu tố từ
khung lấy mẫu theo thứ tự
T-distribution
Phân phối Student
Phân phối mẫu lí thuyết gần đúng với
phân phối chuẩn. Phân phối t được
sử dụng để thiết lập khoảng tin cậy
khi dùng các mẫu nhỏ để ước lượng
giá trị bình quân chân thực của tổng
thể
Test statistic
Thống kê kiểm định
Đại lượng được tính để thực hiện các
kiểm định thống kê. Trong điều kiện
giả thuyết 0, đại lượng thống kê này
tuân theo một phân phối xác suất
nhất định mà giả thuyết ngược lại
không tuân theo
Time-period bias
Thiên lệch khoảng thời gian
Khả năng mà khi sử dụng mẫu số liệu
chuỗi thời gian, kết luận thống kê
nhạy cảm với ngày bắt đầu và ngày
kiến thúc của mẫu
Unbiased
Không chệch
Một biến ngẫu nhiên luôn dao động
xung quanh giá trị kì vọng của nó. Ta
muốn là kì vọng của x phải bằng X.
Khi đó ta nói ước lượng là không
chệch (unbiased)
Z-distribution
Phân phối chuẩn (Phân phối Gauss)
Loại phân phối xác suất đặc biệt mà
phân phối liên tục của nó (đường
chuẩn) có dạng hình chuông đối
xứng và tiệm cân trục hoành ở cả hai
phía. Đường chuẩn có thuộc tính đặc
trưng là xác định được khi biết giá trị
bình quân và độ lệch tiêu chuẩn