Mô hình thống kê có vai trò rất quan trọng trong phân tích thống kê. Khi đã xác định (identified) được mô hình, nhiều dạng suy diễn khác nhau có thể thực hiện: dự báo, kiểm soát, trích xuất thông tin, khám phá tri thức, xác nhận, đánh giá rủi ro, ra quyết định. Do đó, chìa khóa để giải những vấn đề thực tế phức tạp nằm trong việc phát triển và xây dựng mô hình phù hợp .

Khái niệm

Theo , việc hiểu mô hình thống kê quan trọng hơn là mô tả chính xác về mặt toán học. Vì vậy hầu hết các tác giả không đưa ra một định nghĩa toán học chính xác về mô hình thống kê.

Theo , mô hình thống kê là một phân phối xác suất được xây dựng cho phép rút ra các suy luận hoặc đưa ra quyết định từ dữ liệu.

Theo , mô hình thống kê là một phân phối xác suất sử dụng dữ liệu quan sát được để xấp xỉ phân phối thực (true distribution) của các sự kiện xác suất. Tức là, mục đích của việc xây dựng mô hình thống kê là để có được một mô hình xấp xỉ, càng gần với cấu trúc thực càng tốt.

Mô hình, dữ liệu, phân phối thực

Điểm chính của mô hình thống kê là biểu diễn biến thiên bằng các phân phối xác suất như là các khối tạo thành mô hình. Mô hình phải phù hợp với cả sự biến thiên ngẫu nhiên và biến thiên hệ thống . Tức là, mô hình thống kê cơ bản thể hiện mối quan hệ giữa dữ liệu quan sát, mô hình [tức biến thiên hệ thống] và sai số [tức biến thiên ngẫu nhiên] :

Dữ liệu = Mô hình + Sai số

Mô hình tổng quát

Tổng quát, trong một mô hình có các loại biến như sau:

Các loại biến trong mô hình thống kê

Trong mô hình trên, có bốn nhóm biến:

Các khái niệm là các biến tiềm ẩn (latent variables) được đo lường bằng nhiều biến quan sát. Thêm vào đó các biến trong mô hình có thể tác động qua lại lẫn nhau (nonrecursive model). Vì vậy một mô hình tổng quát bao gồm:

  • Mô hình đo lường (measurement model): biểu diễn mối quan hệ giữa biến đo lường (biến quan sát) với biến tiềm ẩn.
  • Mô hình cấu trúc (structural model): biểu diễn mối quan hệ giữa các biến tiềm ẩn (các giả thuyết).
Mô hình nghiên cứu

Trong hình trên:

Ví dụ mô hình thống kê

Mô hình hồi quy (Regression Model):

Một mô hình hồi quy chỉ gồm các biến quan sát trong đó một biến quan sát phụ thuộc (dependent observed variable) được dự báo hay được giải thích bởi một hoặc vài biến quan sát độc lập (independent observed variable) .

Ví dụ: Trình độ học vấn của bố mẹ (biến quan sát độc lập) được dùng để dự báo điểm số nhận được của trẻ (biến quan sát phụ thuộc).

Mô hình đường dẫn (Path Model):

Mô hình đường dẫn cũng được xác định hoàn toàn bởi các biến quan sát nhưng có thể có nhiều biến quan sát phụ thuộc và nhiều biến quan sát độc lập .

Ví dụ: Giá trị xuất khẩu, GDP và chỉ số NASDAQ ảnh hưởng đến lòng tin và chi tiêu của người tiêu dùng (2 biến quan sát phụ thuộc).

Mô hình nhân tố khẳng định (Confirmatory Factor Model):

Mô hình nhân tố khẳng định gồm các biến quan sát được giả thiết là đo lường một hoặc nhiều biến tiềm ẩn (phụ thuộc hoặc độc lập).

Ví dụ: Chế độ ăn uống, tập thể dục và hoạt động sinh lý là các đo lường quan sát được của biến tiềm ẩn phụ thuộc “sức khỏe”.