Mô hình thống kê có vai trò rất quan trọng trong phân tích thống kê. Khi đã xác định (identified) được mô hình, nhiều dạng suy diễn khác nhau có thể thực hiện: dự báo, kiểm soát, trích xuất thông tin, khám phá tri thức, xác nhận, đánh giá rủi ro, ra quyết định. Do đó, chìa khóa để giải những vấn đề thực tế phức tạp nằm trong việc phát triển và xây dựng mô hình phù hợp .
Khái niệm
Theo , việc hiểu mô hình thống kê quan trọng hơn là mô tả chính xác về mặt toán học. Vì vậy hầu hết các tác giả không đưa ra một định nghĩa toán học chính xác về mô hình thống kê.
Theo , mô hình thống kê là một phân phối xác suất được xây dựng cho phép rút ra các suy luận hoặc đưa ra quyết định từ dữ liệu.
Theo , mô hình thống kê là một phân phối xác suất sử dụng dữ liệu quan sát được để xấp xỉ phân phối thực (true distribution) của các sự kiện xác suất. Tức là, mục đích của việc xây dựng mô hình thống kê là để có được một mô hình xấp xỉ, càng gần với cấu trúc thực càng tốt.

Điểm chính của mô hình thống kê là biểu diễn biến thiên bằng các phân phối xác suất như là các khối tạo thành mô hình. Mô hình phải phù hợp với cả sự biến thiên ngẫu nhiên và biến thiên hệ thống . Tức là, mô hình thống kê cơ bản thể hiện mối quan hệ giữa dữ liệu quan sát, mô hình [tức biến thiên hệ thống] và sai số [tức biến thiên ngẫu nhiên] :
Dữ liệu = Mô hình + Sai số
Mô hình tổng quát
Tổng quát, trong một mô hình có các loại biến như sau:

Trong mô hình trên, có bốn nhóm biến:
- Biến phụ thuộc (dependent variables): Biến bị tác động bởi một hay nhiều biến khác trong mô hình.
- Biến độc lập (independent variables): Biến tác động (giải thích biến thiên) của các biến khác (trung gian/phụ thuộc).
- Biến điều tiết (moderating variables): Biến làm thay đổi tác động của biến độc lập → biến phụ thuộc hoặc biến độc lập → biến trung gian → biến phụ thuộc. Một mô hình nghiên cứu có thể có một/nhiều biến điều tiết và một biến điều tiết có thể làm thay đổi một hay nhiều tác động của các cặp biến. Biến điều tiết có thể là biến định tính hoặc định lượng nhưng thường là định tính.
- Biến trung gian (mediating variables): Biến làm cầu nối giữa biến độc lập, biến phụ thuộc. một mô hình có thể có nhiều biến trung gian và có thể có nhiều cấp trung gian (như A → B → C → D).
Các khái niệm là các biến tiềm ẩn (latent variables) được đo lường bằng nhiều biến quan sát. Thêm vào đó các biến trong mô hình có thể tác động qua lại lẫn nhau (nonrecursive model). Vì vậy một mô hình tổng quát bao gồm:
- Mô hình đo lường (measurement model): biểu diễn mối quan hệ giữa biến đo lường (biến quan sát) với biến tiềm ẩn.
- Mô hình cấu trúc (structural model): biểu diễn mối quan hệ giữa các biến tiềm ẩn (các giả thuyết).

Trong hình trên:
- \eta (eta) – Biến tiềm ẩn (biến phụ thuộc hoặc biến trung gian) còn gọi là biến nội sinh (endogenous) hay trong hồi quy là dependent/criterion.
- \xi (xi) – Biến độc lập còn gọi là biến ngoại sinh (exogenous) hay trong hồi quy là independent/predictor.
- \gamma (gamma) – Trọng số hồi quy giữa biến độc lập và biến phụ thuộc/biến trung gian.
- \beta (beta) – Trọng số hồi quy giữa biến trung gian và biến phụ thuộc.
- \lambda (lambda) – Trọng số nhân tố giữa biến đo lường và biến tiềm ẩn.
- \zeta (zeta) – Sai số (phần dư) của biến phụ thuộc.
- \delta (delta) – Sai số của biến quan sát đo lường biến độc lập.
- \varepsilon ()var epsilon) – Sai số của biến quan sát đo lường biến phụ thuộc.
Ví dụ mô hình thống kê
Mô hình hồi quy (Regression Model):
Một mô hình hồi quy chỉ gồm các biến quan sát trong đó một biến quan sát phụ thuộc (dependent observed variable) được dự báo hay được giải thích bởi một hoặc vài biến quan sát độc lập (independent observed variable) .
Ví dụ: Trình độ học vấn của bố mẹ (biến quan sát độc lập) được dùng để dự báo điểm số nhận được của trẻ (biến quan sát phụ thuộc).
Mô hình đường dẫn (Path Model):
Mô hình đường dẫn cũng được xác định hoàn toàn bởi các biến quan sát nhưng có thể có nhiều biến quan sát phụ thuộc và nhiều biến quan sát độc lập .
Ví dụ: Giá trị xuất khẩu, GDP và chỉ số NASDAQ ảnh hưởng đến lòng tin và chi tiêu của người tiêu dùng (2 biến quan sát phụ thuộc).
Mô hình nhân tố khẳng định (Confirmatory Factor Model):
Mô hình nhân tố khẳng định gồm các biến quan sát được giả thiết là đo lường một hoặc nhiều biến tiềm ẩn (phụ thuộc hoặc độc lập).
Ví dụ: Chế độ ăn uống, tập thể dục và hoạt động sinh lý là các đo lường quan sát được của biến tiềm ẩn phụ thuộc “sức khỏe”.