Lý thuyết xác suất thống kê

     

Xác suất thống kê là nền tảng quan trọng của các mô hình học máy và phân tích dữ liệu. Bài viết này là ghi chép của tôi về các kiến thức, khái niệm cơ bản nhất về xác suất thống kê, từ đó có thể giúp người đọc tiếp cận và xem lại các kiến thức cho bộ môn này.

Bạn đang xem: Lý thuyết xác suất thống kê

Xác suất, xác suất có điều kiện, công thức Bayes

1. Phép thử, sự kiện, không gian mẫu

Khái niệm

Phép thử ngẫu nhiên là một chuỗi các phương thức thực hiện và quan sát một thí nghiệm nào đó cho chúng ta kết quả mà ta không thể dự đoán trước được.

Sự kiện sơ cấp là kết quả quan sát được đơn giản nhất không thể tách nhỏ hơn của một phép thử.

Không gian mẫu ($S$) là tập hợp tất cả các sự kiện sơ cấp của một phép thử và xung khắc với nhau, ký hiệu S.

Tập con bất kỳ của không gian mẫu được gọi là sự kiện.

Tính chất

Không gian mẫu $\Omega$ là một tập hợp, sự kiện là tập con của $\Omega$ nên các mỗi quan hệ (tập con, tương đương) và các phép toán (hợp, giao, phần bù, trừ) cũng tương tự như ký thuyết tập hợp.

Tính xung khắc: $ A_{1}, \dots , A_{n} $ được gọi là xung khắc nếu $ A_{i} \cap A_{j} = \emptyset, \forall i \ne j$.

Tính đầy đủ: $ A_{1}, \dots , A_{n} $ được gọi là đầy đủ nếu $ A_{i} \cup \dots \cup A_{n} = S $.

Không gian các sự kiện: $ A_{1}, \dots , A_{n} $ được gọi là một không gian các dự kiện nếu nó vừa xung khắc, vừa đầy đủ.

2. Xác suất

Khái niệm, tính chất

Xác suất của một phép thử là một ánh xạ $ P(.) $ từ không gian mẫu vào tập số thực thoả mãn:

Với mọi sự kiện $A$ thì $P(A) \geq 0$.$P(\Omega) = 1$.Cho $ A_{1}, A_{2},\dots $ xung khắc thì:

$$P(A_{1} \cup A_{2} \dots) = P(A_{1}) + P(A_{2}) + \dots$$

Từ 3 tiên đề trên, ta có các tính chất:

$P(\emptyset) = 0$$A, B$ xung khắc thì $P(A \cup B) = P(A) + P(B)$.$A, B$ bất kỳ $P(A \cup B) = P(A) + P(B) - P(A \cap B) $.Định nghĩa xác suất cổ điển

Xác suất cổ điển được xây dựng trên các không gian mẫu hữu hạn và đồng khả năng $\Omega = {w_1, w_2, \dots, w_n}$.

Vì các sự kiện có đồng khả năng xảy ra nên $P(w_1) = P(w_2) = \dots = P(w_n)$.

Xem thêm: Độ Lớn Của Lực Ma Sát Phụ Thuộc Vào Yếu Tố Nào ? Please Wait

Do $1 = P(\Omega) = P({w_1}) + P({w_2}) + \dots + P({w_n}) = nP({w_1})$ nên $P({w_i}) = \frac{1}{n}, \forall i = \overline{1,n}$.

A là một sự kiện thì $P(A) = \frac{\#A}{\#\Omega}$.

Xác suất có điều kiện

Một phép thử nếu biết sự kiện $B, P(P) \ne 0$ đã xảy ra thì xác suất sự kiện A xảy ra là xác suất có điều kiện $P(A|B)$ được xác định bởi công thức:

$$P(A|B) = \frac{P(A \cap B)}{P(B)}$$

Công thức nhân:

$$P(A \cap B) = P(B).P(A|B) = P(A).P(B|A)$$

Hai sự kiện được gọi là độc lập nếu và chỉ nếu:

$$P(A \cap B) = P(A).P(B)$$

3. Công thức Bayes

Xác suất toàn phần

$$\sum_{i=1}^n(P(A_i.P(B|A_i)))$$

Công thức Bayes

Công thức Bayes cho 2 sự kiện $A$, $B$

Cho hai sự kiện $A, B$ và $P(A), P(B)$ là hai xác suất được quan sát độc lập với nhau.

$P(A)$ được gọi là xác suất tiên nghiệm (Prior).$P(B)$ được gọi là xác suất hậu nghiệm (Evidence).$P(B) = P(B|A) \times P(A) + P(B|\bar{A}) \times P(\bar{A})$.$P(A|B)$ được gọi là xác suất hậu nghiệm (Posterior).$P(B|A)$ được gọi là xác suất có thể đúng (Likelihood).

Ta có công thức Bayes cho 2 sự kiện $A$ và $B$

$$P(A|B) = \frac{P(A).P(B|A)}{P(B)}$$

$$Posterior = Likelihood \times Prior / Evidence$$

Công thức Bayes tổng quát:

Cho không gian các sự kiện $A_1, \dots, A_n$. B là một sự kiện nào đó.

Ta có công thức xác suất toàn phần:

$$P(B) = \sum_{i=1}^{n}P(A_i).P(B|A_i)$$

Công thức Bayes tổng quát cho nhiều sự kiện:

$$P(A_i|B) = \frac{P(A_i \cap B)}{P(B)} = \frac{(P(A_i \cap B))}{\sum_{i=1}^n(P(A_j).P(B|A_j))}$$

Biến ngẫu nhiên và phân phối xác suất

1. Biến ngẫu nhiên

Khái niệm

Biến ngẫu nhiên (random variables) là các biến nhận 1 giá trị ngẫu nhiên đại diện cho kết quả của phép thử. Mỗi giá trị nhận được $x$ của biến ngẫu nhiên $X$ được gọi là một thể hiện của $X$, đây cũng là kết quả của phép thử hay còn được hiểu là một sự kiện.

Biến ngẫu nhiên có 2 dạng:

Liên tục (continous): tập giá trị là liên tục tức là lấp đầy 1 khoảng trục số, không đếm được.Ví dụ

Khi gieo 2 con xúc sắc, gọi X, Y lần lượt là số chấm xuất hiện trên mặt của con thứ nhất và thứ 2 thì X, Y là hai biến ngẫu nhiên vì có cùng kết quả kiểu số. Các hàm số như $X + Y, 2XY, sin(XY)$ cũng là các biến ngẫu nhiên.

2. Phân phối xác suất

Hàm trọng số (Probability mass function - PMF)

Xét biến ngẫu nhiên rời rạc $X$ có miền giá trị có thể nhận $(x_1, x_2, \dots, x_n$. Hàm trọng số của một biến ngẫu nhiên rời rạc ký hiệu là:

$$P_X(x) = P(X = x), \forall x \in \mathbb{R}$$

Ý nghĩa: Hàm trọng số thể hiện khả năng xảy ra tại một điểm $x$.

Bảng phân phối xác suất

$X = x$$x_1$$\dots$$x_n$
$P_X(x)$P_X(x_1)$\dots$$P_X(x_n)$

Tính chất

$P_X(x) \geq 0, \forall x \in \mathbb{R}$$\sum_{i=1}^{n}P_X(x_i) = 1$Hàm phân phối xác suất (Cumulative distribution function - CDF)

Hàm phân phối xác suất của biến ngẫu nhiên $X$ là hàm được xác định bởi công thức:

$$F_X(x) = P(X \le x), \forall x \in \mathbb{R}$$

Ý nghĩa: Hàm phân phối xác suất là xác suất của sự kiện "biến ngẫu nhiên $X$ nhận giá trị nằm trong khoảng từ $−\infty$ tới $x$". Khi có hàm phân phối ta thực hiện với hàm giảitích thay vì làm với các phép toán với sự kiện.

Tính chất

$F_x(-\infty) = 0; F_X(+\infty) = 1$$P(X \leq a) = F_X(a); P(X > a) = 1 - F_X(a)$$P(a

$X$ là biến ngẫu nhiên rời rạc thì $F_X(x) = \sum x_i Ví dụ cho hàm trọng số và hàm phân phối xác suất

Gieo một con xúc sắc. $X$ là số chấm xuất hiện. Các giá trị X có thể nhận là $S = \{1, 2, 3, 4, 5, 6\}$

Hàm trọng số

$$P_X(x) =\begin{cases}1/6; & x \in \Omega \\0; & x \notin \Omega\end{cases}$$

Hàm phân phối xác suất $F_X(x) =\begin{cases}0; & x

Giả lập thí nghiệm gieo xúc sắc

Mô phỏng tung một con xúc sắc cân đối đồng chất 5000 lần.

Xem thêm: Khi Nhiệt Phân Hoàn Toàn Kno3 Thu Được Sản Phẩm Là, Nhiệt Phân Kno3

Dựa vào các giá trị mô phỏng, in ra bảng phân phối xác suất.Vẽ đồ thị hàm trọng số và hàm phân phối xác suất.Tính xác suất số điểm trên mặt xúc sắc lớn hơn 2 và không vượt quá 4.