Phân tích tương quan và hồi quy

 

1.Phân tích tương quan

Mục tiêu phân tích

Câu hỏi: Nhiệt độ hàn có ảnh hưởng đến số lượng lỗi hàn không?

Chúng ta sẽ sử dụng phân tích tương quan Pearson (hệ số r) để kiểm tra xem mối quan hệ giữa nhiệt độ hàn và số lỗi hàn là mạnh hay yếu, dương hay âm.

Dữ liệu giả định

Dưới đây là một bảng dữ liệu đơn giản (ví dụ), ghi lại nhiệt độ hàn và số lỗi hàn tương ứng:

Nhiệt độ hàn (°C)     

Số lỗi hàn

230

15

235

14

240

11

245

8

250

5

Bước 1:Tính hệ số tương quan r

 Công thức tính hệ số tương quan:



Tính giá trị trung bình của x và y:
Lập bảng tính từng phần tử cần thiết

Thay vào công thức tính ra hệ số tương quan:

Giải thích kết quả r = -0.81

Giá trị của r

Mức độ liên quan

    0 đến ±0.3

Yếu hoặc không có liên hệ

   ±0.31 đến ±0.6

Mức trung bình

   ±0.61 đến ±0.8

Mạnh

  ±0.81 đến ±1.0           

Rất mạnh

Bước 2 Kết luận:

1.Khi kỹ sư sản xuất tăng nhiệt độ hàn từ 230°C đến 250°C, số lỗi hàn giảm từ 15 xuống còn 5 lỗi. Điều này chứng minh rằng: 

2.Nhiệt độ hàn ảnh hưởng mạnh đến chất lượng hàn. 

3.Nếu chọn đúng mức nhiệt độ phù hợp, ta có thể giảm đáng kể lỗi hàn trong dây chuyền. 

4.r≈−0.81: Hệ số tương quan âm mạnh ⇒ Nhiệt độ tăng thì lỗi hàn có xu hướng giảm, nhưng không hoàn toàn tuyến tính do có điểm tăng trở lại. 

Chú thích: Hệ số tương quan Pearson rrchỉ số đo mức độ liên hệ tuyến tính giữa hai biến (ở đây là nhiệt độ hànsố lỗi hàn).

luôn nằm trong khoảng từ -1 đến 1:

r < 0: Tương quan âm (một biến tăng thì biến kia giảm)

r = 0: Không có mối quan hệ tuyến tính

r > 0: Tương quan dương (một biến tăng thì biến kia cũng tăng)

Nếu bạn chỉ dùng từ 230°C–250°C thì r còn gần -1 hơn (rất mạnh).

Bước 3: Đưa ra phương pháp giải quyết vấn đề

Theo kết quả r = -0.81, nhà máy nên:Tăng nhiệt độ hàn trong giới hạn an toàn từ 230°C lên 250°C để giảm số lõi hàn về mức thấp nhất

Theo dõi thêm các yếu tố khác (như thời gian hàn, loại vật liệu PCB…) để đánh giá toàn diện hơn.

Có thể kết hợp với hồi quy tuyến tính để dự đoán số lỗi dựa trên nhiệt độ.

 2. Phân tích tuyến tính

1. Hồi quy tuyến tính là gì?

Hồi quy tuyến tính đơn là một kỹ thuật để xác định mối quan hệ tuyến tính giữa một biến độc lập (ví dụ: Nhiệt độ hàn) và một biến phụ thuộc (ví dụ: Số lỗi).

Ta cố gắng tìm một đường thẳng tốt nhất (best-fit line) có công thức:

Y = a·X + b

Trong đó:

Y là biến phụ thuộc (Số lỗi),

X là biến độc lập (Nhiệt độ),

a là hệ số góc (slope), cho biết mối quan hệ (giảm hay tăng),

b là hệ số chặn (intercept), giá trị của Y khi X = 0.

2. Làm sao để tìm a và b?

3. Ví dụ cụ thể

Giả sử bạn có bảng dữ liệu thực nghiệm như sau:

Nhiệt độ (X)

Số lỗi (Y)

230

15

235

12

240

10

245

8

250

5

Chúng ta áp dụng công thức trên:


∑X=230+235+240+245+250=1200

∑Y=15+12+10+8+5=50

∑X^2=230^2+235^2+240^2+245^2+250^2=288250

∑XY=(230×15)+(235×12)+(240×10)+(245×8)+(250×5)=11850

n=5

Sau khi thế vào công thức, ta tính ra:

3 Kết quả: Phương trình hồi quy

Số lỗi≈−0.48*Nhiệt độ+125.2 tức là ≈−0.48*230+125.2=14.8 chiếc

4 Giải thích nhanh:

Hệ số a = -0.48 → Mỗi khi nhiệt độ tăng 1°C thì số lỗi giảm trung bình 0.48 lỗi

Hệ số b = 125.2 → Giá trị chặn (khi nhiệt độ là 0 – không có nghĩa thực tế nhưng phục vụ tính toán)

Thot nhìn bng dliu shàng NG thc tế và tính toán nếu tăng nhit đt230 lên 235 (tc 5 đC) thì shàng NG gim 3, khi tăng mi 1 đC thc tế sgim sng NG tương đương (235-230)/5=0.6.

Thế nhưng do đây chlà phương tính hi quy nên xét vtính an toàn và tính bao quát nó scó kết qukhác bit so vi thc tế vì thc tế có khnăng thay đi cao.










Đăng nhận xét

0 Nhận xét