1.Phân tích tương quan
Mục tiêu phân tích
Câu hỏi: Nhiệt độ hàn có ảnh hưởng đến số lượng lỗi hàn không?
Chúng ta sẽ sử dụng phân tích tương quan Pearson (hệ số r) để kiểm tra xem mối quan hệ giữa nhiệt độ hàn và số lỗi hàn là mạnh hay yếu, dương hay âm.
Dữ liệu giả định
Dưới đây là một bảng dữ liệu đơn giản (ví dụ), ghi lại nhiệt độ hàn và số lỗi hàn tương ứng:
Nhiệt độ hàn (°C) | Số lỗi hàn |
230 | 15 |
235 | 14 |
240 | 11 |
245 | 8 |
250 | 5 |
Bước 1:Tính hệ số tương quan r
Công thức tính hệ số tương quan:
Giải thích kết quả r = -0.81
Giá trị của r | Mức độ liên quan |
0 đến ±0.3 | Yếu hoặc không có liên hệ |
±0.31 đến ±0.6 | Mức trung bình |
±0.61 đến ±0.8 | Mạnh |
±0.81 đến ±1.0 | Rất mạnh |
Bước 2 Kết luận:
1.Khi kỹ sư sản xuất tăng nhiệt độ hàn từ 230°C đến 250°C, số lỗi hàn giảm từ 15 xuống còn 5 lỗi. Điều này chứng minh rằng:
2.Nhiệt độ hàn ảnh hưởng mạnh đến chất lượng hàn.
3.Nếu chọn đúng mức nhiệt độ phù hợp, ta có thể giảm đáng kể lỗi hàn trong dây chuyền.
4.r≈−0.81: Hệ số tương quan âm mạnh ⇒ Nhiệt độ tăng thì lỗi hàn có xu hướng giảm, nhưng không hoàn toàn tuyến tính do có điểm tăng trở lại.
Chú thích: Hệ số tương quan Pearson là chỉ số đo mức độ liên hệ tuyến tính giữa hai biến (ở đây là nhiệt độ hàn và số lỗi hàn).
luôn nằm trong khoảng từ -1 đến 1:
r < 0: Tương quan âm (một biến tăng thì biến kia giảm)
r = 0: Không có mối quan hệ tuyến tính
r > 0: Tương quan dương (một biến tăng thì biến kia cũng tăng)
Nếu bạn chỉ dùng từ 230°C–250°C thì r còn gần -1 hơn (rất mạnh).
Bước 3: Đưa ra phương pháp giải quyết vấn đề
Theo kết quả r = -0.81, nhà máy nên:Tăng nhiệt độ hàn trong giới hạn an toàn từ 230°C lên 250°C để giảm số lõi hàn về mức thấp nhất
Theo dõi thêm các yếu tố khác (như thời gian hàn, loại vật liệu PCB…) để đánh giá toàn diện hơn.
Có thể kết hợp với hồi quy tuyến tính để dự đoán số lỗi dựa trên nhiệt độ.
2. Phân tích tuyến tính
1. Hồi quy tuyến tính là gì?
Hồi quy tuyến tính đơn là một kỹ thuật để xác định mối quan hệ tuyến tính giữa một biến độc lập (ví dụ: Nhiệt độ hàn) và một biến phụ thuộc (ví dụ: Số lỗi).
Ta cố gắng tìm một đường thẳng tốt nhất (best-fit line) có công thức:
Y = a·X + b
Trong đó:
Y là biến phụ thuộc (Số lỗi),
X là biến độc lập (Nhiệt độ),
a là hệ số góc (slope), cho biết mối quan hệ (giảm hay tăng),
b là hệ số chặn (intercept), giá trị của Y khi X = 0.
2. Làm sao để tìm a và b?
3. Ví dụ cụ thể
Giả sử bạn có bảng dữ liệu thực nghiệm như sau:
Nhiệt độ (X) | Số lỗi (Y) |
230 | 15 |
235 | 12 |
240 | 10 |
245 | 8 |
250 | 5 |
Chúng ta áp dụng công thức trên:
∑X=230+235+240+245+250=1200
∑Y=15+12+10+8+5=50
∑X^2=230^2+235^2+240^2+245^2+250^2=288250
∑XY=(230×15)+(235×12)+(240×10)+(245×8)+(250×5)=11850
n=5
Sau khi thế vào công thức, ta tính ra:
3 Kết quả: Phương trình hồi quy
Số lỗi≈−0.48*Nhiệt độ+125.2 tức là ≈−0.48*230+125.2=14.8 chiếc
4 Giải thích nhanh:
Hệ số a = -0.48 → Mỗi khi nhiệt độ tăng 1°C thì số lỗi giảm trung bình 0.48 lỗi
Hệ số b = 125.2 → Giá trị chặn (khi nhiệt độ là 0 – không có nghĩa thực tế nhưng phục vụ tính toán)
Thoạt nhìn bảng dữ liệu số hàng NG thực tế và tính toán nếu tăng nhiệt độ từ 230 lên 235 (tức 5 độ C) thì số hàng NG giảm 3, khi tăng mỗi 1 độ C thực tế sẽ giảm số lượng NG tương đương (235-230)/5=0.6.
Thế nhưng do đây chỉ là phương tính hồi quy nên xét về tính an toàn và tính bao quát nó sẽ có kết quả khác biệt so với thực tế vì thực tế có khả năng thay đổi cao.
0 Nhận xét