Biểu đồ phân tán là gì? Tìm hiểu ý nghĩa và cách vẽ biểu đồ phân tán

Biểu đồ phân tán (Scatter plot) là công cụ thường xuyên được sử dụng để phân tích sự tác động lẫn nhau của 2 yếu tố cụ thể. Hiện tại, phần mềm Excel đã hỗ trợ người dùng trong việc xây dựng Scatter plot được dễ dàng hơn. Trong bài viết này, PMS sẽ giúp bạn hiểu được ý nghĩa và cách để vẽ biểu để phân tán trong Excel một cách chi tiết và cụ thể. Mời bạn cùng xem qua nhé! 

biểu đồ phân tán
Tìm hiểu biểu đồ phân tán là gì?

1. Biểu đồ phân tán là gì?

Một biểu đồ phân tán hay còn gọi là biểu đồ tán xạ là biểu đồ sử dụng các điểm chấm để biểu diễn mối tương quan của hai biến số dựa trên tọa độ toán học. Vị trí của mỗi điểm chấm thể hiện:

  • Giá trị của biến được dự đoán. Nó được thể hiện trên trục tung (biến phụ thuộc).
  • Giá trị của biến dùng để dự đoán. Được thể hiện trên trục hoành (biến độc lập). 

Scatter plot được sử dụng để quan sát và hiển thị mối quan hệ giữa các biến số. Các điểm trong Scatter plot không chỉ cho thấy giá trị của từng điểm dữ liệu mà còn hiển thị tổng quan kết quả của dữ liệu được xem xét tổng thể.

2. Ý nghĩa của biểu đồ phân tán trong quản lý chất lượng

Là 1 trong 7 công cụ quản lý chất lượng phổ biến, biểu đồ Scatter plot giữ nhiều vai trò nhằm mang lại các giá trị cho doanh nghiệp như:

y nghia cua bieu do phan tan
Ý nghĩa của biểu đồ phân tán

2.1 Thể hiện mối quan hệ giữa hai biến

Vai trò phổ biến nhất của biểu đồ phân tán là hiển thị mối quan hệ giữa hai biến và quan sát sự tương quan của mối quan hệ đó. Mối quan hệ có thể là tích cực hoặc tiêu cực, tỷ lệ thuận hay nghịch với nhau.

2.2 Nhận diện mẫu dữ liệu và dự đoán xu hướng

Ta có thể xác định tình trạng và dự đoán xu hướng tương lai về mẫu dữ liệu thông qua biểu đồ phân tán. Ví dụ: nó có thể được sử dụng để xác định xem vào thời điểm nào trong năm, doanh nghiệp xảy ra tình trạng sản phẩm có bị lỗi nhiều hơn. Từ đó dự đoán số lượng tình trạng lỗi vào những năm tiếp theo.

2.3 Xác định các điểm ngoại lai

Đặc điểm ngoại lai là các điểm dữ liệu không tuân theo sự tương quan chung, nó thường phân bổ các xa các điểm còn lại của biểu đồ. Scatter plot giúp dễ dàng phát hiện các điểm này – từ đó xem xét liệu đó có phải là tín hiệu của các vấn đề hay sai sót phát sinh trong quá trình quản lý chất lượng của doanh nghiệp.

3. Ưu nhược điểm của Scatter charts

3.1 Lợi ích của biểu đồ phân tán

Scatter plot là công cụ có được sự trực quan hóa dữ liệu mạnh mẽ, đảm bảo sự hiển thị rõ ràng. Ngoài ra, nó còn có nhiều lợi ích cụ thể như:

  • Hiển thị mối quan hệ rõ ràng: Biểu đồ phân tán là cách tốt nhất để hiển thị mối quan hệ giữa hai biến. Từ nguyên nhân dẫn đến kết quả của yếu tố đó.
  • Dễ dàng trong việc vẽ và đọc hiểu biểu đồ: Scatter plot tương đối dễ tạo bằng Excel và có thể dễ dàng hiểu bởi người dùng ở mọi trình độ kỹ năng.
  • Có thể xác định phạm vi dữ liệu: Scatter plot có thể được sử dụng để xác định phạm vi giá trị tối đa và tối thiểu của mỗi biến được thu thập. Điều này là cơ sở để phân tích và thấu hiểu toàn bộ tập dữ liệu.

3.2 Nhược điểm của biểu đồ phân tán

Một số điểm hạn chế trong Scatter plot có thể kể đến bao gồm:

  • Có quá nhiều dữ liệu: Việc xác định các mẫu hoặc xu hướng trên biểu đồ sẽ khó khăn hơn khi có quá nhiều điểm dữ liệu cần phải thu thập và xử lý.
  • Kết quả không thể hiện được sự chính xác tuyệt đối: Hệ số tương quan giữa các biến số chỉ mang tính tương đối, không có con số cụ thể nào cho kết quả của vấn đề. 
  • Dữ liệu cần được thu thập liên tục.
  • Chỉ giới hạn trong tối đa 2 biến số trên một biểu đồ. 

4. Hình thành tư duy các bước tạo biểu đồ phân tán

Việc tạo biểu đồ phân tán cần được thực hiện kỹ càng bởi mỗi công đoạn đều tác động vào độ trực quan của việc thực hiện dữ liệu. Giúp đảm bảo kết quả của biểu đồ được truyền đạt hiệu quả. Dưới đây là tổng quan các bước cần thực hiện

Bước 1: Xác định và chuẩn bị dữ liệu

Xác định các biến độc lập và biến phụ thuộc mà bạn muốn trực quan hóa bằng biểu đồ.

Thu thập các dữ liệu cho các biến, cần đảm bảo dữ liệu được thu thập liên tục, độ chính xác và nhất quán.

Kiểm tra tập dữ liệu để xác định giá trị bị thiếu, dữ liệu ngoại lai và không nhất quán.

Bước 2: Đo lường phạm vi dữ liệu

Chọn tỷ lệ thích hợp cho 2 giá trị của biến (dựa trên đặc điểm và phạm vi giá trị)

Xác định các phạm vi đầu – cuối phù hợp, bao gồm toàn bộ phạm vi dữ liệu cho cả hai biến.

Bước 3: Trực quan hóa và giải thích dữ liệu

Thực hiện chuyển đổi từ dữ liệu thành các điểm trên biểu đồ phân tán, vẽ từng điểm tại giao điểm của 2 biến số.

Sử dụng các dấu hiệu như vòng tròn hoặc hình vuông để phân biệt các điểm dữ liệu có tính chất khác nhau.

Kiểm tra biểu đồ để xác định các mối tương quan, cả tích cực lẫn tiêu cực. 

Bước 4: Thêm các nhãn, tiêu đề và ngữ cảnh

Gắn nhãn (đơn vị đo lường,..) cho trục X và Y một cách rõ ràng với các đơn vị tương ứng.

Viết tiêu đề cho tên và các biến của biểu đồ.

Thêm các đường tham chiếu, đường xu hướng. Sau đó viết chú thích đính kèm để biểu diễn sự tương tác giữa các tương tác biến.

Bước 5: Lặp lại quy trình

Việc tạo biểu đồ phân tán là một quá trình có chu kỳ. Và từng chu kỳ sẽ được cải thiện khi thêm nhiều dữ liệu hơn.

Luôn theo dõi về độ trực quan của biểu đồ, tính chính xác và hiệu quả. Thực hiện cải tiến, chỉnh sửa khi cần thiết để biểu đồ thể hiện được độ phù hợp mà bạn mong muốn.

5. Cách vẽ biểu đồ phân tán trong Excel

Để hình dung rõ hơn, tôi xin lấy một tình huống cụ thể: Có một tập dữ liệu như hình bên dưới và tôi muốn tạo một biểu đồ phân tán bằng cách sử dụng nguồn dữ liệu này.

Cách vẽ biểu đồ phân tán trong Excel

Mục đích của công việc này là để xét xét có sự tương quan giữa ngân sách marketing (Mktng Exp)doanh thu (Revenue) hay không.

Như đã trình bày, điều quan trọng để tạo biểu đồ phân tán là phải có cả hai giá trị (2 biến số) trong hai cột riêng biệt.

Cột bên trái (Mktng Exp) sẽ được biểu diễn trên Trục hoành và (Revenue) sẽ được biểu diễn trên Trục tung.

5.1 Chi tiết các bước vẽ biểu đồ phân tán trong Excel

Bước 1: Chọn các cột có chữa dữ liệu (trừ cột A)

y nghia cua bieu do phan tan trong excel la gi

Bước 2: Nhấp vào Insert

ve bieu do phan tan trong

Bước 3: Trong nhóm Chart, nhấp vào biểu tượng Insert Scatter Chart

cach ve bieu do phan tan trong

Bước 4: Nhấp vào tùy chọn Scatter chart trong các biểu đồ xuất hiện

y nghia cua bieu do phan tan

Các bước trên sẽ chèn một biểu đồ phân tán như được hiển thị bên dưới trong Excel:

y nghia cua bieu do phan tan trong
cách vẽ biểu đồ phân tán trong excel

5.2 Thêm đường xu hướng vào biểu đồ phân tán

Để biểu đồ được thể hiện trực quan hơn, việc cần làm tiếp theo sau khi xây dựng Scatter plot là thêm đường xu hướng. Điều này giúp bạn dễ dàng xác định nguồn 2 biến số có mối quan hệ tỷ lệ thuận hay đối nghịch nhau…

Dưới đây là các bước để thêm đường xu hướng vào biểu đồ phân tán trong Excel:

Bước 1: Chọn biểu đồ phân tán mà bạn muốn thêm đường xu hướng vào.

Bước 2: Nhấp vào thể Chart Design. (Đây là thể ngữ cảnh chỉ xuất hiện khi bạn chọn biểu đồ).

bieu do phan tan la gi trong

Bước 3: Trong nhóm Chart Layouts, nhấp vào tùy chọn Add Chart Element

bieu do phan tan la gi

Bước 4: Chuyển đến tùy chọn Trendline rồi nhấp vào Linear

ve bieu do phan tan

Sau đó, một đường xu hướng sẽ xuất hiện vào biểu đồ phân tán của bạn.

ve bieu do phan tan la gi
Biểu đồ phân tán với đường xu hướng tuyến tính (đường chấm)

Khi nhìn vào đường xu hướng và các điểm dữ liệu được phân bổ trong biểu đồ, ta có thể hình dung được sự tương quan.

5.3 Đọc kết quả của biểu đồ

  • Trong ví dụ của chúng tôi, ta có thể thấy chiều hướng đi lên trong đường xu hướng, điều này chỉ ra rằng dữ liệu có tương quan đồng thuận. Tức là khi Mktng Exp tăng lên thì Revenue cũng tăng lên và ngược lại.
  • Nếu chiều của đường xu hướng đi xuống khi đó 2 biến sẽ có mối quan hệ nghịch đảo. Điều này thể hiện nếu chi phí tăng lên thì doanh thu sẽ giảm và ngược lại.
  • Sẽ có trường hợp 2 biến này không có mối tương quan. Tức là nếu chi phí tiếp thị tăng lên, doanh thu của họ có thể tăng hoặc không tăng.

Lưu ý rằng đường xu hướng chỉ cho chúng ta biết dữ liệu có tương quan thuận hay nghịch. Nó không thể hiện được con số tỷ lệ chính xác là bao nhiêu phần trăm. Như trong ví dụ, khi quan sát đường xu hướng, chúng tôi không thể kết luận Revenue sẽ tăng bao nhiêu khi chi phí tiếp thị tăng 50%. 

Tuy nhiên, trong trường hợp cụ thể, con số này có thể được tính toán bằng cách sử dụng hệ số tương quan. Bằng cách sử dụng công thức sau:

=CORREL(B2:B11,C2:C11)

Hệ số tương quan nằm trong khoảng từ -1 đến 1, trong đó 1 biểu thị mối tương quan cao nhất và -1 biểu thị mối tương quan thấp nhất. Ở trường hợp trên con số đó là 0,945, nó thể hiện rằng hai biến này có mối tương quan đồng thuận cao.

Qua bài viết này, chúng tôi muốn cung cấp cho bạn thông tin từ tổng quan đến chi tiết về biểu đồ phân tán. Bạn cần hiểu được ý nghĩa, cũng như ưu nhược điểm của phương pháp này để sử dụng hiệu quả hơn vào công việc của mình.

Qua ví dụ về cách vẽ biểu đồ phân tán trong Excel, đây là nội dung mà chúng tôi trích ra từ Khóa học 07 QC Tools – 7 công cụ quản lý chất lượng đến từ Học viện PMS. Nếu bạn muốn tìm hiểu về Khóa học cũng như 6 công cụ còn lại, hãy đăng ký tham gia ngay hoặc xem thêm các bài viết ngay bên dưới nhé:

Đăng ký nhận bản tin

Hãy gửi thông tin để không bỏ sót bất kỳ tin tức hoặc chương trình khuyến mãi từ Học Viện PMS

    Trả lời

    Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *