Biểu đồ Histogram là gì? Phân loại, ứng dụng & cách vẽ biểu đồ Histogram

Biểu đồ Histogram là một sáng kiến được phát hiện bởi nhà toán học người Anh tên Karl Pearson. Với tính năng thể hiện sự phân bố dữ liệu một cách trực quan, biểu đồ tần suất mang nhiều lợi ích trong quy trình thống kê và báo cáo số liệu.

Trong bài viết này, PMS sẽ trình bày khái niệm cơ bản về Histogram, nó có những loại nào, khi nào nên dùng và hướng dẫn cách vẽ biểu đồ Histogram chi tiết, có minh họa.

Biểu đồ histogram
Biểu đồ histogram còn gọi là biểu đồ tần suất

Biểu đồ Histogram là gì?

Histogram hay còn gọi là biểu đồ tần suất, là một dạng biểu đồ cột để trực quan hóa việc phân bổ của một tập dữ liệu liên tục thành các khoảng dữ liệu (bins) và đếm được số lượng, số lần xuất hiện của mỗi giá trị trên các khoảng.

Nhìn vào biểu đồ này, bạn có thể nhìn ra được xu hướng phân phối, những điểm tập trung và phân tán của dữ liệu và biên độ của chúng. Nhờ đó mà việc cải thiện chất lượng hoặc quy trình cũng dễ dàng và đơn giản hơn.

Biểu đồ tần suất
Biểu đồ tần suất và các dạng cơ bản

Một biểu đồ Histogram thường sẽ có các thành phần chính sau:

  • Trục hoành: Hiển thị giá trị đo của khoảng dữ liệu (bins).
  • Trục tung: Hiển thị tần suất của dữ liệu.
  • Bề rộng các cột: Bằng với khoảng phân lớp trên trục hoành.
  • Chiều cao các cột: Tương ứng với tần suất (số lần xuất hiện) của mỗi giá trị.

Đây là một trong 7 công cụ quản lý chất lượng được sử dụng phổ biến dùng để phân tích dữ liệu. Trong sản xuất, cùng với phương pháp 5S – Kaizen hay Lean Six Sigma, chúng được kết hợp với nhau để mang lại hiệu quả tốt hơn cho doanh nghiệp sản xuất.

Các loại biểu đồ Histogram

Biểu đồ histogram đồng đều

Biểu đồ Histogram đồng đều biểu diễn các cột dữ liệu có chiều cao xấp xỉ ngang nhau. Biểu đồ cho thấy những cột dữ liệu được phân tán đồng nhất, số lần xuất hiện các khoảng dữ liệu hầu như không có gì vượt trội so với nhau.

Biểu đồ histogram đồng đều
Biểu đồ histogram đồng đều

Biểu đồ histogram hai đỉnh

Biểu đồ Histogram hai đỉnh còn được gọi là biểu đồ Bimodal, nó biểu diễn hai nhóm có giá trị cao nhất, cách nhau một khoảng ở giữa. Dựa vào trạng thái này, chúng ta có thể đoán được dữ liệu đang bị trộn lẫn từ hai nhóm dữ liệu đang phân bố khác nhau. Nếu đúng là như vậy, hãy tách riêng hai nhóm dữ liệu này ra để dễ dàng phân tích.

Biểu đồ histogram hai đỉnh
Biểu đồ histogram hai đỉnh

Biểu đồ histogram dạng đối xứng

Histogram đối xứng còn được gọi là histogram hình chuông. Khi bạn vẽ đường thẳng đứng xuống giữa histogram và hai bên có kích thước và hình dạng giống hệt nhau, histogram được gọi là đối xứng. Biểu đồ được coi là đối xứng hoàn hảo nếu nửa bên phải của hình ảnh giống với nửa bên trái. Còn nếu Histogram không đối xứng được gọi là lệch.

Biểu đồ histogram đối xứng
Biểu đồ histogram đối xứng

Biểu đồ dạng phân phối lệch

Đây là dạng biểu đồ phân phối không cân đối, nhìn sơ qua thì sẽ thấy giá trị đo sẽ lệch hẳn về một phía. Điều này phản ánh dữ liệu đang bị giới hạn ở một phía, phía còn lại thì tập trung tìm ra nguyên nhân và giải quyết điều bất thường này.

Biểu đồ Histogam phân phối lệch
Biểu đồ Histogam phân phối lệch

Biểu đồ phân phối răng lược

Biểu đồ này thể hiện các dữ liệu phân phối không đều, dẫn đến tình trạng cột dữ liệu cao và thấp xen kẽ nhau tạo ra hình răng lược. Dựa vào biểu đồ này, chúng ta có thể đoán được dữ liệu đang bị làm tròn, hoặc có thể là do lúc thiết lập biểu đồ không chính xác ngay lúc đầu.

Biểu đồ Histogam phân phối dạng răng lược
Biểu đồ Histogam phân phối dạng răng lược

Ngoài ra, có một số dạng biểu đồ Histogram khác bạn có thể xem qua:

Phân phối đỉnh cạnh: Rất giống phân phối chuẩn hình chuông, nhưng ngoại trừ việc nó có một đỉnh lớn nằm ở phía đuôi. Điều này thường do việc xây dựng biểu đỗ sai ở tần suất xuất hiện, với dữ liệu gộp lại thành một nhóm có nhãn lớn hơn.

Biểu đồ Histogram dạng phân phối đỉnh cạnh
Biểu đồ Histogram dạng phân phối đỉnh cạnh

Phân phối dạng bị cắt cụt: Nhìn trông giống các đuôi của biểu đồ bị cắt bỏ. Trường hợp này cho thấy nhà cung cấp có thể đang sản xuất vật liệu theo phân bố chuẩn và dựa vào việc kiểm tra để phân biệt sản phẩm đạt tiêu chuẩn với sản phẩm không đạt tiêu chuẩn. Phần bị cắt cụt trong biểu đồ chính là những lô hàng được gửi đến khách hàng nằm trong giới hạn tiêu chuẩn.

Biểu đồ Histogram dạng bị cắt cụt
Biểu đồ Histogram dạng bị cắt cụt

Phân phối Food Dog: Dữ liệu chỉ tập trung phân bổ ở hai bên của biểu đồ và chưa một khoảng trống ở giữa. Đa phần xảy ra tình trạng này là do doanh nghiệp cung cấp hai loại sản phẩm khác nhau.

Biểu đồ Histogram dạng Dog food
Biểu đồ Histogram dạng Dog food

Sự khác biệt giữa biểu đồ Histogram và biểu đồ thanh

Biểu đồ Histogram nhìn sơ qua trông rất giống với biểu đồ thanh, nhưng thực tế giữa hai biểu đồ này có những điểm đặc trưng khác nhau, hãy xem qua bảng so sánh dưới đây:

Biểu đồ HistogramBiểu đồ thanh
Hình hai chiềuHình một chiều
Tần số được thể hiện bằng diện tích của mỗi hình chữ nhậtChiều cao thể hiện tần suất, còn chiều rộng không có ý nghĩa.
Cho thấy các hình chữ nhật chạm vào nhauCác hình chữ nhật tách biệt nhau bằng các khoảng cách bằng nhau.

Để giúp các bạn hình dung rõ hơn, hãy xem 2 hình dưới đây:

Biểu đồ phân bố
Biểu đồ Histogram (Không có khoảng cách giữa các thanh)
Biểu đồ thanh (Khoảng cách giữa các thanh)
Biểu đồ thanh (Khoảng cách giữa các thanh)

Khi nào nên sử dụng biểu đồ Histogram?

Nên sử dụng Histogram khi:

  • Dữ liệu là dạng số.
  • Xem dữ liệu đang tập trung ở đâu, có đối xứng hay lệch ở đâu không.
  • Phân tích quy trình có đáp ứng được nhu cầu khách hàng không.
  • Phân tích kết quả đầu ra của nhà sản xuất như thế nào.
  • Xem sự phân bổ dữ liệu, đặc biệt khi xem đầu ra của một quy trình có phân bổ chuẩn giới hạn hay không.
  • Xác định đầu ra giữa hai hoặc nhiều quy trình có khác nhau hay không.

Ứng dụng của biểu đồ Histogram

Phân tích phân phối tần suất

Biểu đồ tần suất rất hữu ích để phân tích phân phối tần suất của dữ liệu mẫu. Trong một thí nghiệm thống kê, phân phối tần suất là số lượng quan sát thuộc về một danh mục cụ thể.

Xem ví dụ bên dưới, biểu đồ thể hiện số lượng hành vi mua sắm của khách hàng thuộc các nhóm tuổi khác nhau. Qua quan sát, có thể thấy cụ thể rằng khách hàng thuộc nhóm tuổi từ 50 – 70 đã thực hiện lượng mua sắm cao nhất.

Phân tích sự phân bố tần số nhóm tuổi từ 50 đến 70
Phân tích sự phân bố tần số nhóm tuổi từ 50 đến 70

Phân tích đối xứng dữ liệu

Với biểu đồ tần suất, người xem có thể phân tích bản chất của phân phối tần suất, cụ thể như:

  • Một số phân phối có thể đối xứng, nghĩa là giá trị trung bình của phân phối chính xác quanh giá trị giữa của tập dữ liệu.
  • Một số phân phối có thể không đối xứng mà lệch trái hoặc lệch phải. Điều này cho thấy giá trị trung bình của dữ liệu nằm ở đầu hoặc cuối phạm vi dữ liệu.
  • Một số dữ liệu sẽ có phân phối đồng đều trong đó mọi danh mục có số điểm dữ liệu gần như bằng nhau.

Phân tích sự thay đổi theo thời gian

Biểu đồ tần suất có thể phân tích kết quả quy trình thay đổi theo thời gian. Ví dụ, doanh nghiệp có thể theo dõi số lượng sản phẩm lỗi được sản xuất trong một ca làm việc tại nhà máy. Nhờ đó, doanh nghiệp có thể sử dụng dữ liệu này để xác định những giờ có nhiều lỗi xảy ra nhất và đưa ra các biện pháp phòng ngừa kịp thời.

Histogram dùng để xem sự phân bố dữ liệu theo thời gian
Histogram dùng để xem sự phân bố dữ liệu theo thời gian

Các bước vẽ biểu đồ Histogram qua Excel

Bạn có thể vẽ biểu đồ tần suất đơn giản theo hướng dẫn sau đây.

Ví dụ: Chúng tôi tạo ra một bảng dữ liệu, trong đó có 20 học sinh và đạt điểm số từ 24 đến 90.

Bảng dữ liệu vẽ Histogram
Ví dụ bảng dữ liệu vẽ Histogram cho điểm số 20 học sinh

Bước 1: Chia dữ liệu thành các khoảng dữ liệu phù hợp

Dựa vào dữ liệu có trong bảng, chia dữ liệu thành các khoảng giá trị có điều kiện, ví dụ ảnh bên dưới 24-40, 40-60 và 60-90 (lưu ý các biến trên các khoảng dữ liệu thường không trùng lặp nhau)

Các biến số trong khoảng dữ liệu không trùng lặp nhau khi vẽ histogram
Các biến số trong khoảng dữ liệu không trùng lặp nhau

Bước 2: Tính toán trong mỗi khoảng có bao nhiêu giá trị

Sau khi đã chia ra điều kiện cho các khoảng giá trị, hãy tính mỗi khoảng có bao nhiêu giá trị trong đó, bằng cách dùng công thức:

Công thức: =COUNTIFS($C$4:$C$23, “>=24”, $C$4:$C$23, “<=40”)

Trong đó: $C$4:$C$23 là phạm vi của dãy dữ liệu, “24’’ và “40” là phạm vi cho khoảng giá trị đầu tiên.

áp dụng công thức countifs để tính tần suất trong histogram
Áp dụng công thức COUNTIFS để tính tần suất trong mỗi khoảng giá trị

Tiếp tục sử dụng công thức này nhưng thay đổi cho phạm vi lần lượt là 40-60 và 60-90.

Công thức: =COUNTIFS($C$4:$C$23, “>40”, $C$4:$C$23, “<=60”)

Công thức:  =COUNTIFS($C$4:$C$23, “>60”, $C$4:$C$23, “<=90”)

Vẽ biểu đồ histogram
Tiếp tục áp dụng công thức cho các khoảng giá trị tiếp theo

Bước 3: Tạo biểu đồ Histogram

Trên thanh công cụ, chọn mục Insert, sau đó bôi đen khoảng giá trị cần vẽ, rồi chọn biểu đồ cột tương ứng (như ảnh bên dưới).

Sau khi hoàn thành đúng các bước, một biểu đồ Histogram sẽ hiển thị ra ngay bên dưới.

Tạo biểu đồ Histogram
Hình minh họa cách tạo biểu đồ Histogram

Bước 4: Định dạng cho biểu đồ

Nhấp chuột phải vào biểu đồ, rồi chọn Format Data Series.

Bên cạnh đó, bạn có thể linh hoạt điều chỉnh Fill màu sắc hiển thị cho từng cột hoặc Outline nhé.

Sau đó biểu đồ sẽ hoàn tất.

Tùy chỉnh biểu đồ Histogram
Tùy chỉnh biểu đồ Histogram

Tạm kết

Biểu đồ histogram là một công cụ được ứng dụng mạnh mẽ trong việc phân tích và cải thiện chất lượng sản phẩm/dịch vu hoặc quy trình trong sản xuất. Nhờ vào sự trực quan của biểu đồ, chúng ta có thể thấy được sự phân tán, tập trung ở đâu hay lệch ở điểm nào, từ đó đưa ra được các phương pháp cải tiến phù hợp để nâng cao chất lượng sản phẩm. Đây cũng là nền móng cho sự phát triển bền vững của doanh nghiệp.

Đã đến lúc cải tiến chất lượng sản phẩm thông qua khóa học 7 công cụ quản lý chất lượng tại PMS, đội ngũ chuyên gia chúng tôi sẽ giúp bạn hiểu đúng, làm đúng trong việc ứng dụng các công cụ thống kê, dựa vào kinh nghiệm thực chiến hơn 15 năm trong lĩnh vực Quản trị sản xuất.

Xem thêm các dạng biểu đồ liên quan khác:

Đăng ký nhận bản tin

Hãy gửi thông tin để không bỏ sót bất kỳ tin tức hoặc chương trình khuyến mãi từ Học Viện PMS

    Trả lời

    Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *