Biểu đồ Histogram là một sáng kiến được phát hiện bởi nhà toán học người Anh – Karl Pearson. Với tính năng biểu diễn sự phân bố dữ liệu một cách trực quan, biểu đồ này luôn mang nhiều vai trò hữu ích trong quy trình thống kê và báo cáo số liệu. Để sử dụng thành thạo biểu đồ này, trước tiên bạn cần hiểu rõ về khái niệm và các bước thực hiện cơ bản.

Mục lục
1. Biểu đồ Histogram là gì?
Biểu đồ Histogram (biểu đồ tần suất) là một trong 7 biểu đồ thống kê phổ biến, được dùng để thể hiện sự phân phối có tần suất của một tập dữ liệu. Được biểu diễn thông qua các thanh cột, mỗi thanh đại diện cho một hạng mục cụ thể. Chiều cao của các thanh biểu thị tần số hoặc số lượng điểm dữ liệu trong mỗi nhóm.
Tóm lại, biểu đồ tần suất giúp hình thành cái nhìn về thông tin xu hướng và cấu trúc cơ bản của một tệp dữ liệu thu thập được. Bằng cách thể hiện thông tin một cách tổng quát, Histogram giúp việc giải thích và phân tích dữ liệu trở nên dễ dàng và hiệu quả hơn.
2. Các loại biểu đồ Histogram
- Phân phối chuẩn
Ví dụ phổ biến của phân phối chuẩn là đường cong hình chuông, các điểm thường phân bổ đều 2 bên của giá trị trung bình. Bạn cần lưu ý có các loại biểu đồ khác giống với phân phối chuẩn. Nên cần có sự tính toán số liệu để xác minh có một phân phối chuẩn.

- Phân phối lệch
Phân phối lệch là khi đỉnh của mô hình phân phối lệch về 1 bên trái hoặc phải.
- Phân phối hai đỉnh
Lúc này, biểu đồ trông giống như phần sau của một con lạc đà có hai bướu. Thông thường, phân phối đa đỉnh xuất hiện khi phân tích các kết quả của hai quá trình có các phân phối khác nhau được kết hợp trong một tập dữ liệu duy nhất.
- Phân phối cao nguyên
Loại phân phối xuất hiện nhiều đỉnh dữ liệu nằm liền kề nhau, nó được hình thành khi có nhiều quá trình thu thập dữ liệu khác nhau.
- Phân phối đỉnh cạnh
Qua quan sát, loại này có một đỉnh dữ liệu lớn ở một bên, nguyên nhân dẫn đến điều này có thể do xuất hiện lỗi trong việc tạo biểu đồ Histogram.
- Phân phối lược
Có thể hình dung các thanh biểu đồ Histogram trong phân phối này được xen kẽ cao và thấp.
- Phân phối bị cắt
Là loại phân phối trong đó các đuôi của biểu đồ bị cắt ngang do nhà cung cấp chỉ cung cấp dữ liệu ở một phạm vi nhất định.
- Phân phối Food Dog
Khi này, dữ liệu chỉ tập trung phân bổ ở hai bên của biểu đồ và chưa một khoảng trống ở giữa. Đa phần xảy ra tình trạng này là do doanh nghiệp cung cấp hai loại sản phẩm khác nhau.

3. Công dụng của biểu đồ Histogram trong quản lý chất lượng
3.1 Phân tích sự phân bố tần số
Histogram đặc biệt hữu ích để phân tích tần suất xảy ra của một hạng mục cụ thể.
Tại hình ảnh mô tả bên dưới, biểu đồ thể hiện số lượng hành vi mua sắm của khách hàng thuộc các nhóm tuổi khác nhau. Qua quan sát, có thể thấy cụ thể rằng khách hàng thuộc nhóm tuổi từ 50-70 đã thực hiện lượng mua sắm cao nhất.

3.2 Phân tích tính đối xứng của dữ liệu
Thông thường, dữ liệu khi thu thập thường được phân bổ theo xu hướng đối xứng với nhau. Nhờ sơ đồ Histogram, ta có thể quan sát được điều này. Khi phân phối không đối xứng xuất hiện, nó có thể lệch trái hoặc phải. Điều này thể hiện giá trị trung bình của dữ liệu có thể đang nằm ở đầu hoặc cuối của phạm vi dữ liệu. Dữ liệu không đối xứng thông thường là biểu hiện của một vấn đề không tốt, chẳng hạn như lỗi dữ liệu hoặc có quá nhiều biến thể. Hình dưới đây cho thấy một số ví dụ về phân phối biểu đồ tần số.
3.3 Phân tích sự thay đổi theo thời gian
Biểu đồ Histogram còn có thể phân tích sự thay đổi kết quả của quy trình theo thời gian. Ví dụ, doanh nghiệp dùng Histogram để quan sát số lượng sản phẩm lỗi hình thành trong một giờ làm việc tại nhà máy. Nếu lượng sản phẩm lỗi này ngày tăng lên thì doanh nghiệp cần thực hiện các nghiệp vụ để tìm ra nguyên nhân và thực hiện các biện pháp phòng ngừa.
4. Hướng dẫn 2 cách vẽ biểu đồ Histogram trong Excel
4.1 Sử dụng Histogram Chart
Để tạo biểu đồ tần suất trong Excel bạn cần cài đặt phiên bản Excel từ 2016 trở lên.
Lấy ví dụ: Một tệp dữ liệu có 41 scores (điểm số) và chúng ta muốn xây dựng một biểu đồ Histogram để phân chia các điểm số này thành các khoảng cách nhau 10 điểm (nhỏ nhất là 40 và lớn nhất là 100). Các bước thực hiện:
Bước 1. Chọn ô A1:B42.
Bước 2: Nhấp vào Insert
Bước 3: Insert Statistic Chart
Bước 4: Histogram.
Sau đó, biểu đồ Histogram đã được hình thành và tạo thành 4 cột (bin) liền nhau như bên dưới.
Bước 5:
- Nhấp chuột phải vào trục danh mục (trục x) và nhấp vào Format Axis .
- Nhấp vào danh mục Axis Options .
- Nhập 40 cho Underflow bin. Đây là số điểm mà bins sẽ bắt đầu từ đó.
- Nhập 90 cho Overflow bin. Điểm từ 91 trở lên sẽ được tính vào bin cuối cùng này.
- Chỉ định Bin width là 10 . Điều này tạo ra bins trong khoảng thời gian từ 10 đến 40.
Một cách khác để chỉ định chiều rộng cột là sử dụng option để chỉ định số lượng cột được yêu cầu.
Kết quả:
Bạn có thể thực hiện các chỉnh sửa cho biểu đồ như, tiêu đề, danh mục và màu sắc của các cột.

Ưu điểm của việc cách tạo này là không cần chuẩn bị trước các cột hoặc ghi nhớ các công thức phức tạp. Tất cả đều được tích hợp qua chức năng built-in chart và các tùy chọn có sẵn.
Nhược điểm là cách làm này chỉ có trong Excel 2016 trở lên và có một số tính năng bị giới hạn và thiếu sự linh hoạt.
4.2 Dùng công thức
Sử dụng công thức là phương pháp mang lại sự linh hoạt hơn cho biểu đồ Histogram, nó có thể sử dụng ở tất cả các phiên bản của Excel. Phương pháp này bao gồm việc chèn biểu đồ cột thay vì tùy chọn Histogram.
Chúng tôi sẽ dùng lại dữ liệu đã sử dụng trong ví dụ trước, nhưng hai điểm thi được thay đổi thành dưới 40.
Đầu tiên, hãy nhập dữ liệu cho biểu đồ. Đây là các thanh và tần suất điểm thi trong mỗi thanh đó.
Các thanh được gõ vào phạm vi G4:G10 và hàm COUNTIFS được sử dụng để đếm số lần xuất hiện của điểm thi cho mỗi thanh.
Hàm: =COUNTIFS($B$2:$B$42,”>=”&E4,$B$2:$B$42,”<=”&F4)
Các giá trị trong khoảng E4:E10 và F4:F10 được sử dụng để hỗ trợ hàm COUNTIFS.
Để tạo biểu đồ Histogram:
Bước 1: Chọn phạm vi G4:H10
Bước 2: Nhấp vào Insert
Bước 3: Insert Column or Bar Chart
Bước 4: Clustered Column.
Kết quả:
Bước 5: Thực hiện các thay đổi:
- Chỉnh sửa tiêu đề biểu đồ thành “Exam Score Distribution”
- Định dạng các cột thành màu xanh lá cây
- Xóa trục giá trị (trục y)
- Xóa các đường lưới ngang
- Thêm nhãn dữ liệu phía trên mỗi cột
Bước 6: Để xóa khoảng cách giữa các cột, nhấp chuột phải vào một trong các cột và nhấp vào Format Data Series.
Bước 7: Từ ngăn Format Data Series, nhấp vào danh mục Series Options và thay đổi Gap Width thành 0.
Khoảng cách giữa các cột bị xóa là hiển thị biểu đồ Histogram như bên dưới.
Bằng cách tạo các cột riêng, phương pháp mang đến nhiều sự linh hoạt hơn. Cột đầu tiên dành cho điểm thi dưới 40, các cột sau cách nhau 10 điểm.
Biểu đồ này dễ dàng được cập nhật khi chỉnh sửa các giá trị trong các ô của dữ liệu nguồn.
5. Khi nào nên và không nên sử dụng biểu đồ Histogram
5.2 Nên dùng Histogram khi
- Dữ liệu ở dạng số hóa
- Bạn muốn xem cách biểu đạt hình dạng của phân phối của dữ liệu, đặc biệt là khi xác định tần suất xảy ra các kết quả trong một quy trình.
- Phân tích quy trình liệu có thể đáp ứng các yêu cầu của khách hàng hay không
- Phân tích kết quả đạt được từ quy trình của nhà cung cấp
- Xem xét sự thay đổi trong quy trình xảy ra từ khoảng thời gian này sang khoảng thời gian khác
- Xác định trong hai hay nhiều quy trình khác nhau có các kết quả đạt được tương đồng hay đối lập
- Biểu diễn sự phân phối dữ liệu của tổ chức cho người khác
5.1 Không nên dùng Histogram khi
- Khi dữ liệu không phải là số mà ở dạng định tính như giới tính hoặc vị trí, thì biểu đồ Histogram sẽ không phù hợp. Trong trường hợp này, có thể sử dụng biểu đồ hình tròn hoặc biểu đồ cột.
- Khi kích thước mẫu nhỏ, có quá ít điểm dữ liệu thì Histogram không thể hiển thị sự phân phối của dữ liệu. Theo quy tắc, biểu đồ tần suất hữu ích khi có 20 hoặc nhiều quan sát hơn.
- Khi có khoảng trống lớn trong dữ liệu. Biểu đồ Histogram thích hợp nhất khi dữ liệu được thu thập liên tục. Vì vậy khi thiếu hoặc không xác định biểu đồ không thể phát huy được hiệu quả của mình.
Trên đây là nội dung về biểu đồ Histogram với những phân tích chi tiết, từ cách phân loại cho đến các bước thực hành. Tất nhiên, đây mới chỉ là một phần kiến thức của Histogram. Nếu muốn được trang bị thêm kiến thức cũng như khả năng để thực hiện công việc này. Chúng tôi giới thiệu đến bạn Khóa học 7 công cụ trong quản lý chất lượng, sẽ giúp bạn biết cách vận dụng không chỉ 1 mà đến 7 biểu đồ hiệu quả nhất hiện nay.
Các loại biểu đồ khác bao gồm trong khóa học, gồm: