Khám phá cú pháp và chức năng chi tiết của từng hàm trong nhóm hàm thống kê trong Excel, giúp bạn làm chủ công cụ phân tích dữ liệu hiệu quả.
Nội dung bài viết
Bài viết này tổng hợp đầy đủ cú pháp và chức năng của các hàm thuộc nhóm thống kê trong Excel, mời bạn cùng khám phá và áp dụng vào công việc một cách tối ưu.
Các hàm thống kê được chia thành ba nhóm chính: Thống Kê cơ bản, Phân Phối Xác Suất, và Tương Quan cùng Hồi Quy Tuyến Tính, mỗi nhóm mang đến giải pháp phân tích chuyên sâu.
1. Nhóm hàm Thống Kê: Cung cấp các công cụ cơ bản để tính toán và phân tích dữ liệu một cách nhanh chóng và chính xác.
AVEDEV (number1, number2,…): Hàm tính toán độ lệch tuyệt đối trung bình của các điểm dữ liệu so với giá trị trung bình của chúng, phản ánh mức độ biến động trong tập dữ liệu.
AVERAGE (number1, number2,…): Hàm tính giá trị trung bình cộng của các đối số được cung cấp, giúp xác định xu hướng trung tâm của dữ liệu một cách nhanh chóng.
AVERAGEA (number1, number2,…): Hàm mở rộng của AVERAGE, tính trung bình cộng bao gồm cả các giá trị logic (TRUE/FALSE), mang lại cái nhìn toàn diện hơn về tập dữ liệu.
AVERAGEIF (range, criteria, average_range): Hàm tính trung bình cộng có điều kiện, cho phép bạn xác định giá trị trung bình chỉ cho các ô thỏa mãn tiêu chí cụ thể.
AVERAGEIFS (average_range, criteria_range1, criteria1, [criteria_range2, criteria2],…): Hàm tính trung bình cộng của các giá trị trong một phạm vi dựa trên nhiều điều kiện khác nhau, mang lại độ chính xác cao trong phân tích dữ liệu đa chiều.
COUNT (value1, value2,…): Hàm đếm số lượng ô chứa giá trị số trong danh sách đối số, hỗ trợ đánh giá nhanh quy mô dữ liệu.
COUNTA (value1, value2,…): Hàm đếm số ô không trống trong một phạm vi, bao gồm cả giá trị văn bản và logic, giúp xác định mức độ hoàn thiện của dữ liệu.
COUNTBLANK (range): Hàm đếm số ô trống trong một vùng dữ liệu, phản ánh những khoảng trống cần được bổ sung hoặc xử lý.
COUNTIF (range, criteria): Hàm đếm số ô trong một phạm vi cụ thể thỏa mãn điều kiện được đặt ra, giúp bạn nhanh chóng xác định tần suất xuất hiện của các giá trị mong muốn.
COUNTIFS (range1, criteria1, [range2, criteria2],…): Hàm đếm số ô đáp ứng đồng thời nhiều điều kiện khác nhau, mang lại sự linh hoạt trong việc phân tích dữ liệu phức tạp.
DEVSQ (number1, number2,…): Hàm tính tổng bình phương độ lệch của các điểm dữ liệu so với giá trị trung bình, phản ánh mức độ phân tán của tập dữ liệu.
FREQUENCY (data_array, bins_array): Hàm tính tần suất xuất hiện của các giá trị trong một khoảng xác định, trả về kết quả dưới dạng mảng số dọc, hỗ trợ phân tích phân phối dữ liệu hiệu quả.
GEOMEAN (number1, number2): Hàm tính trung bình nhân của một mảng hoặc phạm vi dữ liệu dương, thường được sử dụng để đo lường mức tăng trưởng kép khi lãi suất biến đổi theo thời gian.
HARMEAN (number1, number2,…): Hàm trả về trung bình điều hòa, nghịch đảo của trung bình cộng, phù hợp để tính toán các tỷ lệ trung bình trong các tình huống cần cân đối giữa các giá trị.
KURT (number1, number2, …): Hàm tính hệ số nhọn của tập dữ liệu, giúp đánh giá độ nhọn hoặc độ phẳng của phân phối so với phân phối chuẩn, từ đó hiểu rõ hơn về đặc điểm phân bố dữ liệu.
LARGE (array, k): Hàm trả về giá trị lớn thứ k trong tập dữ liệu, hữu ích khi bạn cần xác định các giá trị nổi bật dựa trên thứ hạng tương đối của chúng.
MAX (number1, number2,…): Hàm trả về giá trị lớn nhất trong tập dữ liệu, giúp xác định điểm cao nhất trong một phạm vi số liệu cụ thể.
MAXA (number1, number2,…): Hàm mở rộng của MAX, trả về giá trị lớn nhất bao gồm cả các giá trị logic và văn bản, mang lại cái nhìn toàn diện hơn về tập dữ liệu.
MEDIAN (number1, number2…): Hàm trả về giá trị trung vị, điểm giữa của tập dữ liệu, giúp xác định xu hướng trung tâm mà không bị ảnh hưởng bởi các giá trị ngoại lệ.
MIN (number1, number2,…): Hàm trả về giá trị nhỏ nhất trong tập dữ liệu, hỗ trợ xác định điểm thấp nhất hoặc giới hạn dưới của các giá trị số.
MINA (number1, number2…): Hàm trả về giá trị nhỏ nhất trong tập dữ liệu, bao gồm cả giá trị logic và văn bản, giúp xác định điểm thấp nhất một cách toàn diện.
MODE (number1, number2…): Hàm trả về giá trị xuất hiện thường xuyên nhất trong một mảng hoặc phạm vi dữ liệu, phản ánh xu hướng phổ biến của tập dữ liệu.
PERCENTILE (array, k): Hàm tìm giá trị phân vị thứ k trong một mảng dữ liệu, giúp xác định vị trí tương đối của một giá trị so với tập dữ liệu.
PERCENTRANK (array, x, significance): Hàm trả về thứ hạng phần trăm của một giá trị trong tập dữ liệu, giúp đánh giá vị trí tương đối của giá trị đó so với các giá trị khác.
PERMUT (number, number_chosen): Hàm tính số lượng hoán vị có thể có từ một tập hợp đối tượng, hỗ trợ phân tích các khả năng sắp xếp khác nhau.
QUARTILE (array, quart): Hàm trả về giá trị tứ phân vị của tập dữ liệu, thường được sử dụng để chia dữ liệu thành các nhóm có ý nghĩa thống kê.
RANK (number, ref, order): Hàm xác định thứ hạng của một giá trị trong danh sách các số, giúp so sánh vị trí tương đối của giá trị đó trong tập dữ liệu.
SKEW (number1, number2, …): Hàm đo lường độ lệch của phân phối dữ liệu, phản ánh mức độ không đối xứng của phân phối so với giá trị trung bình.
SMALL (array, k): Hàm trả về giá trị nhỏ thứ k trong tập dữ liệu, giúp xác định các giá trị có thứ hạng cụ thể trong phân phối dữ liệu.
STDEV (number1, number2,…): Hàm ước tính độ lệch chuẩn dựa trên mẫu dữ liệu, phản ánh mức độ phân tán của các giá trị so với giá trị trung bình.
STDEVA (value1, value2, …): Hàm ước tính độ lệch chuẩn dựa trên mẫu, bao gồm cả các giá trị logic, mang lại cái nhìn toàn diện hơn về độ biến động của dữ liệu.
STDEV.P (number1, number2,…): Hàm tính độ lệch chuẩn dựa trên toàn bộ tập hợp dữ liệu, bỏ qua các giá trị logic và văn bản, giúp đánh giá chính xác độ phân tán của dữ liệu.
STDEVPA (value1, value2,…): Hàm tính độ lệch chuẩn dựa trên toàn bộ tập hợp dữ liệu, bao gồm cả giá trị văn bản và logic, mang lại đánh giá toàn diện về độ biến động của dữ liệu.
VAR (number1, number2,…): Hàm trả về phương sai dựa trên mẫu dữ liệu, giúp đo lường mức độ phân tán của các giá trị so với giá trị trung bình.
VARA (value1, value2, …): Hàm tính phương sai dựa trên mẫu, bao gồm cả giá trị văn bản và logic, cung cấp cái nhìn tổng quan về sự biến thiên của dữ liệu.
VARP (number1, number2,…): Hàm trả về phương sai dựa trên toàn bộ tập hợp dữ liệu, giúp đánh giá chính xác độ phân tán của các giá trị trong tập hợp.
VARPA (value1, value2, …): Hàm tính phương sai dựa trên toàn bộ tập hợp dữ liệu, bao gồm cả giá trị logic và văn bản, giúp đánh giá toàn diện độ biến động của dữ liệu.
TRIMMEAN (array, percent): Hàm tính giá trị trung bình sau khi loại bỏ một tỷ lệ phần trăm các điểm dữ liệu ở hai đầu của tập hợp, giúp giảm thiểu ảnh hưởng của các giá trị ngoại lệ.
2. Nhóm hàm về Phân Phối Xác Suất: Cung cấp các công cụ mạnh mẽ để phân tích và dự đoán xác suất trong các tình huống thống kê phức tạp.
BETADIST (x, alpha, beta, A, B): Hàm trả về giá trị của hàm mật độ xác suất tích lũy phân bố beta, hỗ trợ phân tích các mô hình xác suất liên tục.
BETAINV (probability, alpha, beta, A, B): Hàm trả về giá trị nghịch đảo của hàm mật độ xác suất tích lũy beta, giúp xác định ngưỡng giá trị cho một phân bố beta cụ thể.
BINOMDIST (number_s, trials, probability_s, cumulative): Hàm tính xác suất của số lần thành công trong các phép thử nhị thức, hỗ trợ phân tích các tình huống xác suất rời rạc.
CHIDIST (x, degrees_freedom): Hàm trả về xác suất một phía của phân phối chi-squared, thường được sử dụng trong kiểm định giả thuyết thống kê.
CHIINV (probability, degrees_freedom): Hàm trả về giá trị nghịch đảo của xác suất một phía trong phân phối chi-squared, giúp xác định ngưỡng giá trị quan trọng trong kiểm định thống kê.
CHITEST (actual_range, expected_range): Hàm trả về giá trị xác suất từ phân phối chi-squared cùng với số bậc tự do tương ứng, hỗ trợ kiểm định sự phù hợp giữa dữ liệu thực tế và dữ liệu kỳ vọng.
CONFIDENCE (alpha, standard_dev, size): Hàm tính khoảng tin cậy của trung bình tổng thể dựa trên phân phối chuẩn, giúp đánh giá độ chính xác của ước lượng thống kê.
CRITBINOM (trials, probability_s, alpha): Hàm trả về giá trị nhỏ nhất mà phân phối nhị thức tích lũy đạt hoặc vượt qua ngưỡng tiêu chuẩn, thường được ứng dụng trong kiểm soát chất lượng và đảm bảo độ tin cậy.
EXPONDIST (x, lambda, cumulative): Hàm trả về phân phối hàm mũ, phù hợp để mô hình hóa thời gian giữa các sự kiện trong các quá trình ngẫu nhiên.
FDIST (x, degrees_freedom1, degrees_freedom2): Hàm trả về phân bố xác suất F (đuôi bên phải) cho hai tập dữ liệu, thường được sử dụng trong phân tích phương sai (ANOVA) và kiểm định giả thuyết.
FINV (probability, degrees_freedom1, degrees_freedom2): Hàm trả về giá trị nghịch đảo của phân bố xác suất F (đuôi bên phải), hỗ trợ xác định ngưỡng giá trị quan trọng trong các phép thử thống kê.
FTEST (array1, array2): Hàm thực hiện phép thử F-test, trả về xác suất hai đuôi để đánh giá sự khác biệt giữa các phương sai của hai tập dữ liệu.
FISHER (x): Hàm trả về phép biến đổi Fisher tại x, giúp chuyển đổi hệ số tương quan thành phân phối gần đối xứng, thường được sử dụng trong kiểm định giả thuyết về tương quan.
FISHERINV (y): Hàm trả về giá trị nghịch đảo của phép biến đổi Fisher, giúp khôi phục giá trị ban đầu từ kết quả của phép biến đổi, thường được sử dụng trong phân tích tương quan.
GAMMADIST (x, alpha, beta, cumulative): Hàm trả về xác suất của phân phối gamma, phù hợp để nghiên cứu các biến có phân phối lệch, thường xuất hiện trong các mô hình thời gian chờ hoặc tuổi thọ.
GAMMAINV (probability, alpha, beta): Hàm trả về giá trị nghịch đảo của phân phối gamma, giúp xác định ngưỡng giá trị dựa trên xác suất và tham số phân phối.
GAMMLN (x): Hàm tính logarit tự nhiên của hàm gamma, hỗ trợ các phép tính toán liên quan đến phân phối gamma và các mô hình thống kê phức tạp.
HYPGEOMDIST (sample_s, number_sample, population_s, number_pop): Hàm trả về xác suất phân bố siêu bội, giúp tính toán xác suất của số lần thành công trong mẫu khi biết trước kích thước mẫu, số lần thành công trong tập hợp và kích thước tổng thể.
LOGINV (probability, mean, standard_dev): Hàm trả về giá trị nghịch đảo của hàm phân phối logarit chuẩn tích lũy, thường được sử dụng để mô hình hóa các giá trị có phân phối lệch dương.
LOGNORMDIST (x, mean, standard_dev): Hàm trả về phân phối tích lũy lognormal của x, phù hợp để phân tích các dữ liệu có phân phối lệch và giá trị dương.
NEGBINOMDIST (number_f, number_s, probability_s): Hàm trả về phân bố nhị thức âm, giúp tính xác suất của số lần thất bại trước khi đạt được một số lần thành công nhất định với xác suất thành công không đổi.
NORMDIST(x, mean, standard_dev, cumulative): Hàm trả về giá trị của phân bố chuẩn với trung bình và độ lệch chuẩn xác định, hỗ trợ phân tích xác suất và mô hình hóa dữ liệu theo phân phối chuẩn.
NORMINV (probability, mean, standard_dev): Hàm trả về giá trị nghịch đảo của phân bố tích lũy chuẩn, giúp xác định ngưỡng giá trị dựa trên xác suất, trung bình và độ lệch chuẩn.
NORMSDIST (z): Hàm trả về giá trị của hàm phân phối tích lũy chuẩn tắc, thường được sử dụng để tính toán xác suất trong các bài toán thống kê chuẩn hóa.
NORMSINV (probability): Hàm trả về giá trị nghịch đảo của hàm phân phối tích lũy chuẩn tắc, hỗ trợ xác định giá trị z từ xác suất cho trước.
POISSON (x, mean, cumulative): Hàm trả về xác suất của phân bố Poisson, thường được sử dụng để mô hình hóa số lần xuất hiện của sự kiện hiếm trong một khoảng thời gian hoặc không gian nhất định.
PROB (x_range, prob_range, lower_limit, upper_limit): Hàm tính xác suất của các giá trị nằm trong một phạm vi giới hạn, hỗ trợ đánh giá khả năng xảy ra của các sự kiện trong khoảng xác định.
STANDARDIZE (x, mean, standard_dev): Hàm trả về giá trị chuẩn hóa từ phân phối với trung bình và độ lệch chuẩn cho trước, giúp so sánh các giá trị từ các phân phối khác nhau.
TDIST (x, degrees_freedom, tails): Hàm trả về xác suất của phân bố t Student, thường được sử dụng trong kiểm định giả thuyết khi kích thước mẫu nhỏ và độ lệch chuẩn tổng thể chưa biết.
TINV (probability, degrees_freedom): Hàm trả về giá trị nghịch đảo hai phía của phân bố t Student, hỗ trợ xác định ngưỡng giá trị quan trọng trong các phép thử thống kê.
TTEST (array1, array2, tails, type): Hàm trả về xác suất kết hợp với phép thử t Student, giúp đánh giá liệu hai mẫu dữ liệu có xuất phát từ cùng một tổng thể với giá trị trung bình bằng nhau hay không.
WEIBULL (x, alpha, beta, cumulative): Hàm trả về phân bố Weibull, thường được sử dụng trong phân tích độ tin cậy và thời gian sống của sản phẩm.
ZTEST (array, x, sigma): Hàm trả về giá trị xác suất một phía của phép thử z, hỗ trợ kiểm định giả thuyết về giá trị trung bình của tổng thể khi biết độ lệch chuẩn.
3. Nhóm hàm về Tương Quan và Hồi Quy Tuyến Tính: Cung cấp các công cụ mạnh mẽ để phân tích mối quan hệ giữa các biến và dự đoán giá trị tương lai dựa trên dữ liệu hiện có.
CORREL (array1, array2): Hàm trả về hệ số tương quan giữa hai tập dữ liệu, giúp xác định mức độ liên quan tuyến tính giữa các biến.
COVAR (array1, array2): Hàm trả về hiệp phương sai của hai tập dữ liệu, đo lường mức độ biến đổi cùng nhau của các biến.
FORECAST (x, known_y's, known_x's): Hàm dự đoán giá trị tương lai dựa trên hồi quy tuyến tính, sử dụng các giá trị x và y hiện có để ước lượng giá trị y mới cho một giá trị x cụ thể.
GROWTH (known_y's, known_x's, new_x's, const): Hàm dự đoán tăng trưởng hàm mũ dựa trên dữ liệu hiện có, trả về các giá trị y tương ứng với chuỗi giá trị x mới, phù hợp cho các mô hình tăng trưởng nhanh.
INTERCEPT (known_y's, known_x's): Hàm tính điểm giao cắt của đường hồi quy tuyến tính với trục y, giúp xác định giá trị y khi x bằng 0 trong mô hình hồi quy.
LINEST (known_y's, known_x's, const, stats): Hàm trả về các thống kê của đường hồi quy tuyến tính bằng phương pháp bình phương nhỏ nhất, cung cấp thông tin chi tiết về đường thẳng phù hợp nhất với dữ liệu.
LOGEST (known_y's, known_x's, const, stats): Hàm tính toán đường cong hàm mũ phù hợp nhất với dữ liệu, trả về mảng giá trị mô tả đường cong, thường được sử dụng trong phân tích hồi quy phi tuyến.
PEARSON (array1, array2): Hàm trả về hệ số tương quan Pearson, một chỉ số từ -1.0 đến 1.0 phản ánh mức độ quan hệ tuyến tính giữa hai tập dữ liệu, giúp đánh giá sự tương quan mạnh yếu giữa chúng.
RSQ (known_y's, known_x's): Hàm trả về bình phương hệ số tương quan Pearson, đo lường tỷ lệ phương sai của biến phụ thuộc được giải thích bởi biến độc lập trong mô hình hồi quy.
SLOPE (known_y's, known_x's): Hàm tính hệ số góc của đường hồi quy tuyến tính, phản ánh tốc độ thay đổi của biến phụ thuộc khi biến độc lập thay đổi một đơn vị.
STEYX (known_y's, known_x's): Hàm trả về sai số chuẩn của giá trị y dự đoán trong hồi quy, giúp đánh giá độ chính xác của mô hình hồi quy tuyến tính.
Trên đây là tổng hợp chi tiết các hàm trong nhóm hàm thống kê của Excel, hy vọng sẽ mang lại những kiến thức hữu ích giúp bạn ứng dụng hiệu quả vào công việc. Chúc bạn thành công và khám phá thêm nhiều tiềm năng từ những công cụ tuyệt vời này!
Có thể bạn quan tâm