什么是箱线图(或盒须图), Box-plot (or Whisker-plot) 箱线图是一种直观简洁的方式去呈现一组数据的分布. 因其形状如箱子而得名. 箱线图广泛用于各个数据分析领域, 其中包括品质管理. 箱线图是由美国著名统计学家John Tukey发明. 它能非常简单明了地显示一组数据中5个重要数值, 最大值 (Maximum Value), 最小值 (Minimum Value), 中位数 (Median Value), 下四分位数 (First Quartile), 上四分位数 (Third Quartile). 箱线图还能发现一组数据中的存在的异常值 (Outliers). 箱线图不需要假定数据服从特定的分布形式, 真实直观地反应出数据的原本面貌. 另一方面, 箱线图用四分位数为基础去区分数据中的异常值. 所以, 箱线图上呈现出的异常值也会比较客观. 箱线图的定义和绘制 在一组数据中先找出以下重要数值会帮助我们来绘制箱线图: 最小值(Minimum Value, Min) 下四分位数(First Quartile, Q1) 中位数(Median Value, Med) 上四分位数(Third Quartile, Q3) 最大值(Maximum Value, Max) 四分位间距(Interquartile Range, IQR) 内限 (Inner Fence) 外限 (Outer Fence) 箱线图绘制步骤: 第二步: 画一个矩形盒,两端边的位置分别为上下四分位数(Q1 和Q3); 在矩形盒内部中位数(Med) 位置画一条线段为中位线。 第三步: 在Q3+1.5 x IQR(四分位间距)和Q1-1.5 x IQR处画两条线段, 这两条线段为异常值截断点, 称其内限(Inner Fence); 在Q3+3 x IQR和Q...
Comments