快速测验:你开车上班30km/h,开车回家60km/h。你的平均速度是多少?

提示: 结果并不是45mk/h,因为它并没有关注到你上班究竟有多远。看看下表的平均数用途吧。

名称&含义 公式/例子 使用情况
算术平均数[平均数] $$\frac{sum}{size}=\frac{a + b + c}{3}$$ 数据集中趋势指标(平均数量)
中位数[中值] 比如list的中间值(2个中间值?值有偶数个,则中位数不唯一) 使用广泛(比如房子,收入)
众数[比较多] 出现次数最多的变量值 主要用于分类数据,也可用于顺序数据和数值型数据。
几何平均数[平均因子] $$\sqrt[3]{abc}$$ 增长率相关,比如:面积,声音
调和平均数[平均数据] $$\frac{3}{\frac{1}{a}+\frac{1}{b}+\frac{1}{c}}$$ 速率相关,比如:速度,产量,花费
平方平均数[方均根] $$M=\sqrt{\frac{\sum_{i=1}^{n}x_i^2}{n}}$$ 数值分布呈现正态分布时才适用,比如:交流电电压,电流数值和匀加速运动的位移中点平均速度

但是,平均是什么意思?

我们有必要了解一下,“平均”是怎么一回事呢?

对于我们大多数人来说,它是一个中间数或者是一个“平衡点”的数。我通常习惯使用多观点看问题,这里给出平均数的另一种解释:

平均数是可以用其表现现在每个数的结果。如果你我吧其中一个数替换成平均值,那会怎么样呢?

平均数的一个目标是让我们从采集样本出了解“代表性”数据。但是怎么计算通常需要更具实际情况来定。接下来我先了解算术平均数。

算数平均数

算术平均数是最常见的平均数了:

$$avaerage = \frac{sum}{number}$$

算术平均数

举个栗子:在电梯里,你重150斤,还有一个同事重100斤,以及一个海象重350斤。那平均体重是多少?

比如:“你能克隆3个一样的人来代替这3个,那么你每个克隆的人需要多重?”

这样情况下我们每个人都能换算出克隆人需要的重量是200斤[(150 + 100 + 350)/3].

优点:

  • 很容易列举出来相加
  • 容易计算:加了除。
  • 很直观-中间的数是在最大值和最小值之间。

缺点:

  • 非常容易受到极端值影响。比如:你有1万元钱,还有一个人有199万,平均一下你也是百万富翁了。很容易让人误导。

算术平均数80%都是适用的,但是也有20%的特殊情况,这样情况下算术平均数是不合适的。

中位数

中位数是“数的中间项”。但是不平均(用算术平均数来看)表示同样的数?怎么办?

幽默故事《我第二》:这是数字的中间数是什么?

  • 1,2,3,4,100

很容易看出来,3是中间数。尽管22是在这些数的中间,但是并非是真正的分布。在这个数列中我们更可能得到一个接近3的数,而非22. 这都是100拉大了平均数,其实看来100并不相关。

中位数解决了数列中间项的问题。如果有两个中间数(偶数项),只取它们的平均值。比如:1 2 3 4 2.5就是中位数。

中位数

优点:

  • 处理特殊值的时候,这样往往是最具代表性的。
  • 分割数据成2组,每个数量都相同。

缺点:

  • 难计算:你需要对数列排序。
  • 不公知(通用): 你说中间,大家认为你说的是”平均“。

关于开车的,”所有驾驶员的一半技术都是低于平均水平的。很吓人对不?“但是在你头脑中你知道这个意思是说:”有一半的司机技术都比中位数那个技术低“。

房价和收入用中位数来代表也比较合适,因为我们希望知道一个中间的位置。比如马云一年有数10亿的收入,但是他的收入和普通人的收入就不太相关了。而且我们也”不感兴趣“,我们只想知道的时”收入与房价的中位数“。

再次说明,使用那种类型的平均数,还是得依靠数据来决定。

众数

众数听起来可能和平均数无关。它是指在统计中出现次数最多的值。就像投票表决一样,这样更难代表人们想要什么。

比方说你将举行一个聚会,是选择周一好还是周末好?哪天好其实就是满足大多数人的需求,平均在这就没有意义了。(难道说张三喜欢周五,李四喜欢周末,那你就选择周六了!)

同样,颜色,电影等等的喜好等更多可以使用勾股定理来衡量.同样的理想的选择是众数,而非平均数。“the “average” color or “average” movie could be… unsatisfactory”——Rambo meets《傲慢与偏见》。

众数

优点:

  • 最有效的投票方式(选择,还是不选择)
  • 给出的选择是大多数人想要的(同样也能给出大多数人不想要的)
  • 简单易懂

缺点:

  • 需要更多的时间来计算(统计全部票数)
  • “胜者为王”- 没有中间状态

众数并不常见,但是设计一个什么样的按钮比较合适,你通常会用到。

几何平均数

“平均项”取决于我们如何利用现有的数据。大锁时候把每项相加然后除的算是平均数能解决。但是有的时候我们只这样做是不够的。比如在投资、面积、和体积上,我们不是用加,而是用乘。

再来一个例子。下面的投资组合你比较喜欢哪个?哪个这年会更优特点?

  • 投资组合A: +10%, -10%, +10%, -10%
  • 投资组合B: +30%, -30%, +30%, -30%

它们看起了基本一样。每天平均(算术平均值)告诉我们,它们两个都像过山车一样,出现盈利和亏损。也许B会跟好,因为一年中它获利是最多的,这样对吗?

死胡同了!这样做只会让你烧掉股市:投资与回报率是相乘的而不是相加!我们不能不管三七二十一,就用算术平均值——我们需要找到回报的实际速率。

  • 投资组合A:

    • 回报:1.1 0.9 1.1 * 0.9 = 0.98(2%的损耗)
    • 去年同期平均水平(0.98)^(1/4)= 每年0.5%的损失(这正好是约2%/ 4,因为数字小)。
  • 投资组合B:

    • 1.3 0.7 1.3 * 0.7 = 0.83(17%的损失)
    • 去年同期平均水平(0.83)^(1/4)= 每年4.6%的损失。

A 2% VS B 17%的损失?这是一个巨大的差距。我很想远离这两个投资组合,非要选择那就是A。我们不能只是把收益相加,这是不知道指数增长的做法。

几何平均数

更多的例子:

  • 通货膨胀率:你有通胀1%,2%和10%。在这段时间的平均通胀是多少?(1.01 1.02 1.10)^(1/3)= 4.3%
  • 优惠券:你有5折、2.5折、3.5折的优惠券。假设你可以使用他们,平均折扣是多少?(即和什么优惠券使用3次相同?)。(0.5 0.75 0.65)^(1/3)= 37.5% 。认为优惠券是“消极”的回报-对商店来说。
  • 面积:你有土地4060,那么平均一边是多少呢?(40 60)^(0.5)= 49。
  • 体积:你有12×24×48的包装箱。“平均”的大小是多少,也就是和多大的立方体相同呢?(12 24 48)^(1/3)= 24。

我敢肯定你能找到更多的例子:几何平均数处理问题是用乘。我想了很久为什么几何平均数对我们来说很有用,原来就是这样啊。

调和平均数

调和平均数很难形象化,但是也很有用。(随便说一句,“调和”是指1/2, 1/3 ··· 1的任何东西。)当多个数度一起的时候,调和平均数帮助我们来计算出平均速度。我们一起来看看文章开头的快速测验。

我开车30km/h,这意味着我获得了30km/h的录入.平均速度受多个速度(X & Y)影响,你需要考虑录入(input)与产出(output),而并非原始数据(路程等)。

$$average rate = total output/total input$$

调和平均数

如果我们吧X和Y放入同一个环境,就速度不同。那我们推理结果是:

  • 上班用1/X的时间(1 = 1/30h)
  • 下班用1/Y的时间(1 = 1/60h)

最终我们得到:

  • 总路程:2(X和Y各自共享1)
  • 总时间:1/X + 1/Y (不同时间,像一个接力赛)

列入公式:

$$\frac{2}{\frac{1}{X} + \frac{1}{Y}}$$

如果是3个速度:

$$\frac{3}{\frac{1}{X} + \frac{1}{Y} + \frac{1}{Z}}$$

这是不错的,不用每次都做代数 - 即使是5个速度的平均也不那么麻烦了。我们的例子中,我们去工作是30km/h回来是60km/h。要得到平均速度,我们只用公式就可以了。

这样不需要我们知道有多远的路程?而且!不管路多远,X和Y具有相同的输出; 也就是说,我们去X km的速度的X,和另一条X km的速度Y的平均速度和去1 km的速度的X和1km的速度Y一样:

$$\frac{2X}{\frac{X}{30} + \frac{X}{60}} = \frac{2}{\frac{1}{30} + \frac{1}{60}}$$

这是合理的,一般是朝着较慢的速度(相比60来说更接近30)倾斜。毕竟,相比30km/h和60km/h相比,我们花了两倍的时间:如果工作60(km)远,它的2个小时去,1小时回来。

核心思想:用单个元素去替换多个元素。在我们的例子中,我们开车40km/h,(途中有,而不是30km/h),并在路上开车40km/h回(而不是60)。重要的是要记住,我们需要将平均速度中的每个“相关”替换。

几个例子:

  • 数据传输:我们在客户端和服务器之间发送数据。客户机在10GB/元发送数据,并接收服务器,在20GB/元。平均成本是多少?我们每一个部分平均成本是2 /(1/10 + 1/20)= 13.3GB/元。也就是说,我们可以交换客户端和服务器的两台机器,成本13.3 GB /元。由于数据被发送和接收的(各部分做“一半工作”),我们真正的速度是13.3 / 2 = 6.65 GB /元。
  • 机器的生产率:我们有一台机器,有预备阶段和完成阶段。当预备时,它能生产25小部件/小时。当完成时,它能生产10小部件/小时。整体生产率是多少?平均2 /(1/25 + 1/10)= 14.28部件/小时的每一个阶段。也就是说,现有的可以替换为相同运行的部件14.28 /小时同样的效果。由于经过两个阶段,本机完成14.28 / 2 = 7.14部件/小时。
  • 买股票。假设你买了价值1000元每月的股票,不讨论价格(平均成本)。你三月付25美元/股一月30元/股,二月35美元/股。支付的平均价格是多少?3 /(1/25 + 1/30 1/35 +)=29.43美元(因为你买了在较低的价格,少的更昂贵)。你有$ 3000 / 29.43 = 101.94万股。这“工作量”有点抽象-这是美元转成股份。几个月比别人用更多的美元来购买股票,在这种情况下,高利率是糟糕的情况。

调和平均数同样可以用于衡量利率。

平方平均数

平方平均数只有在数值分布呈现正态分布时才适用。高中的数学题目中常常会出现以方均根值计算班级平均成绩的题目, 这是预先假设全班成绩为正态分布的结果,实际情况不一定完全适用。 如成绩分布极为平均或呈现多峰状(如 30分、70分的人数远超过其它分数的人数), 方均根值就无法真实表现出该班级的平均成绩。

平方平均数常用来计算一组数据和某个数据的“平均差”。像交流电的电压、电流数值以及均匀加速直线运动的位移中点平均速度,都是以其实际数值的方均根表示。例如,交流电 220V 表示电压信号的均方根(又称为有效值),即 220V,为交流电瞬时值(瞬时值又称暂态值)的最大值的$$\frac{1}{\sqrt{2}}$$。

结论

即使一个简单的方法有会有多种用途,还有好多有用的我们没有覆盖
(加权平均值)。关键还是方法理解:

  • “平均项”是可以看作可以取代别的项的。
  • 平均使用哪种类型是要取决于实际运用。

数学是多么让人着迷,就一个平均值都千变万化。Happy math.

参考文档