【什么是负二项分布】负二项分布是概率论与统计学中的一种离散概率分布,用于描述在一系列独立的伯努利试验中,直到第 r 次成功 时所需的试验次数。它与二项分布不同,二项分布关注的是在固定次数的试验中取得某次成功的次数,而负二项分布则关注达到指定成功次数所需的试验次数。
负二项分布常用于实际问题中,例如:销售员在获得一定数量的客户签约前需要访问多少潜在客户;或者在质量控制中,检测到第 r 个不合格品之前需要测试多少产品等。
负二项分布的核心概念总结
概念 | 内容 |
定义 | 描述在一系列独立的伯努利试验中,直到第 r 次成功时所需的试验次数的概率分布 |
参数 | r(成功次数),p(每次试验的成功概率) |
取值范围 | k = r, r+1, r+2, ...(即至少 r 次试验) |
概率质量函数 | $ P(X = k) = \binom{k-1}{r-1} p^r (1-p)^{k-r} $ |
数学期望 | $ E(X) = \frac{r(1-p)}{p} $ |
方差 | $ Var(X) = \frac{r(1-p)}{p^2} $ |
应用场景 | 销售、质量控制、保险精算、生物统计等 |
负二项分布与二项分布的区别
特征 | 负二项分布 | 二项分布 |
关注点 | 达到 r 次成功所需的试验次数 | 在 n 次试验中成功 k 次的概率 |
参数 | r(成功次数),p(成功概率) | n(试验次数),p(成功概率) |
取值范围 | k ≥ r | k ≤ n |
是否固定试验次数 | 不固定 | 固定 |
典型应用 | 预测完成目标所需的尝试次数 | 计算在固定次数内成功次数的概率 |
负二项分布的实际例子
假设一个销售人员每拜访一位客户,有 30% 的概率达成交易(即成功概率 p=0.3)。那么他要找到 3 位客户签约,平均需要拜访多少位客户?
根据公式:
$$
E(X) = \frac{r(1-p)}{p} = \frac{3 \times (1 - 0.3)}{0.3} = \frac{3 \times 0.7}{0.3} = 7
$$
也就是说,平均需要拜访 7 位客户 才能签下 3 个订单。
总结
负二项分布是一种重要的概率模型,适用于那些关注“达到特定成功次数所需试验次数”的场景。相比二项分布,它更加灵活,适合处理不固定试验次数的问题。通过理解其数学表达式和应用场景,可以更好地应用于实际数据分析和决策支持中。