Published on

BA04-5. [系列第四篇/最终篇] 贝叶斯 A/B 测试 — 哪种销售战略更有效?

BA04-5. [系列第四篇/最终篇] 贝叶斯 A/B 测试 — 哪种销售战略更有效?

贝叶斯 A/B 测试 — 哪种销售战略更有效?

"不进行实验的销售团队无法成长。但是,如果不能用概率来解读实验结果,也就无从学习。"


引言:销售中可以进行 A/B 测试吗?

A/B 测试主要用于优化网站的按钮颜色或电子邮件的标题行。然而,在销售活动中,“哪种方式更有效?” 这个问题也始终存在:

问题战略 A战略 B
首次接触电子邮件提案电话推销 (Cold call)
演示方式以技术为中心的演示以商业价值为中心的演示
价格提案折扣提案 (10% off)价值打包提案
跟进 (Follow-up)间隔 3 天间隔 7 天
资料形式详细的技术文档 (30页)核心摘要 (3页)

问题在于样本量。网站的 A/B 测试可以通过数千名访客迅速得出结论,但 B2B 销售每个季度可能只有几十笔交易。传统的频率学派 (Frequentist) A/B 测试只会重复一句话:“尚未达到统计学上的显著差异 (p > 0.05)”。

贝叶斯 A/B 测试打破了这一限制。即使在小样本下,它也能提供实用的答案,例如“A 优于 B 的概率为 73%”


第一部分:频率学派 vs 贝叶斯学派 — 有何不同

1.1 频率学派方法

使用战略 A 尝试 20 次 → 8 次成功(转化率 40%) 使用战略 B 尝试 20 次 → 12 次成功(转化率 60%)

频率学派检验:

z=pBpAp^(1p^)(1nA+1nB)z = \frac{p_B - p_A}{\sqrt{\hat{p}(1-\hat{p})(\frac{1}{n_A} + \frac{1}{n_B})}}

其中 p^=8+1240=0.50\hat{p} = \frac{8 + 12}{40} = 0.50

z=0.600.400.50×0.50×(0.05+0.05)=0.200.025=0.200.158=1.265z = \frac{0.60 - 0.40}{\sqrt{0.50 \times 0.50 \times (0.05 + 0.05)}} = \frac{0.20}{\sqrt{0.025}} = \frac{0.20}{0.158} = 1.265

p-value = 0.103. 在 0.05 的显著性水平下,“统计学上不显著”。

结论:“目前还不知道,需要收集更多数据。”

在 B2B 销售中,要再收集 40 个案例需要 3 到 6 个月。在这段时间内,必须继续使用低效的战略。

1.2 贝叶斯方法

使用贝叶斯方法分析相同的数据。

先验分布:无信息先验 β(1, 1)

后验分布

战略 A:Beta(1+8,1+12)=Beta(9,13)\text{战略 A}: \text{Beta}(1 + 8, 1 + 12) = \text{Beta}(9, 13) 战略 B:Beta(1+12,1+8)=Beta(13,9)\text{战略 B}: \text{Beta}(1 + 12, 1 + 8) = \text{Beta}(13, 9)

各自的期望值:

E[pA]=99+13=0.409(40.9%)E[p_A] = \frac{9}{9 + 13} = 0.409 \quad (40.9\%) E[pB]=1313+9=0.591(59.1%)E[p_B] = \frac{13}{13 + 9} = 0.591 \quad (59.1\%) 核心问题:“B 优于 A 的概率是多少?”

蒙特卡洛模拟(10,000 次):

  • 从 Beta(13, 9) 中抽取 10,000 个样本 → pBp_B 样本
  • 从 Beta(9, 13) 中抽取 10,000 个样本 → pAp_A 样本
  • 计算 pB>pAp_B > p_A 的比例
P(B>A)=89.3%P(B > A) = \mathbf{89.3\%}

结论:“战略 B 优于战略 A 的概率为 89.3%。”

频率学派说“不知道”,但贝叶斯学派回答“B 更好的概率是 89.3%”。而且,随着数据的增加,这个答案会变得更加精确。


第二部分:优化销售触点 (Touchpoints)

2.1 可测试的销售变量

在销售流程的每个阶段都可以进行 A/B 测试:

Discovery(发现)阶段:
变量方案 A方案 B
首次接触方式LinkedIn 私信电子邮件
初始资料公司介绍 (15页)成功案例 1 页
会议邀约“30分钟咖啡闲聊”“60分钟解决方案演示”
Proposal(提案)阶段:
变量方案 A方案 B
报价结构单一总价按模块拆分
折扣战略年度合同 10% 折扣前 3 个月免费
成功案例同行业案例同规模案例

2.2 实战案例:“3 天后跟进 vs 7 天后跟进”

假设:首次会议后的跟进间隔会影响转化率。

设计

  • 战略 A:3 天后电话跟进
  • 战略 B:7 天后邮件跟进

8 周后的结果

应用次数进入第二轮会议转化率
3 天后电话 (A)15 次9 次60.0%
7 天后邮件 (B)18 次7 次38.9%

贝叶斯分析

pABeta(10,7),pBBeta(8,12)p_A \sim \text{Beta}(10, 7), \quad p_B \sim \text{Beta}(8, 12) P(A>B)=91.7%P(A > B) = \mathbf{91.7\%}

结论:“3 天后的电话跟进优于 7 天后的邮件跟进的概率为 91.7%。建议立即在整个团队内将‘3 天后电话跟进’标准化。”

2.3 计算预期提升 (Expected Lift)

我们还可以计算战略 A 比战略 B 好多少

E[Lift]=E[pApBpB]E[\text{Lift}] = E\left[\frac{p_A - p_B}{p_B}\right]

通过蒙特卡洛模拟:

E[Lift]=+54.2%E[\text{Lift}] = +54.2\%

与 7 天后的邮件相比,3 天后的电话跟进可将转化率提高约 54%


第三部分:汤普森采样 (Thompson Sampling) — 边实验边优化

3.1 探索 (Explore) vs 利用 (Exploit) 的困境

A/B 测试的一个根本性问题:在实验期间被应用了劣质战略的客户会遭受损失。在 B2B 销售中,这意味着“为了实验而使用非最优的方法接触客户”。

汤普森采样优雅地解决了这个困境。

3.2 算法

为每个战略 kk 维护一个后验分布 Beta(αk,βk)\text{Beta}(\alpha_k, \beta_k)

每当有新客户进入时:

  1. 从每个战略的后验分布中随机抽取一个样本θkBeta(αk,βk)\theta_k \sim \text{Beta}(\alpha_k, \beta_k)
  2. 选择具有最高样本值的战略:k=argmaxkθkk^* = \arg\max_k \theta_k
  3. 应用所选战略并观察结果(成功/失败)
  4. 更新该战略的 αk\alpha_kβk\beta_k

该算法的核心:表现好的战略会自然而然地被更频繁地选择,而表现差的战略会自然地被淘汰。但是,它并没有完全放弃劣势战略,而是留下了以后翻盘的机会。

3.3 实战应用场景

比较 3 种演示战略:
轮次技术演示 (A)商业演示 (B)混合演示 (C)
初始Beta(1,1)Beta(1,1)Beta(1,1)
5 轮后Beta(3,3)Beta(4,2)Beta(2,4)
10 轮后Beta(5,6)Beta(8,3)Beta(3,8)
20 轮后Beta(8,13)Beta(15,6)Beta(5,16)

10 轮后汤普森采样的选择概率:

P(选择 A)15%,P(选择 B)80%,P(选择 C)5%P(\text{选择 A}) \approx 15\%, \quad P(\text{选择 B}) \approx 80\%, \quad P(\text{选择 C}) \approx 5\%

商业演示 (B) 会自然地以 80% 的权重被选中。技术演示 (A) 还有 15% 的机会,而混合演示 (C) 实际上已被淘汰。

20 轮后:

P(选择 B)95%P(\text{选择 B}) \approx 95\%

商业影响:传统的 A/B 测试会在 20 次机会中将大约 7 次“浪费”在低效的战略上。而汤普森采样在 5 轮(5 次)后就开始向最优战略倾斜,实现了在将浪费降至最低的同时进行学习


第四部分:向组织学习系统进化

4.1 个人的实验成为组织的知识

当销售人员 A 发现“3 天后电话跟进”有效时,该数据会被反映在整个组织的先验分布 (Prior) 中。

下个季度,当新销售人员 B 开始相同的实验时,先验分布不再是 Beta(1, 1),而是 Beta(10, 7) — 也就是说,从一开始就继承了 A 的经验。

个人的后验分布组织的先验分布下一个人的起跑线\text{个人的后验分布} \rightarrow \text{组织的先验分布} \rightarrow \text{下一个人的起跑线}

这就是组织学习的贝叶斯循环。每个销售人员的经验都不会消失,而是永远积累在 α 和 β 这两个数字中。

4.2 战略库

随着时间的推移,组织将拥有一个如下所示的贝叶斯战略库

战略应用次数成功次数后验分布P(成功)可信度
3 天后电话跟进45 次28 次Beta(29, 18)61.7%🌳
LinkedIn 首次接触62 次31 次Beta(32, 32)50.0%🌳
商业演示38 次25 次Beta(26, 14)65.0%🌳
成功案例 1 页55 次35 次Beta(36, 21)63.2%🌳
按模块报价28 次19 次Beta(20, 10)66.7%🌿

应用:当新人问“演示应该怎么做?”时,可以直接从库中推荐商业演示(P=65.0%, 🌳 Mature)。这不是前辈的直觉,而是由 38 个实战数据支撑的推荐


第五部分:实战设计指南

5.1 销售 A/B 测试检查清单

  1. 只改变一个变量:在测试跟进间隔时,不能同时改变资料的形式。
  2. 最小样本量:贝叶斯方法从 10 个案例开始就能捕捉到有意义的信号,但达到 20 个案例以上时可信度会更高。
  3. 随机分配:将客户随机分配到 A/B 组。禁止“容易搞定的客户分给 B,难搞的客户分给 A”。
  4. 在同一时间段内执行:如果 1 月份执行 A,2 月份执行 B,就会混入季节性因素。
  5. 预先定义结果的衡量标准:提前决定“成功”是指进入第二轮会议、要求报价还是签订合同。

5.2 决策标准

P(A>B)90%将 A 采纳为标准战略P(A > B) \geq 90\% \rightarrow \text{将 A 采纳为标准战略} 75%P(A>B)<90%收集更多数据(继续汤普森采样)75\% \leq P(A > B) < 90\% \rightarrow \text{收集更多数据(继续汤普森采样)} P(A>B)<75%目前尚无法判断,继续实验P(A > B) < 75\% \rightarrow \text{目前尚无法判断,继续实验}

结语:贝叶斯改变销售的未来

下面我们来总结一下在这个 4 篇系列文章中所探讨的内容:

篇章主题核心问题核心工具
第一篇引擎原理“这笔交易的成功概率是多少?”Beta 分布、P(Win)、置信区间
第二篇投资组合“整个销售漏斗的预期收入是多少?”加权漏斗、EVV、覆盖率
第三篇竞争分析“竞争对手出现时概率会如何变化?”CIF、条件概率、Win Factor
第四篇战略优化“哪种销售方式更有效?”贝叶斯 A/B 测试、汤普森采样

贯穿这 4 篇文章的有一个原则:

“不确定性不是用来消除的,而是用来管理的。”

所有的销售都存在不确定性。客户的想法、竞争对手的动向、市场的变化 — 完全准确地预测这些是不可能的。但是,贝叶斯框架提供了一种量化、追踪并将这种不确定性降至最低的系统方法

EXAWin 的贝叶斯引擎不仅仅是一个工具。它是一个改变销售组织思维方式的范式 (Paradigm)

从直觉走向证据。 从感觉走向概率。 从经验走向数据。

而这种改变的起点,就始于你在下一次会议之后,在 EXAWin 中记录的一个小小的信号。


作者:EXA Bayesian Research Lab
发布:EXAWin Technical Series — Vol. 4 (最终篇)
关键字:#BayesianABTest #ThompsonSampling #SalesOptimization #OrganizationalLearning #EXAWin

Bayesian EXAWin-Rate Forecaster

通过贝叶斯更新实时分析谈判中的细微信号,精确预测销售成功率。有了 EXAWin,销售将从单纯的直觉进化为最完美的现代数据科学。

Comments0

Deep Dive

More in Bayesian

Explore Archive
产线上的 PQC 事件:不急于定性不良,而是用证据进行管理
Bayesian
Exa Omni+
EXA Intel

产线上的 PQC 事件:不急于定性不良,而是用证据进行管理

这是一篇以主力制造线作为基准流程的 SCM 业务场景。文章说明了在线巡回 PQC 中发现的 NG,如何连接到 LOT、产线、位置、不良类型、处置状态、供应品风险以及交期影响。同时也说明了纸质和 Excel 为中心的质量记录,如何在 Exa Omni+ 中被标准化,并通过重复证据持续更新风险判断。

ANALYSIS
一个 POP 输入一路连接到出货的瞬间:产线执行控制的一天
Bayesian
Exa Omni+
EXA Intel

一个 POP 输入一路连接到出货的瞬间:产线执行控制的一天

这是一篇业务场景,说明在电热毯生产线上,作业者的一次 POP 实绩输入如何连接到线边库存、WIP 状态、WMS 收发存、生产风险警报 R/Y/G,以及日本总部管制。文章说明现场并不是围绕复杂算法使用 Exa Omni+,而是围绕作业指示、实绩和风险信号进行执行。

ANALYSIS
从一楼入库到外部成品仓库:库存如何持续作为公司资产存在
Bayesian
Exa Omni+
EXA Intel

从一楼入库到外部成品仓库:库存如何持续作为公司资产存在

这是一篇实时收发存同步场景,描述原材料从一楼入库、二楼 IQC 检查、Keeping 库位管理、Picking、工序投入,一直到外部 3PL 成品仓库保管的过程。文章说明其他出库、Scrap、退货、盘点协调等现场例外,如何与全公司库存准确性保持一致。

ANALYSIS
BA04-5. [系列第四篇/最终篇] 贝叶斯 A/B 测试 — 哪种销售战略更有效? | EXA Enterprise