优惠论坛
标题:
随机赛程的最佳策略
[打印本页]
作者:
狗咬尾巴
时间:
2010-12-4 11:08
标题:
随机赛程的最佳策略
引言
: D4 S/ l3 b! w
/ S5 }$ O0 t0 L; G5 ~) V, w
在日常生活中的许多场合,像生意的投资、决策的推行等,我们往往无法事先确知其结果,但对其成败的机会,则往往可事先估计出。这种成败的机会,也即是我们通常所说的事情成败的机率,然而使事情成功的方法不一,所以如何选用一个方法,使其成功的机率最大,是一个很值得研究的问题。本文拟就此类问题中之某型问题作一探讨。为叙述方便,作者特考虑下面的数学模型,实际生活中的模型当较此复杂得多。不过笔者为文之目的,不单是提出一个结果供读者参考,而是希望能藉着本文介绍一些简单而又实用的数学方法,让读者能一窥这些方法在这类问题中是如何被使用的。
% t0 R. V6 p) `) P2 B. H
3 l; M. w h, H9 y* _
问题
7 ^& m6 L: \7 H+ {% h0 } H" @& q B
1 k% q$ F/ Z1 r. s' U( N: ]
; \5 S7 q. F. m
有某甲持 c 元,拟与持 m 元的庄家赛局,并明定每局所下赌注至少为 1 元。设在每局中,某甲赢的机率恆为一常数 p (0<p<1)。并且我们假设只要某甲或庄家输尽,整个赛局即结束。那么某甲应如何在每局中下注,才会使他赢得庄家所有资本的机率达到最大值呢?
: l/ |" Q4 I, M; q# P2 w
! L- w+ G$ Y8 A" n: y: s+ y& _3 G
当然,我们假设下注的金额是合理的,比如说若某甲现已有 8 元,而庄家只有 2 元时,那么某甲最多只能下注2元。
0 b/ w5 z' ~ l8 {
; a+ r! N8 y* N, L5 t# e0 U8 e
本文
- ~7 d3 i! U& O0 u( S
0 M% {1 a' G" _. ~* k2 z
+ S3 T- v# \# u/ M% {: R
问题的叙述虽很简单,但细思之下,却发现其并不很简单。这道理不难明白,因为可下注的方法实在太多了,要一一比较是不可能的。
: M$ @3 e( O& r: V' ^! T
1 R9 O3 J* o- l l! _
为了要克服上面所说的困难,数学家首先考虑几种比较可能为人们採用的方法,这些方法所以较常採用,泰半是由于直觉上认为它们可被採行。当然,直觉的认定往往是不可靠的,所以最好能有理论支持。下面就介绍三种可能的方法,并比较其优劣。
T" q: H- d" S5 r( s) ]( \! L& m5 k
! V0 }* y$ Z8 N7 B# t) l" G
; P" ]4 l# A, p( m1 M
方法一、每次甲均下赌注 1 元。(显然,这样的下注法最保守,我们称之为保守型下注法。)
: c/ X1 T, ~; r1 j! C) ~
方法二、首先甲下 1 元赌注。若他赢了,则下次仍下 1 元;若输了,则将赌注加倍,依此类推。换言之,往后只要一赢,他就下 1 元,否则就把下注金额加倍。当然,我们假设所下金额是合理的。(显然持这种下法的理由是因为只要一赢,那么非但所有输的金额即全捞回来,并且反多赢 1 元,我们姑且称之为输不起型下注法。)
; k0 g4 c3 |2 E" e7 W
方法三、只要许可,甲就将所有赌本下注,因此只要一轮,某甲就血本无归。(显然这种方法是最大胆的,我们就称之为极端型下注法。)
; Z$ {1 A3 |7 t
你会採用哪种方法呢?能说个道理出来吗?事实上,答案并不简单,它跟 p 究竟大于、等于或小于 1/2 有关,也即跟你是否比庄家强有关。我们就举 c=2 的例子来说明。为方便计,我们以「+」表甲赢,以「-」表甲输,并以+、-所形成之中列表示甲在整赛局输赢的顺序。
2 }2 E: n2 }9 h8 W9 m3 @
" F L) ~ ^ L+ Q( s$ X+ @
首先我们考虑保守型下注法,此时只有在下列诸场合,甲才会赢(即庄家赌本输光)。
! z" }8 H5 Z- Z+ Q u& U
" f5 G1 k' {, D7 y3 N
++,
( C k$ D# k4 w: T
+-++,-+++,
, F! O' N" b. v8 e# { S* N! P4 k8 Z
+-+-++,+-+++,-++-++,-+-+++,
5 I0 c* ^6 s9 b# m
。
4 i1 V. W u5 K4 x A# w; g
在第一列 ++ 中,甲连赢两次,此次机率为 。在第二列中,甲赢了三次,输了一次,并且有两种可能性,所以其机率为 (q 为输的机率,故 p+q=1)。依此推导可得在第 n 列中,甲赢了 n+1 次,而输了 n-1 次,并且有 2n-1 种可能性,所以其机率为 2n-1pn+1qn-1。因此可得在整个赛局中,甲赢的机率为
* v" i) E A/ M/ l
4 y( L8 b/ y! h: _/ w
! i j7 d7 P. U
- a6 j" t2 ]% K. U4 y
9 ?( Y7 }# D0 t+ ~: k0 L8 b
6 l) g' n8 f- R! w* M
) x# q; Y5 d2 y9 v
' U/ z+ I8 h% U6 A( B) J% p) C: w
; T: p# I" D7 t! Q
. d7 e) P4 ^4 s0 ?5 S& w
$ q9 h" |! Y6 B: X1 Q. E
现在让我们考虑输不起型下注法。此时只有在下列诸场合,甲才会赢。
# {% K9 L7 F$ J1 H7 T4 A9 ]
& G7 r; ^: w9 r8 `
++,+-+,
7 H T, b( Q6 c/ ?9 D
-+++,-++-+,(注意:甲第二次仅能下注 1 元)
6 w/ T! b1 v9 N0 _) y* ?
-+-+++,-+-++-+,
" y" @! K8 h/ \; D
+ `) t: q6 R$ g. N( k w
, ,
+ Z8 _6 z0 L4 r4 O/ L" G
。
/ q/ o' M8 b4 Z1 |! ~: _
% r, B* _7 Z' i7 }" l7 o; r$ d' v
仿上之计算,可得此时甲赢的机率为
( Q' [; @; X7 F. U9 r
H& W2 s0 n8 ?9 Y$ M. p: j. R2 R8 _; n
! m5 d" L* b# X: t3 Y$ H9 E
6 ]8 ~: V4 U G: o
7 ]4 ~$ n- A; ^! \$ I/ W: C/ J
@3 _: E. f+ h. v% k+ f% A+ B
5 n) g: j2 h F! ~* @8 Y/ v5 }
: H$ @7 e& u, A
+ D5 p# \& l( T& R% @+ n% X
最后设某甲採极端法,则甲第一次即下注2元,因此一次就决定了输赢,所以甲赢的机率为 p 。
/ o- Z# \3 h" {& c! {* `2 _8 Z
; A2 F8 z" j: A
现在我们再回到原问题:究竟在这三种方法中,以那种方法最好?由于相对应赢的机率公式已求得,所以我们只需将 p 值代入,进而比较其大小即可,举例来说,当 时,三者之值皆为 ;而当 时,三者之值依序为 、、;至于当 时,则其值依序为 、、。这些数值告诉我们,当 时,三种下注法没影响甲赢的机会;当 时,则以保守法较好;当 时,却以极端法最佳,保守法最差。
4 A# r/ D1 @% e( b
# @* D$ x6 E8 R% n' J
这些结论,是不是有些出你意料呢?其实问题还没全部解决,迄今我们仅就保守、输不起、极端三型来作比较。是否尚有其他型的下注法会使得答案更好?还有,我们仅就特例来考虑,在一般的情形下,答案又是怎样呢?
5 t% \' e% G+ { j' i; s
2 Q( O6 g& m: Z; V: I
现在,先把最一般性的结果写在下面,其中 代表当甲有 i 元时会赢的机率。
4 C) h. H4 I4 h4 {9 z
' X' ?0 l/ ~* ?3 q
: @2 Y( I& J& @1 H6 I' Q
情况一:
1 N9 r* r1 k. o. v5 O! `" H
此时不论甲如何下注, 恒等于 c/(m+c)。
, u& n( R; [ N
/ I2 s1 d' |. ?+ Z& \- d
情况二:
9 r2 m' X3 ^( @ C5 K
此时不论甲如何下注, ,而右端为保守型下注法赢的机率。因此,在此情况以保守型的下注法为最稳当。另一方面,极端下注法的赢面最低。
/ J1 O7 \8 F# S5 h8 H: u6 O4 Y# Y
. Y# \1 Y" a- d j: S1 G
情况三:
3 J+ ?) P% Y. |8 |
此时以极端法最佳,保守法最差。同样地,保守型下注法赢的机率为 。
+ C$ s- j: ~" u; B
; x3 ]( X; v. {; F6 _3 o" `) n
现在我们就来研究,为什么会有这个结论!这用到了一些数学工具,不过对其中较复杂的部分,因顾及本文的可读性,笔者只很扼要的叙述一下。
9 F: a! {- |0 v) S0 K
8 G5 t# P, _- d' [ j
由于在上面的结论里,保守法处于一个居中的地位,所以我们先就此法进行讨论,然后再进一步研究整个问题。
! B) t9 D4 Q! s6 A0 W3 w
8 ^# r+ o2 P& }
如同以前, 代表当甲所拥有的资本达 i 元时,他会赢的机率。由于甲及庄家的总资本额为 m+c 元,所以 i 之可能值为 i = 0, 1, …, m + c。显然地,,,而 为我们最早所想求得之机率。
0 e6 ]) @5 W3 \( _
% s5 [! R! ^8 E
/ u" [: I& y! _) x _6 z$ X, l4 J
情况一:
1 U# l1 Z9 B5 Y1 I ~
假定某甲现有 i 元,那么有 的机会,他的资本会成为 i+1 或 i-1 元。因此
8 z/ L: S2 D- ?3 e
; I7 P! e3 K, N* v7 V& k) z
6 m( \0 M6 ?; I& L! [4 g+ H c# E/ x
m; D6 U7 h) H1 f; @, Q; ^
: {8 b% o4 ~; K% g, E. a6 P
, n" d) B& B7 _* C9 X8 o
2 I" b6 B& i# U+ O e8 ~* u) p
这样的函数 ν,在数学上是一个线性函数,因此解的通式为 。由于,、,得 a=0、 。因此 ,亦即甲的赢面为 c/(m+c)。
- y. ^- U$ {. D3 g( M* [' k( @# ]# a
" r3 r) W( }2 v% v$ W) i
情况二:
! k {' ?% C+ D7 \& e* j* d
令 q=1-p。此时对 ν 我们有方程式
# w( N5 c/ K0 y0 _* }
' x: m, T1 t0 ]7 u
( G/ Y, ~. X8 M6 }( a8 c6 b
1 D* u" }* I0 ~ d: }3 @
2 l/ n# O0 s. g( P: L: U9 v
2 r8 I, V" y& H# W5 @# N
v7 a# o" |3 t: b! A4 |8 d
这样的一组方程式,在数学上称作是差分方程式。它也有一个求解的一般方法,但其道理较深。为此之故,我们特採用下面的方法。
$ ?* P: Q. U# A4 l2 s# H5 F$ w
利用p+q=1,上组方程式可改写为
, a' b8 n; i0 c8 C
/ G% @5 N7 J+ s. @/ c: ^4 D A
( e7 X9 U$ D" l; u8 ?( v3 K! S
/ z r# ]. a3 V) t, w; B% o' a7 E. B$ A4 ?
1 j4 S/ Z5 o% U
. C. {$ ]: v6 K. t
O" E7 ?! ^, |, d1 O* d
两边相加,并利用 、,得
; m1 R8 M1 R" G6 p
' O# A8 O+ p8 I- K* @. S% {# F4 i
' N1 \# |& J' x2 b
* C% z- |- {+ s1 F
4 Y, {# L" d( }; w( S
+ r6 F3 P+ h+ ~" i8 i
w! {- C- H+ F& r' }8 r" y+ q& I
若取前 c 项相加,则得
B( T( o$ y: X+ Z$ D$ k; g3 z( B w8 c: }
+ b8 }) p# c5 [( {
; Y: p# V r! `. C, \' ?. {
3 C x$ I) w/ `0 u
) O) r/ L: J5 z. c: `7 j6 j5 Z# `
5 A& D( d& R! `! V$ N$ l
, ^4 ], R, P9 Q; @8 }
情况三:
5 P6 c! A! N$ c+ ^. w
仿二之解法,可求得
/ o) L3 J5 S2 `# |+ y/ S5 a
- y# r, f+ N$ ?: l6 [) W$ N+ H2 {
* u: t ?2 M' C0 `# f* J
! R; p& x6 q# J8 ^
0 O! E2 r9 P8 H' X
% _$ B* L6 c* j1 X" j/ c
3 ~2 J( y6 @# E. R0 B# n8 {
4 L: {( h) n/ t& B- u/ P9 \
保守法的 已求得,现在我们来研究为什么在情况二时,以保守下注法的 为最大;而在情况三时,反以保守下注法的 为最小;同时另一方面,在情况二时,则无论何种下注法, 皆一样。
; A p& e. P1 W' r& v+ _7 @6 |( z
! Z8 v/ G% U3 i' I8 M4 k$ g
首先我们引进一个定理。令 Sn 代表在第 n 次赛局时,甲所拥有之资本额,因此 Sn 是一个随机变数。我们并设 S0=c,即原资本。令 N 表结束赛局所需之时间,因此 SN=0 或 c+m。我们并以 E 表期望值。
3 ]/ U6 @9 D" v7 L+ l8 J; p
^1 h% Q1 h/ E2 p) _% q
; b8 p+ _# P! H4 x; Y4 @
定理:
+ H2 f" l) K* H; X
设 f 为一定义于 Sn 上之有界函数。若在 Sn 之条件下,f(Sn+1) 之期望值 E[f(Sn+1)] = f(Sn),则 E[f(SN)] = f(S0) = f(c)。若将「=」改为「」,则结论亦真。
$ L8 r3 [- C. i1 r
此定理在机率学上,即着名的选择样本定理 (optional sampling theorem),它的证明已超过本刊程度,所以略去不证,但它的直观意义却不难了解。就拿「=」的情形来说,其实是说若你的第 n+1 次赛局,平均而言并不能改变在第 n 次赛局时 f 之值,则当整个赛局结束时,f 的平均值也与原先值一样。另一方面,若在「」的情况,亦即你的第 n+1 次赛局平均而言会改进 f 先前之值,则当赛局结束时,f 的平均值也曾比原先值为佳。
, U1 l7 `1 ]0 Y' o- A# m
. m( c. L0 g& [) b8 V4 {! T% i/ o
现在我们就拿这定理来证明先前我们所下之结论。
8 s- Q8 P0 @ h( H, E& C% Z
& _7 G# A& C( Z' d; R& Y
首先,我们考虑情况一。此时取 f(Sn)=Sn,则不论对何种下注法,因胜负机会均等, ,所以若给定 Sn,则 ESn+1 = Sn。因此由上定理知 ESN = c。但 = ,所以知不论以何种方法, 。
1 b6 R/ E8 |* T5 T+ x! E
2 z, J3 J+ T+ F3 N0 r- [
至于在情况二或三时,我们取 。此时若给定 Sn,则
+ g3 R* V2 N, t1 m! j
6 ~3 \* @7 v6 x9 E3 O+ _( @7 O
5 _9 ~( T: @& G+ Q
8 X* t J Y$ X! S
7 J3 J: @$ }4 D+ K
& M7 W% B' t0 t4 G& B* n
4 `1 l t% Y1 `" \! o6 g. S7 k
( ^+ U/ I( }2 z
0 `" l0 M6 o% Q0 ^0 \
其中 为所下注之金额。利用
) C- j0 t |! u" d& x* J
) d0 ~9 s/ L4 W- T8 `( r
: X- ]5 F( W ^& _: y$ G- v
/ K* Y% e. R& o, }- P" Y% _5 t* s, a
. R- t F4 J5 d: d. d% @
) r( G% `$ y' T
2 m. R; \* t" z1 a3 ]- m
! f) \: Z, J2 a# ]. U) A) `! L$ o! }; R
2 f# p9 q& R7 a* S& }
可得不论以何种下注法下注,若给定 Sn,则 。所以由定理知 。但
. h( Z1 _! @' `- F
+ _6 H) }! S% z8 d# P# s
+ E& l: D( L8 N. n; ]2 Z( I
8 A; @' o* r+ J8 W" t/ C( ?
7 {, b' x( h5 O+ C& I5 t
( |5 ^ B. k6 g$ A- G% O7 n
+ t; c+ \# k- K2 d
3 c9 J, K, ?2 C* E1 C
( r8 q' l# d) |
因此可得在情况二, 时,
3 p) Q" t+ h2 J- F2 f$ L) E
; G/ U8 m1 K0 C1 E9 h4 r
+ l u% V: L3 J) z: g* I3 \
) {# ~: L9 p, a) n4 U6 S7 g" \
4 ~8 C$ v9 P) W' p; v. C+ Q: r
* e& |- X+ a; a9 S
8 m( N" h6 {) e2 L9 [) ^0 y
& ?1 j" P* ?0 `. _7 s& F
* }, Y' c, i. D
而在情况三, 时,
# o2 X# [3 T& O0 h" {
8 f! q8 |0 z& {) W+ s+ ~- R7 P
. w9 I* w2 B0 F9 K+ ~) C
1 s4 J4 }5 }# y& }1 v3 M! X7 ~5 w. t
5 b3 L9 i, B" O2 N
' n0 N6 k ^7 G& ~0 a5 O8 E
+ X; ^1 v9 g9 i0 ?* N
0 ~: y( ?6 x. i1 a. q! |
/ B' M; n( j0 C/ b
但 为採用保守下注法时赢的机率,所以知在情况二时,以保守法的 为最大;但在情况三时,却以保守法的 为最小。
/ }1 P v. ?. b- }6 |' f
5 y! U1 b2 c" J7 v9 F
至于为什么在情况二时,以极端法的赢面为最低;但在情况三时,却以极端法的赢面为最大。这其中又牵涉到更深的理论,只好从略了。
0 ]& @# Y J. {
t$ D- w% `% [ z9 r, I* L
附录
0 f. h e7 X! f: f2 @3 p
8 N q9 W7 K$ x3 x% b- W5 _$ k+ _
5 D1 V2 r1 H( q) }
在本文中,我们仅讨论如何使甲赢的机会为最大。但亦有一些其它有趣的问题,比如说,我们或者也想知道欲使整个赛局结束所需的时间的平均值 T(亦即期望值)。关于这个问题,我们有如下的答案:保守下注法的 T 为最大,其值当 时为 T=cm,当 时为
) G0 K9 [. ~' l. ]
* f. J& b& u* y* _
7 M6 \; m& {+ S: w* v9 G) s
+ D$ W# I$ Y) C! j& u
/ N& v, e6 _( v! M/ _) V* G
/ r1 S+ _$ f3 z; h/ w$ L
' v, d0 O. M: r; |+ i/ r
. Q: X4 Q" Q+ c+ x P0 ~5 S
/ {6 I% R: r" `, M. }; Y
另一方面,极端下注法的 T 为最小(但无统一公式)。至于其推导过程,与正文中所用的方法类似,只是演算步骤复杂多了,所以从略。
作者:
爱拼猎人
时间:
2010-12-4 15:13
太长篇了,而且非常的深奥,希望有玩家能看的明白。
作者:
tb35891
时间:
2010-12-4 16:55
好文章,学习了.
作者:
tb35891
时间:
2010-12-5 20:28
又来看了,还是没有看明白,不知楼主有没有看懂了.
作者:
牛二哥
时间:
2010-12-5 23:11
我也来学习下
作者:
ck6767
时间:
2010-12-6 09:46
太深奥了!!!!!!!!!!
欢迎光临 优惠论坛 (http://www.tcelue.ws/)
Powered by Discuz! X3.1