优惠论坛
标题:
随机赛程的最佳策略
[打印本页]
作者:
狗咬尾巴
时间:
2010-12-4 11:08
标题:
随机赛程的最佳策略
引言
; f# J# w9 h4 V3 T1 c) S: K: s3 f; N
4 H! V6 L6 p3 R1 k
在日常生活中的许多场合,像生意的投资、决策的推行等,我们往往无法事先确知其结果,但对其成败的机会,则往往可事先估计出。这种成败的机会,也即是我们通常所说的事情成败的机率,然而使事情成功的方法不一,所以如何选用一个方法,使其成功的机率最大,是一个很值得研究的问题。本文拟就此类问题中之某型问题作一探讨。为叙述方便,作者特考虑下面的数学模型,实际生活中的模型当较此复杂得多。不过笔者为文之目的,不单是提出一个结果供读者参考,而是希望能藉着本文介绍一些简单而又实用的数学方法,让读者能一窥这些方法在这类问题中是如何被使用的。
; L$ Y2 X9 Y# u. ~
" l2 X) j2 L; ? p$ }
问题
: E" N5 ~6 \7 `! t1 N2 D
0 E+ }6 Q- \9 K1 w
" U9 _, z8 T6 k- W* ?1 j/ e
有某甲持 c 元,拟与持 m 元的庄家赛局,并明定每局所下赌注至少为 1 元。设在每局中,某甲赢的机率恆为一常数 p (0<p<1)。并且我们假设只要某甲或庄家输尽,整个赛局即结束。那么某甲应如何在每局中下注,才会使他赢得庄家所有资本的机率达到最大值呢?
" x% G7 i; T |9 x6 }0 R% i
9 J: ^2 F0 m' [9 ~& @1 i7 Z0 L0 ]
当然,我们假设下注的金额是合理的,比如说若某甲现已有 8 元,而庄家只有 2 元时,那么某甲最多只能下注2元。
! t, Z. ]1 I; s& a; |9 x
8 h) t5 r c% m" s" b5 z! J2 n1 L
本文
0 m7 j9 C0 `5 }0 s
3 F' g( ^7 _% K
/ x1 r6 M: C$ Y% |0 S. q
问题的叙述虽很简单,但细思之下,却发现其并不很简单。这道理不难明白,因为可下注的方法实在太多了,要一一比较是不可能的。
7 M' A ~9 N; ?
$ }) }( c3 t! o* i
为了要克服上面所说的困难,数学家首先考虑几种比较可能为人们採用的方法,这些方法所以较常採用,泰半是由于直觉上认为它们可被採行。当然,直觉的认定往往是不可靠的,所以最好能有理论支持。下面就介绍三种可能的方法,并比较其优劣。
: z6 I1 `) Q. f# ]
0 k1 ?) d5 m- ]3 t* D
1 ]; N/ [5 m: k) ^4 A7 U
方法一、每次甲均下赌注 1 元。(显然,这样的下注法最保守,我们称之为保守型下注法。)
$ Q, B) K3 j+ p* `5 V
方法二、首先甲下 1 元赌注。若他赢了,则下次仍下 1 元;若输了,则将赌注加倍,依此类推。换言之,往后只要一赢,他就下 1 元,否则就把下注金额加倍。当然,我们假设所下金额是合理的。(显然持这种下法的理由是因为只要一赢,那么非但所有输的金额即全捞回来,并且反多赢 1 元,我们姑且称之为输不起型下注法。)
) |; o* Y$ o+ O
方法三、只要许可,甲就将所有赌本下注,因此只要一轮,某甲就血本无归。(显然这种方法是最大胆的,我们就称之为极端型下注法。)
8 q! Y z7 ~/ F `; ^
你会採用哪种方法呢?能说个道理出来吗?事实上,答案并不简单,它跟 p 究竟大于、等于或小于 1/2 有关,也即跟你是否比庄家强有关。我们就举 c=2 的例子来说明。为方便计,我们以「+」表甲赢,以「-」表甲输,并以+、-所形成之中列表示甲在整赛局输赢的顺序。
/ s( n; d0 E2 [2 ?# o7 j
/ I0 |( x+ R1 P! w
首先我们考虑保守型下注法,此时只有在下列诸场合,甲才会赢(即庄家赌本输光)。
& H6 p. |8 W- F' k
; v0 _' \' |4 m8 r1 O& d
++,
! d! q! r. C' X/ L ]3 B6 Z
+-++,-+++,
( g' K/ V$ S4 P: T ?& z9 x; M( v7 ~
+-+-++,+-+++,-++-++,-+-+++,
4 a7 l5 p: O( t& {% X/ v. N
。
* _7 \8 X( X& L! M M0 X+ U
在第一列 ++ 中,甲连赢两次,此次机率为 。在第二列中,甲赢了三次,输了一次,并且有两种可能性,所以其机率为 (q 为输的机率,故 p+q=1)。依此推导可得在第 n 列中,甲赢了 n+1 次,而输了 n-1 次,并且有 2n-1 种可能性,所以其机率为 2n-1pn+1qn-1。因此可得在整个赛局中,甲赢的机率为
! B7 V6 u6 B$ R6 y$ R
: g% k7 q% b+ |3 t b! U
, }5 c2 @5 K6 t
- j0 O+ Z5 J( _: U
6 w# z# p- j1 t
0 E0 @7 S6 w' `0 g0 Z& w
7 a0 J; w, R7 [% Y: L
4 m: u% z; W3 V! v( H/ z4 [! }
% ^& ~9 S! D8 q Q
* p- @! C6 f- B% }. d
- E) s. Y: h; \, z
现在让我们考虑输不起型下注法。此时只有在下列诸场合,甲才会赢。
+ S$ y) P# E* {1 u7 W$ r# Z2 @
) f3 Q, Q, E7 _0 Q
++,+-+,
; ^1 E9 G; Z1 q5 t
-+++,-++-+,(注意:甲第二次仅能下注 1 元)
& j( y; j+ a+ f b J( |8 E( H
-+-+++,-+-++-+,
+ r8 g0 [2 r6 J+ \9 N
5 c, u- p. H; l P# P! N
, ,
/ T% W7 S: t6 x+ Q8 U
。
; s4 |6 ^5 N Q4 A, ~
" e( F) @* N6 m9 V! c( r- I
仿上之计算,可得此时甲赢的机率为
8 D' v7 R' T$ J
7 k ?' [* u) I& Y) h: q
, ^* _: i$ S3 b9 P2 G$ g7 x
% `9 K4 _0 W2 y$ N& w& `$ ]* X
; B8 _2 ~4 Y) w* F j& ?$ Y$ K
) P2 K! X/ ~5 I( U2 o
' _- Z- N, U* F0 m
/ H4 y" q& Z$ i+ c
( k" o) |! h* a1 H# a) i1 j7 `9 C3 V
最后设某甲採极端法,则甲第一次即下注2元,因此一次就决定了输赢,所以甲赢的机率为 p 。
. ~) B4 Z9 ^. W/ ]
; K% z( F1 q1 s- C
现在我们再回到原问题:究竟在这三种方法中,以那种方法最好?由于相对应赢的机率公式已求得,所以我们只需将 p 值代入,进而比较其大小即可,举例来说,当 时,三者之值皆为 ;而当 时,三者之值依序为 、、;至于当 时,则其值依序为 、、。这些数值告诉我们,当 时,三种下注法没影响甲赢的机会;当 时,则以保守法较好;当 时,却以极端法最佳,保守法最差。
" s: o) L1 `+ R1 E/ i
: ?8 B. o4 W' V0 x
这些结论,是不是有些出你意料呢?其实问题还没全部解决,迄今我们仅就保守、输不起、极端三型来作比较。是否尚有其他型的下注法会使得答案更好?还有,我们仅就特例来考虑,在一般的情形下,答案又是怎样呢?
: S# [9 ]% g" e6 H7 t* G6 a& U! R
e) f" ]! R1 y! }) [# a
现在,先把最一般性的结果写在下面,其中 代表当甲有 i 元时会赢的机率。
2 T" b& ^) v% v
, D( u7 T* Q+ @3 t* A; [. L4 b
" N7 s1 n2 l3 @6 V( `, G" t5 _: i
情况一:
1 W7 m9 _, v) w& E3 _1 ?
此时不论甲如何下注, 恒等于 c/(m+c)。
% v7 n. Y- L( \" Y- I
* O1 W+ x5 u% X% G1 r
情况二:
7 b" S% ~7 S4 [# v
此时不论甲如何下注, ,而右端为保守型下注法赢的机率。因此,在此情况以保守型的下注法为最稳当。另一方面,极端下注法的赢面最低。
& v& A% Z: z; X3 D
# d3 k0 t" |2 X: {4 \
情况三:
, ?+ n8 T. I. ^' l
此时以极端法最佳,保守法最差。同样地,保守型下注法赢的机率为 。
& d8 h3 ~+ H+ I! F% U7 `* I8 q
1 w4 m4 K. t5 F4 o$ g1 W1 K M
现在我们就来研究,为什么会有这个结论!这用到了一些数学工具,不过对其中较复杂的部分,因顾及本文的可读性,笔者只很扼要的叙述一下。
) D+ e" Q+ q% Z2 S6 U
+ J2 n0 Y# t c- q' i% \: |5 P
由于在上面的结论里,保守法处于一个居中的地位,所以我们先就此法进行讨论,然后再进一步研究整个问题。
" i) S" c! p: V- F# w
( C9 M. f! Q1 ~& c. j: r/ U
如同以前, 代表当甲所拥有的资本达 i 元时,他会赢的机率。由于甲及庄家的总资本额为 m+c 元,所以 i 之可能值为 i = 0, 1, …, m + c。显然地,,,而 为我们最早所想求得之机率。
9 Y8 r& B. l0 f9 R0 k
" O: k; X, Q$ \: M0 w! C
) }8 Y: G% X5 Y9 I, T8 J
情况一:
2 Z4 {3 m' u" u. m8 X7 K
假定某甲现有 i 元,那么有 的机会,他的资本会成为 i+1 或 i-1 元。因此
" X1 H& R& B' H) }7 \# h
& Q2 w6 S0 i) z: @8 X1 W% A* J% e) A: o
) V5 @) p5 p2 I3 n1 i; s
- s* |. C2 F& X) F& d4 P
9 Q# I: u9 y' f# L
4 S. j# l8 z7 v/ b( c' `
5 `3 u8 D! o+ K8 E' ~# w _
这样的函数 ν,在数学上是一个线性函数,因此解的通式为 。由于,、,得 a=0、 。因此 ,亦即甲的赢面为 c/(m+c)。
. @( H) n( ?. Z4 G! i
" b/ Q5 d* }/ _
情况二:
L4 l4 T$ B% |/ Y6 s5 Z2 {
令 q=1-p。此时对 ν 我们有方程式
( j8 X. l% D; }
; s* m9 `! [2 ]9 Q o
! M6 o* h5 r. L9 t/ }$ f: E, L' |
( |$ T& }8 e8 L. Y6 B
# p7 t8 _# Z; R3 W1 i- q8 q; z9 ?
6 p+ h" i9 `7 p; X8 g' S: p
{8 f$ e! s7 }' @: l3 s8 l& F6 a
这样的一组方程式,在数学上称作是差分方程式。它也有一个求解的一般方法,但其道理较深。为此之故,我们特採用下面的方法。
8 }. e9 Z K5 P6 b5 h5 z
利用p+q=1,上组方程式可改写为
4 `- t2 s7 p; L# ? n
9 z3 ]' ~. V2 `) u, a& I$ W, T
2 D9 E3 j0 w* O8 H* H0 W
" h* v# i. I: Q6 ]
% a# \* L J N: C4 J" V4 x
' m- Y% ?& p* q# J$ _& K
c, A& K3 a: I# X, G) e
两边相加,并利用 、,得
* w4 z* i; h4 u) a1 _5 B
- C0 Y* N+ p2 t; f9 A) k$ ~7 v. D
: }- \4 Q' K" [
4 Q3 v `) _2 U7 G/ f
* J3 `/ q+ }6 h: E$ w2 o
% y- i/ v3 [$ a# w4 O& q
) `& |) M" F' m
若取前 c 项相加,则得
' e, R8 y! O2 D/ L$ o
& o, [. @4 W8 N
- t/ T* S4 s; I. |5 F E7 C
( j& f) \* C+ z3 E- ^
* I2 ], X. M, l! v, g
( P* W3 }6 C8 m
* H. G0 z! T! }; {7 f0 U
情况三:
3 M% T/ N7 d* r, Q6 A' ]
仿二之解法,可求得
1 Z) l5 d( i" e" G
4 g( p/ l4 N4 S2 E
. U# e0 q3 i1 l9 C
* `/ C& O+ h$ e5 G
& ~# O- C3 c; X; S9 u; [
8 @# v) z' k% g3 R
% b C9 q/ J- j. d$ J$ t
& g: N( V; k/ \/ o0 @3 A
保守法的 已求得,现在我们来研究为什么在情况二时,以保守下注法的 为最大;而在情况三时,反以保守下注法的 为最小;同时另一方面,在情况二时,则无论何种下注法, 皆一样。
4 B6 D2 \" Q; m. b8 @- x( W$ j
) @9 A6 J5 v0 \ E
首先我们引进一个定理。令 Sn 代表在第 n 次赛局时,甲所拥有之资本额,因此 Sn 是一个随机变数。我们并设 S0=c,即原资本。令 N 表结束赛局所需之时间,因此 SN=0 或 c+m。我们并以 E 表期望值。
% _) W# P# h" G" K5 I5 T
8 i3 g) X5 C/ O8 }
. V( I) p' D% I4 a8 A% N$ r
定理:
. z% e) c* d) \( C6 T1 F; T& t
设 f 为一定义于 Sn 上之有界函数。若在 Sn 之条件下,f(Sn+1) 之期望值 E[f(Sn+1)] = f(Sn),则 E[f(SN)] = f(S0) = f(c)。若将「=」改为「」,则结论亦真。
* M! E7 `4 s! T3 O/ D1 @
此定理在机率学上,即着名的选择样本定理 (optional sampling theorem),它的证明已超过本刊程度,所以略去不证,但它的直观意义却不难了解。就拿「=」的情形来说,其实是说若你的第 n+1 次赛局,平均而言并不能改变在第 n 次赛局时 f 之值,则当整个赛局结束时,f 的平均值也与原先值一样。另一方面,若在「」的情况,亦即你的第 n+1 次赛局平均而言会改进 f 先前之值,则当赛局结束时,f 的平均值也曾比原先值为佳。
2 H" I) n* `! k$ C' p
- N4 j: B8 Y( t, v
现在我们就拿这定理来证明先前我们所下之结论。
; Y" V# T' l* N; f% U
" X* C' T% N+ r0 [- \
首先,我们考虑情况一。此时取 f(Sn)=Sn,则不论对何种下注法,因胜负机会均等, ,所以若给定 Sn,则 ESn+1 = Sn。因此由上定理知 ESN = c。但 = ,所以知不论以何种方法, 。
O1 _# r4 J: G+ d+ o
1 u( P2 e/ r* R; X- z1 q
至于在情况二或三时,我们取 。此时若给定 Sn,则
; ^, \5 t s0 Z8 r# v
* q' s" M6 B8 Y
" R2 ~6 j2 ^* F ~8 A0 `
' S, E- Z" P( Q: [( }
( D2 ~( r; O9 R9 N7 ^* G
* _0 P' `# w$ R* `* z7 u- t0 z
0 O( d2 \4 L. F1 ^9 p$ E
" ~; ^* e7 u0 W. Y
, P0 }6 E5 t( T/ P* `# C
其中 为所下注之金额。利用
3 |5 b3 b$ o8 ^- B% E8 P
4 i7 F. [! B4 y+ P, e2 l
; _9 k6 q7 S9 O2 l7 ^
7 z7 g* m) r( d+ M2 q* _4 Q3 C
4 h5 Z; c2 w% E' g
: ~: b" g9 d0 c+ m
' L( J. w# N$ n0 v; E4 ]; `
. z' X! ~/ ]; d" k
8 M4 U1 u- x: p) e7 j
可得不论以何种下注法下注,若给定 Sn,则 。所以由定理知 。但
0 m) b! E! B: M5 t. F0 @8 u6 F
$ f* [1 _5 g2 [; Z1 Q
1 \8 p- ~. ~+ r- _
/ {, h- b) c: I
. s- u8 y8 r4 e% _# C1 e; H
9 w) S' G; Q4 \: J
3 U( T9 W! N7 V8 H% o2 ^
; \; L* L$ a9 w2 L* O
9 H* D6 {2 v% q6 w
因此可得在情况二, 时,
- I8 B& ^) j* o
$ I9 i! I/ v) Y5 S7 A
: Z# T% f0 N3 }5 ]" ]
; O- N( x" m2 |( R
$ Z' ^* d. _" m; S. X8 r8 N, g# X
+ o4 q( s0 Y7 z+ k7 z; Q+ p; ~
4 F8 }( b9 t; q# m- z/ _) }
4 g& A _8 x& G k& i
5 s9 o4 V Q4 r/ f
而在情况三, 时,
6 b: F* L J5 u/ J. z9 C
0 d6 A1 K! A+ z9 U
5 h1 z$ d% m# O8 f0 }) d) z. v; l1 u9 p
1 A# q+ j F# F3 e, D7 Y' e
( i- U9 s# z) y' a4 k
8 V" G) N& L! r
$ a: r; v/ ?* n- a
f& l m2 ~# j. W/ @
( D5 B+ i6 y" ]! r6 O2 i! v/ c1 R
但 为採用保守下注法时赢的机率,所以知在情况二时,以保守法的 为最大;但在情况三时,却以保守法的 为最小。
& L) j5 U B$ [6 K$ C
+ i' u9 K" x( Z. K: g# Z% g/ H( V
至于为什么在情况二时,以极端法的赢面为最低;但在情况三时,却以极端法的赢面为最大。这其中又牵涉到更深的理论,只好从略了。
8 f( s2 ^! }$ b2 |. J G/ ~
6 D; z# y/ k$ D9 H8 h) p
附录
/ e; Y/ g$ |2 [ L$ c
5 @' b2 p+ g6 Z: b
, O6 b0 f- i) T' X" }; A; d. U% f
在本文中,我们仅讨论如何使甲赢的机会为最大。但亦有一些其它有趣的问题,比如说,我们或者也想知道欲使整个赛局结束所需的时间的平均值 T(亦即期望值)。关于这个问题,我们有如下的答案:保守下注法的 T 为最大,其值当 时为 T=cm,当 时为
, V" u; C. P+ V; C0 l
# Z! C. m5 L; f2 W$ M
' y( A4 g4 p S8 N% t7 |
& @4 ?6 J& X* b; B
- N; f4 o! y: O
& Q% B. c2 G2 b* O* G8 k
0 a2 h; Z6 L7 J* `' y! q$ h
9 w( k$ B' A/ m
" `3 E$ x/ t& u# a
另一方面,极端下注法的 T 为最小(但无统一公式)。至于其推导过程,与正文中所用的方法类似,只是演算步骤复杂多了,所以从略。
作者:
爱拼猎人
时间:
2010-12-4 15:13
太长篇了,而且非常的深奥,希望有玩家能看的明白。
作者:
tb35891
时间:
2010-12-4 16:55
好文章,学习了.
作者:
tb35891
时间:
2010-12-5 20:28
又来看了,还是没有看明白,不知楼主有没有看懂了.
作者:
牛二哥
时间:
2010-12-5 23:11
我也来学习下
作者:
ck6767
时间:
2010-12-6 09:46
太深奥了!!!!!!!!!!
欢迎光临 优惠论坛 (http://www.tcelue.ws/)
Powered by Discuz! X3.1