亚洲欧美日韩在线线精品,最新69成人精品毛片,久久欧美精品1024你懂得

前言：想要寫出一篇令人眼前一亮的文章嗎？我們特意為您整理了5篇標準式博弈的混合戰略范文，相信會為您的寫作帶來幫助，發現更多的寫作思路和靈感。

標準式博弈的混合戰略

標準式博弈的混合戰略范文第1篇

關鍵詞：納稅遵從；稅收管理；博弈

一、引言

納稅遵從，是指納稅人遵照稅法及稅收政策，向國家正確計算繳納應繳納的各項稅收，并服從稅務部門及稅務執法人員符合法律規范的管理行為。納稅遵從反映了稅收征管的質量和效率，是稅收征管的最終目標。稅收管理與納稅遵從是稅收征管最本質、最核心的兩大因素，在稅收征管現代化的進程中，由于征納雙方各自利益最大化的差異性，再加上雙方信息不對稱等因素的長期客觀存在，納稅遵從與稅收管理兩者博弈是一個永恒的話題。經濟決定稅源，但稅源不等于稅收，在稅源一定、稅法不變的前提下，稅源轉化為稅收的多少主要取決于征管能力和水平的高低，而稅收征管水平和納稅主體遵從程度是緊密聯系的。

二、納稅遵從與稅收管理博弈分析

在傳統的納稅遵從經濟學分析中，逃稅問題通常被視為一種資產組合選擇：申報的收入被看作是一種零回報的安全性資產，而隱瞞的收入則被看作是一種有回報的風險性資產。假定納稅人和稅務機關的目標都是追求預期收益的最大化，納稅人所選擇的遵從形式是向稅務機關如實申報應稅收入，所選擇的不遵從形式是故意低報應稅收入。故意低報收入被查獲后不僅要補稅，而且要受到處罰。為了便于分析，還假定稅收管理便捷、高效，因而納稅人的遵從成本很小，可以忽略不計；稅務機關的檢查能力足夠強，并且高度廉潔，依法治稅，因而違法的納稅人不可能通過賄賂等手段使稅務執法人員徇私舞弊。根據博弈論原理，可構建稅務機關和納稅人的博弈模型，列出對應于不同策略組合的效用矩陣。

1、博弈模型基本假設。設納稅人的實際應稅收入為i，向稅務機關申報的應稅收入為d（d小于或等于i），適用比例稅率t（t1），納稅人的逃稅概率為r，稅務機關的查獲概率或者逃稅被查獲的概率為p（0t），稅務機關的檢查成本為c，納稅人的預期收益以其稅后凈收入（或者稅后可支配收入）來表示。首先來看納稅人的預期凈收益。在欺騙稅務機關的情況下，如果未受到查處，其預期收益為i-td；如果受到查處，其預期收益為（1-t）i-ft（i-d），而納稅人在誠實申報的情況下，不管是否受到檢查，其預期收益均為（1-t）i（不考慮納稅人受到檢查時的遵從成本）；再看稅務機關的預期收益，在納稅人逃稅的情況下，檢查與不檢查的預期收益分別為ti+ft（i-d）-c和td；在納稅人不逃稅的情況下，檢查與不檢查的預期收益分別為ti-c和ti。

2、混合戰略納什均衡。根據雙方博弈的假設條件，得到征納博弈的收益矩陣，如表1所示。（表1）

在征納博弈中，參與者所選擇的戰略既可能是純戰略，也可能是混合戰略。在純戰略選擇的情況下，由于檢查概率和逃稅概率要么為0，要么為1，因而征納雙方的博弈不存在均衡解。現在分析博弈雙方選擇混合戰略情況下的均衡問題，即參與人以某種概率分布隨機選擇不同行動達到的均衡狀態。對納稅人和稅務機關而言，選擇混合戰略就是分別選擇一定概率的遵從或者不遵從和一定概率的檢查或者不檢查，也就是說檢查概率p和逃稅概率r都不等于0。當納稅人在欺騙與不欺騙情況下所獲得的預期收益相等，并且稅務機關在檢查與不檢查情況下所獲得的預期收益也相等時，兩者間的博弈就達到了一種混合戰略納什均衡，可以求出兩者間的均衡解。

（1）檢查概率的均衡解。給定檢查概率p，納稅人選擇逃稅和不逃稅時預期收益分別為：

選擇逃稅時的預期收益：

g1=［（1-t）i-ft（i-d）］p+（i-td）（1-p）

選擇誠實納稅時的預期收益：

g2=（1-t）ip+（1-t）（1-p）

令g1=g2，解得p=1/（f+l）

（2）逃稅概率的均衡解。給定納稅人的逃稅概率r，稅務機關選擇檢查與不檢查的預期收益分別為：

選擇檢查時的預期收益：

r1=［ti+ft（i-d）-c］r+（ti-c）（1-r）

選擇不檢查時的預期收益：

r2=trd+ti（1-r）

令r1=r2，解得r=c/t（f+l）（i-d）

根據求解結果可知，當稅務機關以p=1/（f+l）的概率進行檢查，納稅人以r=c/t（f+l）（i-d）的概率逃稅時，征納雙方的博弈達到均衡狀態。這一均衡解意味著，逃稅程度隨著稅務檢查的邊際成本的提高而提高，隨著處罰率的提高而降低。

3、博弈均衡的啟示。首先，稅收管理廣度與納稅遵從度具有相關性，稅務機關檢查的概率越大，納稅人偷逃稅的機會成本就越大，相對來說納稅遵從度越高；其次，稅收管理深度與納稅遵從度有很大的相關性，查獲率與偷稅概率成反比；再次，處罰力度越大，違法風險越大，違法成本越高，納稅遵從度越高。在適度管理中，管理與遵從呈正比關系，在過度管理或管理不到位情況下，管理與遵從則呈反比關系。要在征納博弈中取得最佳效果，必須正確把握管理與遵從的閥值，也就是博弈均衡點，使之從強制型遵從向自覺型遵從轉變。

三、納稅遵從影響因素具體分析

征納博弈的結果就是能夠達成征納雙方都接受的一種均衡，但在現實中，納稅人對稅務部門的行為、信息了解得比較清楚，而稅務部門對納稅人的信息了解得相對不夠，這種信息的不對稱，使得納稅人有機可乘。有研究數據顯示，在我國現有納稅人中，40%的納稅人自覺遵從稅法，30%的納稅人通過輔導遵從稅法，還有30%的納稅人遵從度不高。應當說，這一遵從度與發達國家相比差距不小，造成這一狀況的因素主要有以下幾個方面：

1、稅收管理因素。在管理措施上，主要表現在征管力量分布不均，稅源管理比較薄弱，征管力度不夠，導致偷逃稅成為部分納稅人經常使用的小伎倆，初犯轉變成慣犯，形成心理適應。同時，影響原本具有良好稅收遵從意識的納稅人，造成其心理失衡，從納稅遵從轉變不遵從，形成惡性循環；在管理手段上，稽查查獲率與涉案定罪率偏低，處罰率低。在現實征管中絕大部分都取最低限處罰，沒有根據偷稅性質、情節、數額大小等標準進行處罰，這對少數存在僥幸心理不依法納稅的企業，根本起不到震懾作用。

2、納稅遵從成本因素。納稅人遵從成本高而不遵從成本低是重要原因。征管業務流程較為繁瑣，納稅人面對兩稅務征管機構，使遵從成本偏高。而納稅人不遵從成本較低，對不遵從稅法所受到的處罰偏輕和罰款數量規定上的彈性安排，加之稅管人員的主觀隨意性，使納稅人的不遵從成本微乎其微，在一定程度上助長了納稅不遵從的主觀故意。

3、法制因素。稅收法律環境是規范征納關系的剛性環境，能促使稅務機關依法治稅，納稅人依法納稅，而我國還沒形成良好的法律環境，表現為：稅收法律制度不夠健全和完備，這給了納稅人鉆法律空子的機會，引發了懶惰性不遵從行為；稅收執法程序不規范，稅收執法手段軟化，納稅人逃稅成本小于遵從成本；稅收司法保障體系不健全，納稅人偷漏稅的僥幸心理增強。

四、基于稅收管理影響提升納稅遵從的建議

盡管納稅遵從受到法律制度等客觀因素的影響，但稅務機關與納稅人的博弈分析告訴我們，優化稅收管理能夠有效提升納稅人的遵從度。理解稅法是遵從的基礎，降低辦稅難度是遵從的保障，而嚴厲打擊不遵從則是對遵從的最好鼓勵。

1、樹立“人性化”征管理念，提供“專業化”稅務咨詢。提高納稅遵從首先要從稅務人員理念的轉變上著手，要建立有效的納稅人訴求和反饋機制，充分傾聽并汲取納稅人的意見，以“更容易、更節省、更人性化”為核心制定遵從規劃。要從方便納稅人辦稅而不是從方便內部管理出發來設計征管流程和相關信息系統。要本著公開、負責的態度與納稅人交流潛在的不遵從風險并指導其主動糾正，而不是利用信息不對稱保持手中權力的神秘感。其次，稅務部門應根據納稅人個體情況，從復雜的稅法體系中梳理出適合的部分，提供“個性化、專業化、人性化”的輔導，并加強后續的跟蹤管理。

2、開展流程再造，降低辦稅難度。辦稅流程越復雜，納稅人承擔的時間成本、貨幣成本、心理成本等遵從成本就越高，納稅人遵從度也越低。因此，我們需要以納稅人為中心開展流程再造，簡化納稅程序，統一報表資料報送要求，實現納稅人一次提交資料，后臺信息共享。要加強業務部門之間的統籌，避免各業務部門與同一納稅人多點接觸，多頭管理，讓納稅人在設定的辦稅流程中以較低的成本獲得較優質的服務。要加強征管手段的信息化建設，擴大網上申報的稅種，擴充申報表填寫引導、自動計算、自動等功能。此外，應盡快完善信譽等級管理，通過為誠信納稅人提供“綠色通道”以顯示對稅收遵從者的鼓勵。

3、加大查處力度，增強稅法威懾力。納稅人受不完全信息和認知能力的限制，對一項稅收不遵從行為將面臨多大風險是無法完全準確判斷的。如果納稅人能高估違法受罰的風險，那么其從事不遵從行為的風險愛好動機將減弱。這種高估，一方面取決于法定的處罰標準；另一方面根據其他違法納稅人實際受到的處罰程度來定，特別是在法定處罰標準彈性比較大的情況下更是如此。因而，要加強對故意不遵從的打擊，對輕微的涉稅犯罪，也不輕易放過，增大稅收不遵從壓力，使納稅人內化稅收威懾。

主要參考文獻：

[1]劉振彪.我國稅收遵從影響因素的實證分析[j].財經理論與實踐，2010.5.

標準式博弈的混合戰略范文第2篇

關鍵詞:農產品;質量安全;檢測;博弈

中圖分類號:F304.3 文獻標志碼:A 文章編號:1673-291X(2010)05-0246-03

經過三十年的改革開放,農產品領域的問題已由農產品短缺之憂轉向了農產品安全之虞,并且這種現象會由于中國農產品生產經營者的眾多且小而分散、經營主體的社會責任感缺失、監管機制及法律法規的不完善而難以在短期內根治。而解除農產品安全之虞事關社會和諧,政府部門應符合大眾的要求,提升農產品安全的監管水平和監管效能。然而近年來,國內食品安全事件頻發,如2006年6月的“福壽螺”事件、2006年9月上海發生的疑似散發性“瘦肉精”中毒事件、2006年末上海的“多寶魚”藥物殘留嚴重超標事件、河北紅心鴨蛋含“蘇丹紅四號”事件、2008年9月河北的“三鹿奶粉”事件,更是讓世界對中國的農產品質量和安全產生了擔憂;還有木耳用硫磺熏制、腌熏食物有防腐劑、蔬菜農藥殘留等各種農產品質量安全問題屢禁不止等等,農產品質量安全問題已成為社會關注的熱點和焦點。那么,在國內農產品安全堪憂、監管體制沉疴難除、民眾呼聲日益高漲的情況下,如何有效地激勵農產品生產者(企業)按照無公害農產品質量標準組織生產,提高農產品質量,是擺在我們面前一項亟待解決的重大課題。

出于問題本身的現實和理論價值,本文通過建立一個完全信息靜態博弈模型,對農產品質檢中心與農產品生產者的博弈進行分析,以期為政府加強生產環節的農產品質量安全管理提供一定的決策依據。

一、一個完全信息靜態博弈模型的設定

按照信息經濟學對市場商品特性的劃分,可以將農產品的質量信息劃分為搜尋品特性信息、經驗品特性信息和信任品特性信息。在信息經濟學的分析框架下,對搜尋品、經驗品和信任品的質量甄別與信息利用方式是不同的(Nelson,1970;Darby & Karni,1973)。農產品的搜尋品特性,主要是指消費者在消費前就可以憑感官直接了解的特征,消費者辨識質量不存在障礙,信息搜尋成本極低,如農產品品牌、標簽、價格、產地等外在特征以及農產品的顏色、光澤、大小、新鮮程度、形狀等表面特征。農產品的經驗品特性,無法在事前做出評價,主要是指消費者在消費后才能夠了解的內在特征,如口感、味道等。農產品的信任品特性,主要是指即使消費之后也沒有能力了解的有關安全和營養水平等方面的特征,如農產品的激素、抗生素、膽固醇、細菌含量和農藥殘留量、是否含轉基因成分以及營養成分含量等。既不能由肉眼觀測,也無法依靠消費體驗在短期內確認其質量狀況,對它的質量甄別需要特定的知識或檢測手段。鑒于農產品質量難以辨別的特性,農產品質量安全檢測便成為確保農產品質量安全的重要環節,因此,本文以農產品質量安全檢測為切入點,設定如下模型。

在模型中,假設博弈的參與人包括農產品質檢中心和農產品生產者(企業)兩個參與人,兩者均為理性人,信息是完美的,參與人的行動是可以觀測到的。根據所分析問題的需要,本文把農產品質檢中心標準化為一個行為人。農產品質檢中心的純戰略選擇是檢查或不檢查。同時,本文也把農產品生產者標準化為一個人。農產品生產者的純戰略選擇是生產質量安全的農產品或質量非安全的農產品。表1概況了對應不同純戰略組合的支付矩陣。這里,α是檢測成本,R是生產質量安全的農產品的生產者(企業)的正常利潤,F是對生產質量非安全的農產品的生產者(企業)的罰款,C是生產質量非安全農產品的成本;R'是生產質量非安全的農產品的生產者(企業)的利潤。如果農產品質檢中心檢驗農產品生產者(企業)生產的農產品是安全的,他的農產品將被允許銷售,將獲得正常利潤R,如果農產品質檢中心檢驗農產品生產者(企業)生產的農產品是非安全的,他的農產品將被銷毀,不僅投入的成本C不能收回,還要被罰款F。如果農產品質檢中心不檢查,質量安全的農產品與質量非安全的農產品都被允許銷售,因為生產質量非安全農產品的成本要小于生產質量安全農產品的成本,所以在農產品價格P一定的情況下,生產質量非安全的農產品的生產者(企業)的利潤R'要大于生產質量安全的農產品的生產者(企業)的正常利潤R。本文假定α

二、農產品質量安全檢測博弈過程和均衡分析

該博弈為完全信息靜態博弈,找到混合戰略納什均衡點是問題的關鍵。

本文用θ代表農產品質檢中心檢測農產品的概率,γ代表農產品生產者(企業)生產質量安全農產品的概率。給定γ,農產品質檢中心選擇檢查(θ=1)和不檢查(θ=0)的期望收益分別為:

πG,(1,γ)=-αγ+(-α+F)(1-γ)=F-α-Fγ

πG,(0,γ)=0γ+0(1-γ)=0

解πG,(1,γ)=πG,(0,γ) ,

即:F-α-Fγ=0

得:γ*= 。

所以,如果農產品生產者(企業)生產質量安全農產品的概率小于γ*=,農產品質檢中心的最優選擇是檢查;如果農產品生產者(企業)生產質量安全農產品的概率大于γ*=,農產品質檢中心的最優選擇是不檢查;如果農產品生產者(企業)生產質量安全農產品的概率等于γ*=,農產品質檢中心隨機的選擇檢查或不檢查。

給定 ,農產品生產者(企業)選擇生產質量安全農產品(γ=1)和生產質量非安全農產品( γ=0)的期望收益分別為:

πp,(0,1)=Rθ+R(1-θ)=R

πp,(θ,0)=(-C-F)θ+R'(1-θ)=R'-(C+F+R')θ

解πp,(0,1)=πp,(θ,0),

即R=R'-(C+F+R')θ

得:θ*=。

所以:如果農產品質檢中心檢測農產品的概率小于θ*=,農產品生產者(企業)的最優選擇是生產質量非安全的農產品;如果農產品質檢中心檢測農產品的概率大于θ*=,農產品生產者(企業)的最優選擇是生產質量安全的農產品;如果農產品質檢中心檢測農產品的概率等于θ*=,農產品生產者(企業)隨機的選擇生產質量安全的農產品或非安全的農產品。

因此,混合戰略均衡是:

θ*=,γ*=,

即農產品質檢中心以θ*=的概率檢測農產品,農產品生產者(企業)以γ*=的概率生產質量安全的農產品。這種均衡的另一種可能的解釋是,農業生產中的眾多的農產品生產者(企業),其中有γ*=比例的生產者(企業)選擇生產質量安全的農產品,有1-比例的農產品生產者(企業)選擇生產質量非安全的農產品;農產品質檢中心隨機的檢測θ*=比例的農產品生產者(企業)的生產情況。

三、結論及對策建議

通過農產品質檢中心與農產品生產者的博弈分析,本文得出結論:混合戰略納什均衡,

θ*=,γ*=,

即農產品質檢中心檢測農產品的概率是θ*=,農產品生產者(企業)以γ*=的概率生產質量安全的農產品。因此,為了提高農產品生產者(企業)生產質量安全農產品的概率γ*=,降低農產品質檢中心檢測農產品的概率θ*=,本文具體提出以下對策建議:

(一)適當提高對生產質量非安全的農產品的生產者(企業)的罰款

因為增大F在提高農產品生產者(企業)生產質量安全農產品的概率γ*的同時,降低了農產品質檢中心檢測農產品的概率θ*,例如,假設農產品的價格為P,生產質量安全農產品的生產成本為2C,生產質量非安全農產品的生產成本為C,生產質量安全農產品的利潤率為20%,則生產質量安全的農產品的生產者(企業)的正常利潤R=2C×20%=0.4C,農產品的價格為P=2+0.4C=2.4C,生產質量非安全的農產品的生產者(企業)的利潤R'=2.4C-1C=1.4C。假設檢測成本α=0.5C,對生產質量非安全的農產品的生產者(企業)的罰款F=2C和3C,γ*分別為:

γ1*===,

γ2*===,

顯然γ1*

同理,θ*分別為:

θ1*===,

θ2*===,

顯然θ1*>θ2*,即在其他條件不變的情況下,通過提高對生產質量非安全的農產品的生產者(企業)的罰款F,有效地降低了農產品質檢中心檢測農產品的概率θ*,從而降低了監管成本。

(二)開展檢測技術研究,加強對國外先進檢測技術和方法的引進和創新,努力降低農產品檢測成本α

因為檢測成本α的減小,可以使農產品生產者(企業)生產質量安全農產品的概率γ*提高。例如,假設農產品的價格為P,生產質量安全農產品的生產成本為2C,生產質量非安全農產品的生產成本為C,假設對生產質量非安全的農產品的生產者(企業)的罰款F=2C,檢測成本α=0.5C和α=0.25C,γ*分別為:

γ1*===,

γ2*===,

顯然γ1*>γ2*,即在其他條件不變的情況下,通過降低農產品檢測成本α,有效的提高農產品生產者(企業)生產質量安全農產品的概率γ*。

(三)建立國家農產品質量例行監測制度

通過建立和實施農產品質量例行監測制度,既有效地發揮了政府的監管作用,增加了生產質量非安全農產品的生產成本為C,又縮小了生產質量非安全的農產品的生產者(企業)的利R'與生產質量安全的農產品的生產者(企業)的正常利潤R之間的差距,從而降低了農產品質檢中心檢測農產品的概率θ*。例如,假設農產品的價格為P,生產質量安全農產品的生產成本為2C,生產質量安全農產品的利潤率為20%,則生產質量安全的農產品的生產者(企業)的正常利潤R=0.4C,農產品的價格為P=2.4C,如果生產質量非安全農產品的生產成本為C和1.5C,生產質量非安全的農產品的生產者(企業)的利潤R1'=2.4C-1C=1.4C和R2'=2.4C-1.5C=0.9C。對生產質量非安全的農產品的生產者(企業)的罰款F=2C,θ*分別為:

θ1*===,

θ2*===,

顯然θ1*>θ2*,即在其他條件不變的情況下,通過增加生產質量非安全農產品的生產成本為C,縮小生產質量非安全的農產品的生產者(企業)的利潤R'與生產質量安全的農產品的生產者(企業)的正常利潤R之間的差距,有效地降低了農產品質檢中心檢測農產品的概率θ*,從而降低了監管成本。

參考文獻:

[1] 張維迎.博弈論與信息經濟學[M].上海:上海人民出版社,1996.

[2] 邢衛鋒.影響農戶采納無公害蔬菜生產技術的因素及采納行為研究[D].中國農業大學,2004.

標準式博弈的混合戰略范文第3篇

[關鍵詞] 會計委派制博弈囚徒困境制度

在市場經濟體制的逐步建立和完善過程中,我國現行的會計人員管理體制存在很大弊端,主要表現為:會計職能弱化、會計缺乏監督力、會計信息嚴重失真、會計工作秩序混亂、違法現象不斷發生等,一些企業以虛假的會計信息來達到其非法獲利的目的,使會計誠信遭受到嚴重的踐踏。為了防止會計信息失真,加強企業會計誠信建設,會計委派制應運而生。在大型企業內部,母公司對各子公司、二級單位的財務管理,大都實行會計委派制。其目的都是旨在通過加強對會計人員的管理整頓和規范會計工作秩序,加強會計監督,防止會計信息失真,維護財經紀律。

一、會計委派制的涵義

會計委派制是指由資產所有者向其所屬的企業、事業統一委派會計人員,并對其所委派會計人員的任免、調動、考核、獎懲、工資和福利待遇等,進行集中統一管理的一種會計管理制度。其主要特點是企業的主要會計人員由政府或企業所有者委派,經營者不得干涉委派會計人員的工作。

二、會計委派制存在的問題

在我國,企業會計信息失真現象十分嚴重。有的學者認為是會計監督不力,并提出了“會計委派制”的對策。實行會計人員委派制,降低了受派單位負責人對會計人員的約束控制,使會計人員敢于進行會計監督,割斷了會計人員與受派單位經濟利益關聯,降低了會計人員成為“內部人”的可能,從而加強了會計人員進行監督的意愿。然而,會計委派制在具體地實施過程中還存在著許多不足與問題,其作用只是停留在形式上, 實際效果并不突出。會計委派制作為一種過渡性制度安排,不可避免地具有以下主要缺陷:

1.會計委派與現代企業制度相背離

建立現代企業制度是企業改革的方向,現代企業制度的一個主要內容就是政企分開,要求政府部門為企業提出供一個寬松的經營環境。企業是市場的主體,應該有自主的經營權,當然也應有會計人員的任命權。而會計委派制將會計人員的任命權集中在上級手中,不利于政企分開,不利于現代企業制度的建立,勢必會拖企業改革的后腿。

2.與當前一些法律法規相矛盾

《會計法》規定,單位負責人對本單位的會計工作和會計資料的真實性、完整性負責,單位其他人員對單位負責人負責的立法基本精神。這就賦予了單位負責人不可推卸的責任。但如果他無法管理單位會計人員卻要其承擔責任,顯然有失公平。同時,《公司法》規定:公司財務負責人由經理提名,董事會聘任或解聘。而委派制的實施導致責任主體權利得不到實現,兩種監管制度相互沖突。會計委派制沒有法律法規來規范對委派會計人員的管理。

3.經營者與會計人員的責、權、利分配不均衡

會計人員同時接受上級和經營者的雙重領導,與現代企業管理原則不符,會計人員必將處于兩難境地。從經營者角度講,由于利益驅動, 經營者往往會追求自身利益最大化, 從而將委派的會計人員擺在企業的對立面而將其架空, 使得會計人員雖有監督頭銜卻基本喪失了行使監督的權力。從會計人員角度講,從表面上看,委派的會計人員是作為所有者的代表,以獨立于經營者的身份參與企業經營活動,擁有相當大的權利和責任。而實際上在企業內部,會計人員的地位永遠是個配角,這種雙方權力上的失衡加上企業內部制約機制的弱化,根本無法制約經營者的行為。

4.會計委派制不利于充分發揮會計的職能

會計的職能有核算、監督、管理、服務等,而會計委派制使委派的會計人員與企業格格不入,只強調會計的監督,弱化了會計的管理、決策服務職能,使會計這一領導的參謀沒有了用武之地,不利于會計管理職能的發揮。這樣一來表面上強化了對被委派單位的會計核算和監督,但在一定程度上弱化了財務管理的功能,不利于提高經濟效益。

三、會計委派制問題博弈分析

從博弈論的角度看,目前會計信息失真是由于各博弈方(所有者、經營者和委派會計人員)的目標函數存在差異,而制度缺陷使各博弈方能夠利用不合理的博弈規則實現其利益最大化。而且它們各自的利益追求都可能是對立和沖突的,從而形成監督者與被監督者之間的博弈,而且博弈的納什均衡很可能是囚徒困境。博弈主要是企業負責人與委派會計人員之間的博弈和所有者與經營者之間的博弈。

我們可以根據監督博弈的一般模型來構建企業負責人與會計人員之間的監督博弈模型。該模型是混合戰略納什均衡。企業負責人的純戰略有兩個,即選擇監督與不監督;會計人員的純戰略也有兩個,即做假賬與不做假賬。這里設b是會計人員的做假賬收益,s是企業負責人的監督成本,t是會計人員做假后的處罰成本。假設s

假設用α表示實企業負責人實施監督的概率,β表示會計人員做假賬的概率。給定β,企業負責人選擇監督(α=1)和不監督(α=0)時的期望收益分別為:

πm(1, β)=(b-s+t)·β+(b-s)(1-β)=β·t+b-s

πm(0, β)=0·β+b(1-β)=b(1-β)

令πm(1, β)= πm(0, β)=0,得β*= s/(b+t)

β*的經濟含義在于:若會計人員做假賬的概率小于s/(b+t),企業負責人的最優選擇是不監督;若會計人員做假賬的概率大于s/(b+t),則企業負責人的最優選擇是監督。

給定α,會計人員選擇做假賬(β=1)和不做假賬監督(β=0)時的期望收益分別為:

πa(α, 1)=-(b+t)·α+0×(1-α)=-(b+t)·α

πa(α, 0)=-b·α+(-b)(1-α)=-b

令πa(α, 1)=πa(α, 0),得α*= b/(b+t)

α*的經濟含義在于:若企業負責人監督的概率小于s/(b+t),會計人員的最優選擇是做假賬;若企業負責人監督的概率大于s/(b+t)。則會計人員的最優選擇是不做假賬。

綜合上面討論,可以得出企業負責人與會計人員監督博弈的混合戰略納什均衡是[α*= b/(b+t),β*= s/(b+t)]。即企業負責人以b/(b+t)的概率選擇進行會計監督,會計人員以s/(b+t)的概率選擇做假賬。因此,后續的重要問題是:怎樣來增大α*以及怎樣來減少β*。

所有者與經營者之間的博弈也是監督博弈,與企業負責人和會計人員之間的監督博弈模型類似,這里不在詳細論述。

在監督博弈中,增大α*和減少β*可以通過制度來解決。按照安德魯·肖特在其《社會制度的經濟理論》中對制度做了描述和定義。按照肖特的博弈分析思路,制度的出現主要是為了解決人們社會生活中普遍存在的“囚徒困境”弈局和其他協調博弈問題。首先,如果一個社會反復地面臨一種囚徒困境弈局,那么,一個有效率的做法是演化出一種行為準則,以避免反復出現的非效率的均衡策略的應用。另外,這樣一個規則成為了一個社會慣例,它規定了重復博弈情況下當事人的行為,并且將被他們所遵循。例如:兩輛小汽車相向行駛,且正接近十字路口,一輛車想直行,另一輛想轉彎,他們都想盡快到達自己的目的地。但是,如果不協調他們的行動,那么就會出現撞車。最好的辦法是頒布交通規則,并且強迫他們上街前學習,希望在路口轉彎的司機必須在繼續前行之前等待對面開來的直行車輛。轉彎的人必須等待,這樣決策將被低成本地協調。

由以上內容,我們可以歸納制度的特征:(1)制度是一種公理化;(2)制度具有昭示性;(3)制度是自愿平等基礎上的權利與義務的集合;(4)制度是在囚徒困境博弈中自發形成的,其主要功能在于降低協調成本。

但是,會計委派制本身不符合“制度”的本質與特征。首先,它不是公理化的產物。該項制度所涉及的利益主體很多持懷疑態度。第二,它的昭示性不足,它雖然在一定程度上約束了會計人員的行為,但這種約束是勉強和脆弱的。第三,會計委派制是一種強制性,抹殺了企業的積極性。第四,會計委派制是非納什均衡,是一種“抽刀斷水”式的不理智決策,不是人人都愿意遵守。第五,會計委派制沒有降低市場經濟和社會活動中的協調成本,反而增加該成本。

因此,會計委派制是政府或企業為克服會計信息失真不得已而做出的過度性制度安排,其本身存在諸多矛盾和缺陷。會計委派制是通過改變現有利益分配關系,使一些人利益受損才能提高現有資源的產出水平的改進,是一種“非帕累托改進”的社會博弈過程的結果。會計委派制沒有使會計信息失真、會計造假現象得以根本解決。

四、完善會計委派制的建議

1.加大社會監督的力度,加強違規處罰力度

受利益驅動,委派的會計人員與被委派單位可能結成同盟,共同造假,形成內部人控制。作為企業內部會計監督體系之一的會計委派制不能具備完全的監督能力,它的職能所起的作用需要與其他形式的會計監督( 如社會監督中的注冊會計師, 政府監督等) 等相結合。同時,對于造假的會計人員和企業給予重處,從而促進并保障會計委派制的職能。形成一個綜合性的、龐大的、嚴謹的會計監督體系才能較好地控制會計信息失真的泛濫現象。

2.會計人員回歸企業,站在企業的立場為企業當好家,管好賬,更多地發揮管理和服務的職能同時,應該像遵守交通法規一樣,會計人員必須遵守公認會計準則以及制度約束與規范。因為會計制度是人人都愿意也必須遵守的均衡的產物。這是“納什均衡”指導思想的具體體現,這才是解決會計信息失真的最誠實、最客觀、最標準的態度與方式。

參考文獻 :

標準式博弈的混合戰略范文第4篇

[摘要] 本文主要在對無法律責任狀態下以及嚴格法律責任狀態下行受賄問題進行博弈分析的基礎上，從經濟學的角度觀察行受賄的法律問題，為推動預防職務犯罪工作的深入開展探索一個新的理論視角。……

一、導言

在犯罪學史上，古典學派和實證學派就犯罪人是理性人還是經驗人這一問題上分歧嚴重，兩者的研究方法和理論體系也因此迥異。迄今為止，它仍是犯罪學中格外引人注目并有待進一步廓清的一個基本理論問題。假設犯罪人是非理性的，由此派生而出的預防策略自然更多地關注在如何設計一個法律制度的同時，通過優化包括道德倫理在內的各種社會手段，來促使犯罪人從非理性向理性轉化，以求客觀地達到預防犯罪的目的。假設犯罪人是理性的，犯罪和非犯罪各自產生的期望值，便自然是犯罪人權衡取舍的內心尺度，由此而及的預防策略似乎也就應更多地關注犯罪人內心尺度的形成。盡管如此，有一點是可以肯定的，“犯罪人與其他非犯罪人一樣具有理性能力和相當的（或一定的）自由意志，他們的犯罪行為是他們在一定的環境之下做出的相對自由的選擇” ，這便構成了社會（或國家）追究犯罪人的法律責任或道義責任的人性基礎。

現代博弈理論的誕生，使我們的直覺更加敏銳并為我們觀察熟悉的問題提供新的視角，其思想與方法正日益深入到經濟學、政治學、法學、社會學等社會科學領域之中，對人類行為規律的系統研究產生了深遠的影響。求解博弈，首先必須就參與人如何決策做出一個基礎性的假定：參與人理性意味著他們總是偏好于更高收益的結果而不是更低收益的結果。在本文中，參與人就是行、受賄人，一個前提性假定是行、受賄人為理性人，這樣它能使博弈理論為我們理解法律是如何影響人們行為提供洞察力。

二、無法律責任狀態下的行受賄問題博弈

無法律責任狀態下的行、受賄問題，是一個標準的兩人兩戰略博弈，可以用表2（1）來表示。在無法律責任狀態下，行賄人行賄和受賄人受賄不承擔法律責任，這是一種假定的標準狀態。實際上，當受制于證據等因素，法律對行賄人、受賄人的制裁不力時，相當部分行賄人、受賄人由于方式隱蔽可能逃避法律責任的承擔，這種實際模式就會無限趨近于無法律責任的標準狀態，因此，我們考察這一問題時就選擇以標準狀態為對象。

受賄人

行賄人受賄不受賄

行賄 10，10 5，0

不行賄 0，5 0，0

表2（1）

如表2（1）所示：因無法律責任，行賄人行賄和受賄人受賄都將獲得10個利益單位而不產生負利益，行賄人不行賄的同時受賄人不受賄，雙方都將不獲利。如果行賄人（1）一方行賄、受賄人不受賄，由于行賄人（1）行賄的行為，使得受賄人即使未接受其賄賂，但相對增加了行賄人（2）、（3）······等的行賄成本，而造成受賄人受賄的期待利益增加，這樣行賄人雖然不能獲得10個利益單位，但有可能獲得5個利益單位。同樣地，受賄人受賄（索賄），行賄人（1）雖然不行賄，受賄人也將有可能獲得5個利益單位。在這個博弈當中，行賄人和受賄人即使事先雙方互不認識，但是不論受賄人是否受賄，行賄人采取行賄的戰略都將占優，也就是說行賄人行賄的戰略優于不行賄的戰略。同樣地，對于受賄方來說，受賄的戰略是他的占優策略。不論行賄方是否行賄，受賄人采取受賄的戰略都優于不受賄的戰略。因此，受賄人受賄、行賄人行賄的策略是嚴格占優策略，而受賄人不受賄、行賄人不行賄的策略是嚴格劣戰略。在這個兩人的博弈當中，行賄人最終會行賄，受賄人最終會受賄，就是這個博弈的解。

通過求解這個博弈，我們就會發現，由于法律責任的缺失，行受賄問題將會泛濫。即使雙方互不知道對方將如何行為，行受賄也是人們追求利益的一個必然選擇。

三、嚴格法律責任狀態下的行受賄問題博弈

在嚴格法律責任狀態下，行賄人和受賄人都將承擔相應的法律責任，這是一個標準的兩人協調博弈。如表3（1）：

受賄人

行賄人受賄不受賄

行賄 10，10 -8，0

不行賄 0，-8 4，4

表3（1）

在這個博弈當中，行賄人行賄的同時受賄人受賄，雙方都將獲得10個利益單位。行賄人行賄而受賄人不受賄，行賄人可能因此遭受到8個利益單位的損失。行賄人不行賄而受賄人受賄（索賄），則受賄人有可能遭受8個利益單位損失。如果行賄人不行賄、受賄人不受賄，雙方雖然在賄賂問題上不能獲得利益，但是有可能各獲得廉潔期待利益4個單位。行賄人和受賄人選擇的戰略是好還是壞，取決于對方怎么選擇。如果行賄人確信受賄人欲獲得10個利益單位而受賄，則行賄人也將行賄；如果受賄人確信行賄人欲獲得10個利益單位而行賄，則受賄人將受賄。每個人獲利的興趣不沖突，但只有在對方選擇最優反應時才有效，而實際上在雙方互不認識的情況下，沒有誰能確信對方會行賄（或受賄），除非事先雙方達成一個穩定的協議。

為了更好地說明這一問題，用P1表示受賄人受賄的概率，則1―P1為不受賄的概率。不論受賄人以多大的概率P1受賄（或者不受賄），10×P1加上-8×（1－P1）的數值就會相應地決定行賄人是否行賄，如果這個數值大于4（行賄人不行賄的收益），即 P1的值大于2/3，也就是受賄人受賄的概率大于2/3的話，行賄人就有可能會選擇行賄。

四、納什均衡與帕累托改善

在表3（1）當中存在3個納什均衡：兩個純戰略均衡T（10，10）與T（4，4），以及一個混合戰略均衡。在這些戰略均衡中，我們如何預測參與人將選取什么戰略并不是立即就能自我確定的。一種在不同的納什均衡中進行選擇的方法是考察不同的均衡并看它們中是否有一個均衡特別突出，這樣的戰略組合是一個聚點，它也被稱為薩林點。在表3（1）中的T（10，10），即（行賄人行賄、受賄人受賄）這樣的均衡就是一個薩林點。這與前面的論述是一致的：即使受賄人和行賄人事先不認識，一方并不知道對方將如何行為（無知之幕），但是只要行賄人確信受賄人將會有2/3的概率受賄，行賄人的勝算就已經很明顯地超出。運用這一分析，我們也就能夠較為清楚地得出一些領域行、受賄人事先并不認識卻能很快達成相互一致的穩定協議，而成功地完成行、受賄的博弈。當然，這個無知之幕是一種理想狀態。如果假定我們所研究的對象是一個功利主義者的話（尤其對于一個商人來說），他必然會去收集信息調查可受賄對象的受賄概率，盡管這會耗去其相應的信息成本，他也會盡可能地去揭開這無知之幕，除非當一個社會實際的博弈已經確立了相應的排除規則，或者行賄人所耗去的信息成本已經超過了他的期待利益。

我們再來研究一下表4（1）和表4（2）的博弈。

受賄人

行賄人受賄不受賄

行賄 10，10 -8，0

不行賄 0，-8 8，8

表4（1）

受賄人

行賄人受賄不受賄

行賄 10，10 -8，0

不行賄 0，-8 12，12

表4（2）

表4（1）與表3（1）相比較，博弈的參與人（不行賄、不受賄）的可得利益有相應的改善，雖然還沒有超過（行賄、受賄）這一戰略組合，但這已經加大了行賄人調查受賄人受賄概率的信息成本，相應地也就會降低行賄和受賄的期待利益，足以激勵一部分人選擇這一戰略。在表4（2）中，（不行賄、不受賄）戰略組合的期待利益已經實現了帕累托優超，這固然從根本上預防了行賄和受賄的發生，但是這又必然會耗去高昂的社會管理成本，不是一般國家所能夠承受的。通過對這兩個博弈的分析，我們可以進一步明確高薪養廉制度的利弊。轉貼于

五、預防策略述評

上面論及的幾種形態都是理論上的標準形態，實踐中的形態往往比之更為復雜。但不論它的外在形式如何，我們都是可以簡化成以上模式的，這將有助于我們分析行、受賄問題。據此，我們大致可以制定以下相應的預防策略，使得好人在他的有生之年終能勝出。

（一）行受賄的證據采信應適用過錯推定的歸責原則

現有法律對行賄和受賄兩種犯罪的刑罰力度是有區別的，受賄最高可到死刑，行賄最高是無期徒刑。更值得關注的是，司法實踐中行、受賄雙方往往是一對一的兩人秘密進行的模式。即使雙方事先互不認識，但經過一方主動示意或者積極活動，基于對利益選擇的互不沖突，也就是所謂的“雙贏”，雙方都能達成心照不宣的穩定協議。除非是一方事后未獲得預期利益而打破兩者的“協議”導致問題的暴露，否則一般情況很難調查搜集到相應的行受賄證據，這種情況就有可能造成接近于表2（1）的博弈結果。為此，有必要采取過錯推定的原則來打擊行受賄犯罪。具體地說，博弈的參與人有非正常接觸事實，一方參與人（行賄嫌疑人）又獲得博弈的實際利益，在法律上應當推定行受賄成立，除非當事人能舉出相反的證據予以證明。這樣檢察機關追訴犯罪時只需舉出存在非正常接觸以及獲得實際利益的證據，當事人則必須對其非正常接觸予以合理的解釋和說明。這里的難題是何為非正常接觸？一般來說，利益決策人和利益參與人博弈前互不認識，而在任何非公務場合的接觸都應當視為非正常接觸；知道或者應當知道存在回避原因而未回避的也應視為非正常接觸。通過這種方法的確立，博弈參與人無法揭開無知之幕而達成穩定的協議，同時也加大了參與人調查對方而付出的信息成本，這樣，表2（1）的模式向表3（1）轉化，而且使得雙方最終因達不成協議而會選擇（不行賄、不受賄）的戰略組合。

（二）建立利益決策人和利益參與人事先隔絕制度

利益決策人和利益參與人如果博弈前能夠很輕松地來往，那么雙方不行受賄便只能源于道德約束。我們不可否認道德約束的力量，但也不能完全依靠于此。因此，必須建立一種隔絕制度，使得利益決策人和利益參與人的非隔絕狀態非法，所有決策信息的獲取，必須通過決策人的代言人進行以及第三方組織的客觀評價。這個制度的建立必然會加大行受賄雙方達成穩定協議的成本，比如集體決策制度、透明決策制度、評估人隨機選擇制度等等，單一決策人和參與人不直接對話，這種模式有助于激勵嚴格法律狀態下博弈參與人選擇（不行賄、不受賄）的戰略組合。當然這種模式在預防行受賄犯罪的同時，無疑會降低工作效率，提高管理成本，因此嚴格意義上說，此模式只適合于博弈利益較高的場合。博弈利益較低的場合，如果表3（1）（行賄、受賄）戰略組合的期待利益不是10個利益單位，而是5個或者6個，和（不行賄、不受賄）戰略組合的4個期待利益相比較，道德和紀律的力量就足以達到預防效果。

（三）建立健全社會信用評價體系，增加廉潔的社會期待利益

通過建立健全社會信用評價體系，及時有效地將博弈參與人的社會信用情況進行統計，果斷淘汰社會信用較低的參與人。同時，在社會經濟許可的范圍內，增加廉潔的社會期待利益。如表4（1）和表4（2）所述，如果博弈參與人對（不行賄、不受賄）的戰略組合有著很高的期待利益，在提高信用準入門檻的基礎上，參與人選擇（不行賄、不受賄）戰略組合的概率就會很高。社會信用評價體系完善了，不見得就只有通過高薪養廉的方法才能提高（不行賄、不受賄）戰略組合的期待利益，參與人的社會信用度往往就是一個金字招牌，雖然他在某個局部的博弈當中獲利不高，但是在其他的博弈當中他有可能獲得的利益往往就足以彌補這種利益差異。反過來，在一個局部博弈當中，參與人選擇（行賄、受賄）的戰略組合可能獲得較高的當然利益，但是其社會信用度受損，就會影響到他參與其他博弈的期待利益，甚至于影響到他參與其他博弈的入局資格，這種一錘子買賣導致利益連續分散獲取的損失是一般理性人所不會選擇的，除非這種利益連續分散獲取的時間超過了一個人有限的生命周期。當然也不可否認，排除其它因素的影響，諸如采取高薪養廉的措施，直觀上提高（不行賄、不受賄）戰略組合的期待利益，在單個博弈中對預防行受賄犯罪的發生也是有效的。

參考書目：

1、《犯罪學教程》，魏平雄等主編，中國政法大學出版社1998年7月第1版

標準式博弈的混合戰略范文第5篇

關鍵詞：聲譽；招投標；合謀；約束機制

中圖分類號：F294 文獻標識碼：A DOI：10.3963/j.issn.1671-6477.2012.06.007

一、引言

基于聲譽約束的機制設計是當前博弈論研究中的一個前沿方向。Kreps和Wilson[1]運用聲譽理論解決了Selten的連鎖店悖論，Milgrom和Robert[2]在同一時間引入聲譽機制來解釋有限次重復博弈的囚徒困境，KMRW的理論被統稱為聲譽理論。Barro和Gordon[3]將KMRW聲譽模型運用到政府貨幣政策博弈當中，以此來分析聲譽對央行貨幣政策實行的影響。S Bikhchandani[4]對兩個投標者在第二密封拍賣下的單期博弈和重復博弈進行了分析，Michael H.Rothkopf和Ronald M.Harstad[5]也在第二價格密封拍賣中引入聲譽機制；Daniel Houser和John Wooders[6]通過對Ebay網上拍賣的實證分析，得出聲譽對招標者比對投標者而言更為重要；Ming Zhou， Martin Dresner 和Robert J.Windle[7]對缺少聲譽反饋機制和擁有聲譽反饋機制的網上拍賣者的行為進行了分析，其結論是沒有聲譽機制的情況下，即使是好的招標者其合作行為也不會得以維持，而一旦考慮到聲譽，情況就會改變。Yang Jian，Hu Xiaorui和Zhang Han[8]運用仿真模擬對CtoC環境下的網上拍賣的聲譽反饋機制進行了分析，得出了類似的結論；Luis Cabral[9]站在拍賣者的角度，認為拍賣者建立自己的聲譽會是一個漫長的過程，而毀掉聲譽卻只在一瞬間，這是因為一個聲譽低下的拍賣者不得不以更低的價格和更低的頻率來拍賣物品。國內也有一些文獻談到聲譽因素在招投標中的應用，如Zhao Jia和Huang Jinghua[10]運用中國淘寶網上的數據，將聲譽因素對網上拍賣者的影響進行了實證分析。

本文改進與完善了Barro與Gordon模型中的效用函數，將聲譽機制引入到多回合的招投標分析。結果顯示，基于聲譽的博弈機制設計對投標人而言將會是一個很強的約束，只要重復博弈達到一定的次數（沒有必要是無限期的），那么合謀類型的投標人也可能在相當長一段時期內表現得像非合謀類型的投標人一樣，從而有利于招標人，并創造出更多的消費者剩余與社會總剩余。

二、模型假設與效用函數

（一）基本假設

假設博弈的雙方為招標人和投標人。一般認為招標方的行為特征對于眾投標人而言都屬于公共信息或共同知識，因此，在本文中，假設招標人只有一種類型，它總是可以以自己認為合適的價格選擇中標者，并且總能夠保證自己的價格得以實施，即招標人是言行一致的，說到做到。

同時，本文把眾多的投標人標準化為一個行為人，即投標者，并假設投標者有兩種類型：一類是非合謀型，它是指投標者的品質是“好”的，不會參與招投標過程中的合謀；二是合謀型的，即該投標者的品質是“壞”的，在招投標過程中，會通過合謀來抬高標價，獲取超額利潤。

投標者屬于何種類型只有它自己知道，對招標方而言，這是對方的私人信息，自己無從知曉。但是假設每次招標人與投標人進行完一次交易之后，招標人可以對投標人進行評價，即包括“差評”和“好評”。他們會為自身設置一個可承受的區間值，投標人在交易中的表現在其可接受范圍之內時，招標者認為自己得到了正的效用，因此就會給予“好評”，一旦投標人在交易中的表現超出自身評價可接受的區間，招標人就會認為自己是吃虧的，那么就會給“差評”。同時假設招標人都是道德良好和理性的，能夠在每次與投標人的交易中了解到自身是否遭受損失，同時也不存在惡意評價。通過這種評價反饋機制，每個投標者的表現會成為公共信息而存在于信息庫中，招標者在下一期就會根據這些信息來判斷投標者的類型。

（二）效用函數

假定V為投標人對招標人利益的實際侵占率，即投標人通過非法合謀，抬高標價所取得的超額利潤；b為類型參數，代表投標者的類型，令b=0為投標者的類型為非合謀型；令b=1代表投標者的類型為合謀型；VE為招標者對投標者侵占率的心理預期，表示招標者對投標者的預期行為判斷。顯然有V與VE均大于0且小于1。構造投標者的效用函數如下：

U=-12V2+b（V-VE）+K

式中：K為常數項，且由于投標者的效用一般為非負的，故還應滿足初始條件U≥0。對于上式有兩點說明：若b=0，即投標者為非合謀型時，上式為U=-12V2+K，只有當V=0時，才能使其效用最大化，而V=0意味著投標者不侵占招標者的利益，這意味著，對于非合謀型的投標者而言，其行動是單一和明確的，不侵占招標者的剩余是它的最優選擇，這與投標者的類型相吻合；若b=1，即投標者為合謀型時，U=-12V2+V-VE+K，他可以選擇合謀，但是也可能為了長期利益的最大化而把自己偽裝成“好”人。

三、均衡解

（一）單期博弈的均衡解

若博弈只進行一期，則有如下結論：

對于非合謀型的投標人而言，有b=0，其效用函數為U=-12V2+K，于是V=0時投標人取得最大的效用K，這意味著好品質的投標人不會通過合謀來獲利，其行為始終是明確和合法的。

對于合謀型的投標者而言，有b=1，其效用函數為

U=-12V2+V-V2+K

由UV=-V+1=0得到當V=1時，投標人取得最大效用為U=K+12-VE；如果投標者不合謀，選擇V=0，那么投標者的單期效用為U=K-VE，小于進行合謀時的效用。于是在單期博弈中，壞品質的投標人沒有偽裝成好人的動力。因此單期博弈的均衡解為：非合謀型的投標者選擇不合謀，即V=0；而合謀型的投標者選擇合謀，即V=1。

（二）多期博弈的均衡解

以上單期博弈的均衡結果在長期博弈中會改變，假定在t=0期b=0的先驗概率是p0，b=1的先驗概率是1-p0。若博弈重復T階段，令yt為t階段合謀類型的投標者選擇非合謀策略的概率，xt為招標者認為非合謀類型的投標者不合謀的概率；在均衡的情況下，yt=xt。那么，在t階段如果招標者對投標者的評價是“好評”，當這成為公共信息時，根據貝葉斯法則，招標者在t+1階段認為該投標者是非合謀類型的投標人的后驗概率是：

pt+1（b=0|Vt=0）=pt×1pt×1+（1-pt）×xt≥pt

式中：pt為t階段招標者認為投標者為非合謀類型投標人的概率；1為非合謀類型的投標者不進行合謀的概率。這意味著如果投標者沒有進行合謀，那么招標者認為他是非合謀類型的投標人的概率是向上調整的。而如果投標者進行合謀而被“差評”，這就會成為行業內的公共信息，此時有

pt+1（b=0|Vt=1）=pt×0pt×0+（1-pt）xt=0

這意味著一旦招標者得知投標者合謀過，他們就會在下一期定義該投標者是合謀類型的投標者。

首先考慮兩個階段模型的均衡解。在最后階段，投標者建立較好的聲譽已經沒有了意義，合謀型的投標人的最優選擇是Vt=b=1，招標者對投標人的侵占率預期為VEt=Vt×（1-pt）=1-p，此時合謀型投標人效用水平為

Ut=-12+（Vt-VEt）+K=pt-12+K

因為Utpt=1>0，所以合謀型投標人的效用是聲譽的增函數，這也是合謀型的投標人在前若干期的博弈中有積極性建立聲譽的原因。

再考慮t-1期合謀型投標者的策略選擇。假定合謀型投標者在t-1階段之前都沒有進行合謀，那么招標者對投標者的預期侵占率為：

VEt-1=Vt-1×（1-pt-1）×（1-xt-1）=1×（1-pt-1）×（1-xt-1）

式中：1為合謀型投標者的最大侵占率；（1-pt-1）為投標者為合謀型的概率；（1-xt-1）為招標人認為合謀型投標者選擇合謀的概率。令σ為貼現因子。在t-1階段合謀型的投標者可以選擇合謀的策略來實現單期效用的最大化，也可以繼續建立聲譽而把自己偽裝成非合謀型的投標人。

如果合謀類型的投標人在t-1期選擇合謀，那么他的總效用為：

U1=Ut-1+σ×Ut=（12-VEt-1+K）+σ×（K-12）

如果合謀類型的投標者在t-1期選擇偽裝，那么他的總效用為：

U2=Ut-1+σ*Ut=（K--VEt-1）+σ*（pt-12+K）

如果U2>U1，即pt≥12，則t-1期不合謀的總效用就會大于合謀的總效用，因此即使是合謀型的投標者也有合規經營的可能。因為在均衡情況下，招標者的預期xt-1等于投標者的選擇yt-1，因此yt-1=1成為合謀類型的投標人不進行合謀的策略。

這說明如果在t-1階段招標人認為投標人是非合謀型的投標人的概率不小于12σ，那么合謀型的投標人選擇不合謀要優于合謀。因此該博弈的納什均衡戰略為，只要貼現因子σ足夠大，合謀型的投標者在t-1期選擇不合謀，在t期選擇合謀。而且，如果投標人的聲譽越好，它維持自身聲譽的積極性就越高。這一點在混合戰略均衡中更為清楚。如果pt=12σ，任何的yt-1∈[0，1]都是最優的。但因為均衡要求yt=xt，將pt=12σ帶入貝葉斯法則并重新安排，得到：

yt-1=xt-1=（2σ-1）pt-11-pt-1

在該式中，假定σ>12，則

yt-1pt-1=2σ-1（1-pt-1）2>0

即招標者越認為投標者是“好”人，合謀型的投標者選擇不合謀的積極性就越高。特別地，當pt-1時12σ，yt-11。

上述分析得知，合謀型投標者在選擇t-1階段的對策時，面臨著眼前利益和未來利益之間的權衡。給定招標者不知道投標人的真實類型，如果合謀型為投標者在現期選擇合謀，他在現階段的效用

Ut-1=12-VEt-1+K>-VEt-1+K

但在聲譽被毀之后，他下階段的效用將會下降為

Ut=-12+K

因此，合謀型投標者面臨的問題是究竟在現階段利用自己的聲譽還是在下階段利用自己的聲譽。如果pt-1充分大，即σ充分接近于1，那么其最優選擇是下階段而不是現階段利用自己的聲譽[11]。

容易證明，如果合謀型的企業在T-1階段選擇不合謀時的策略是最優的，那么，在所有t

該博弈均衡戰略解的存在，必須滿足pt-1≥12σ，即只要σ足夠大，該式就能成立。因此，合謀型的投標者就會選擇不合謀，即選擇把自己偽裝成“好”人的積極性就越高，這樣就越有利于建立一個誠信的招投標環境。這也意味著，只要博弈是一直重復的（沒有必要是無限期的），即使是合謀型的投標者也會有合規經營的動力。

四、仿真模擬

（一）不同類型的效用函數的比較

如前文所述，非合謀類型的投標人的效用函數為U1=-12V2+K，而合謀類型的投標人的效用函數為U2=-12V2+V-VE+K，將U1和U2定義為三維坐標的縱軸，而V和VE分別是兩個橫軸。根據假定，V和VE都在0到1之間取值，將K取常數1，V與VE均從0開始，按0.001的步長遞增，做1 000次模擬，于是得到圖1。

如圖所示，圖中黑色陰影部分曲面代表的是合謀型投標人的效用函數圖，其效用函數為U2=-12V2+V-VE+K，而灰色的曲面代表非合謀型投標人的效用函數圖，其效用函數為U1=-12V2+K。由圖1可見，如果投標人是合謀型企業，那么其獲得的效用將隨著VE的增大而減少，即隨著招標人對其侵占率預期的增大而減少；而對非合謀型的投標人來說，只有在V=0時其效用才是最大的，隨著增加其效用也會逐漸減少。

由于這兩個效用函數的圖形形成相交的曲面，因而U1和U2之間的大小關系并不確定，這意味著隨著V和VE取值的不同，有時候U1>U2，有時候U1

（二）不同類型企業的行為選擇

那么怎樣才能誘導合謀型企業選擇非合謀的行為呢？下面建立一個多期博弈的仿真模擬來進行說明。

針對合謀型的投標人，其面臨的效用函數為U2=-12V2+V-VE+K。假設在博弈的首期，招標人的態度中立，認為投標人是非合謀型與合謀型的先驗概率均為p0=0.5。現在投標人有兩種選擇：要么在本期偽裝成非合謀型企業，招標人在下期博弈中仍然維持對他的“好評”的預期概率；要么在本期選擇合謀，招標人在下期博弈中將調低對他的“好評”的預期概率。基于此，我們分別計算出投標人在今后各期選擇合謀策略和不合謀策略的單期效用和累積效用，通過模擬，得到圖2與圖3。

圖2顯示，在設定的數值下，投標人若選擇合謀，那么他在t=4期的收益將達到最大，但是由于招標人基于投標人的合謀行為，調低了對投標人的“好評”的預期概率，所以投標人在t=5期的收益會急劇下降，并在后續的經濟交往中，每一期的收益都會低于非合謀型投標人的每一期收益。

圖3則顯示，盡管在t=4期以前，合謀型投標人的累積效用會大于非合謀型投標人的累積效用，但是從t=5期開始，非合謀型投標人的累積效用將大于合謀型投標人的累積效用，并在以后的博弈中，兩者的差距會越來越大。

從仿真模擬可見，其實并不需要進行無窮多期博弈，只要博弈的次數足夠多，投標人選擇不合謀所獲得的收益將超過選擇合謀所獲得的收益。因此，在聲譽機制約束之下，基于收益最大化，不論是合謀型投標人還是非合謀型投標人，都會選擇不合謀的行為，這顯然有利于維護招標人的利益，并提高消費者的福利。

五、結論

通過上文分析可見，基于聲譽的制度設計對投標企業約束的重要性。招投標過程中，存在著各種利益的沖突，巨大的經濟利潤的誘惑可能會推動著投標者不自覺地觸動自己的道德底線，朝著合謀的方向越陷越深。顯然，一個有效健全的聲譽約束機制可以規范和引導市場參與者的行為選擇，使得投標者能夠在實現自身利益最大化的同時不辜負整個社會對他們的道德期盼。由此可見，面對一個好的制度，即使是合謀類型的投標人也有不進行合謀而選擇合規經營的激勵，在整個宏觀經濟層面上，科學合理的激勵約束機制可以有效誘導企業體現出更強的社會責任感與道德倫理觀。

[參考文獻]

[1] Kreps D M，Wilson R.Reputation and imperfect information[J].Journal of Economic Theory，1982，27：253-279.

[2] Robert M J Predation. Reputation， and Entry Deterrence[J].Journal of Economic Theory，1982，27：280-312.

[3] Barro R J，Gorden D B.A Positive theory of monetary policy in a natural rate model[J].The Journal of Political Economy，1983（4）：589-610.

[4] Bikhchandani S.Reputation in repeated second-price auctions[J].Journal of Economic Theory，1988，46：97-119.

[5] Rothkopf M H，Harstad R M.Modeling competitive bidding：A critical essay[J].Management Science，1994（3）：364-384.

[6] Houser D，Wooders J.Reputation in auctions：Theory，and evidence from Ebay[J].Journal of Economics & Management Strategy，2006（2）：353-369.

[7] Ming Zhou， Martin Dresner，Robert J.Windle.Online reputation systems：Design and strategic practices[J].Decision Support Systems.2008，44：785-797.

[8] Jian Yang， Xiaorui Hu， Han Zhang. Effects of a reputation feedback system on an online consumer-to-consumer auction market[J].Decision Support Systems，2007，44：93-105.

[9] Cabral L.The rise and fall of reputation[Z].2009，Working Paper.

[10] Zhao Jia，Huang Jinhua.An empirical research on taobao：Seller reputation's impact on auction price premium[C].Advanced Management of Information for Globalized Enterprises.2008，IEEE Symposium on，2008：1-5.

[11] 張維迎.博弈論與信息經濟學[M].上海：上海人民出版社，1996.

Mechanism of Preventing Collusion Based on Reputation Constraint

MA Li，NIU Yong

（School of Economics and Management，Wuhan University，Wuhan 430072，Hubei，China）

標準式博弈的混合戰略

標準式博弈的混合戰略范文第1篇

標準式博弈的混合戰略范文第2篇

標準式博弈的混合戰略范文第3篇

標準式博弈的混合戰略范文第4篇

標準式博弈的混合戰略范文第5篇

相關推薦更多

熱門文章排行更多

相關期刊更多

標準生活

標準科學

中國藥品標準

精品文章排行更多