Archive for July, 2012

African Lion Safari

Friday, July 20th, 2012

African Lion Safari
非洲狮子之旅是旁边一个城市剑桥(Cambridge)的一个野生动物公园,公园主要活动是四场动物表演和一个可以开车进去的野生动物园。四场秀分别是大象洗澡、鹦鹉学舌(其实有很多小型的禽类的表演,很逗趣),捕食活动(中大型禽类的捕食技巧表演)和大象表演。

鹦鹉学舌和大象表演最为精彩,前者可以看到白孔雀飞翔、乌鸦捡垃圾、鹦鹉骑车、鹦鹉说话,蝙蝠飞翔,鹅苗奔跑等;后者可以看亚洲象各种卖萌、拉木头、捡硬币、画画。才知道大象如果敏捷温顺而且容易驯服,并且最后还可以摸到大象。

野生动物区可以开车进去,道路蜿蜒曲折,但是可以看到很多动物比较真实的野生生活,比如在你面前过马路的动物,在池塘边喝水的动物,以及一些好奇心比较重直接蹭到你窗户边的动物(我们只遇到了鸵鸟会很接近车辆,可惜长颈鹿没有靠过来),最为神奇的是我们刚好遇到了临产的梅花鹿并看到了生产的一幕。

(more…)

四十八分之四十四:prisoner’s dilemma

Saturday, July 14th, 2012

postcard from Waterloo Station, London, June 2012

读大名鼎鼎的《the selfish gene》的时候,没想到里面也用了一个章节来讲囚徒困境(prisoner’s dilemma)问题。这个问题也是我在接触了智能体模型(Agent-based model)后在相关文献中最常出现的引用之一。其实这也是社会学或者说博弈论的一个经典案例,案例简单来说就是你和你的共犯被抓,警察将你们分开审讯,作为疑犯你和你的共犯可以采取两种措施,一种是死不承认,一个是坦白从宽。由于每个人都有两个选择,排列组合之后就有了四种结果。都不承认的是两人都受到轻微惩罚,而互相揭穿的结果是两者都接受中等程度惩罚,而一方背叛而另一方不供认的结果是被背叛的收到最重的惩罚而背叛者不受到惩罚(以下是wiki上面的来源)。

The prisoner’s dilemma is a canonical example of a game analyzed in game theory that shows why two individuals might not cooperate, even if it appears that it is in their best interest to do so. It was originally framed by Merrill Flood and Melvin Dresher working at RAND in 1950. Albert W. Tucker formalized the game with prison sentence payoffs and gave it the “prisoner’s dilemma” name (Poundstone, 1992). A classic example of the prisoner’s dilemma (PD) is presented as follows:

Two men are arrested, but the police do not possess enough information for a conviction. Following the separation of the two men, the police offer both a similar deal—if one testifies against his partner (defects/betrays), and the other remains silent (cooperates/assists), the betrayer goes free and the one that remains silent receives the full one-year sentence. If both remain silent, both are sentenced to only one month in jail for a minor charge. If each ‘rats out’ the other, each receives a three-month sentence. Each prisoner must choose either to betray or remain silent; the decision of each is kept quiet. What should they do?

而这个问题的核心是研究对象(在这个情况下是疑犯)应该采取什么措施。而在书中,得出了一个有趣的结论——nice guys finish first,也就是说遇到这种情况,友善的策略(strategy)的结果是最好。在这个实验中,设计者请了很多人来设计不同的策略,不断重复这个实验,看最后谁的结果最好(惩罚最轻,或者收益最大),夺冠的策略是Tit for tat(an English saying meaning “equivalent retaliation”)。这个策略就是全面模仿对方的策略,只要对方沉默,我也沉默,只要对方背叛,我下一轮也背叛。换成中文有点跟屁虫的味道,同时又有点大好人的感觉,再加一点睚眦必报(很奇怪这种策略要翻译成中文都是比较负面的词汇)。而相对而言,比较邪恶的拥有主动背叛的策略都得不到善果。

而我遇到的智能体模型,大多是用它来处理资源的分配问题,因为主权不明确的公共资源,由于它的外部性(externality)作用(比如空气),不同的决策者会对它不同的对待方式。比如环保主义者,住户,政府,投资者和产业者。在这个情况下不再是善有善终的结果了。我觉得很大的问题是,不同于前面提到的策略,另一种决策过程(decision making process)在现实生活中起作用。利益相关者(stakeholder)不再单一采取一种静态的策略,而是在学习和适应(learning and adaptation)的过程中不过改变自己的策略,每一个决策是根据自己以前策略的结果和广义上“邻居”的策略信息综合得出的,所以结果更莫测一点。

这一切看起来很学术,但是换一个话题一下就很容易明白,那就是恋爱。爱情中的人总会遇到这种进退维谷的时候,有些时候你会选择原谅,有些时候你会选择报复。总体来看,长长久久的爱情大抵都是互相懂得原谅的,而主动报复对方的一半时最迅速结束自己的姻缘的。但是大多数人不是一见钟情,一生一世,而是在不断遇到新人的过程,你自己的恋爱策略也慢慢变化着,最后能不能达到平衡状态也要看天时地利人和。所以博弈论下面的爱情关系教会至少两件事情,一者是要大度,二者是要学会成长,豆瓣上面那些恋爱的故事就是一个个实证案例(empirical cases)。

P.S. 书里面提出了文化基因meme,但是不知道为什么现在人们对这个词的发音都是类似“密密”,明明文章里面提到其实这个词的发音应该是模仿基因(gene)的单音节(monosyllable),而应该跟Cream押韵(It should be pronounced to rhyme with ‘cream'”),不知道为什么这种发音发生了变化。