幸福

男生的品格


李老师,您好,我想请教您一个问题,关于男生应该具备怎样的品格。

这段时间一直在和对象闹矛盾,经历了吵架到后面吵都不想吵了,直接冷战的局面。后面双方都爆发了一次,我竟然发现我有点儿不认识她了,有点儿陌生。她告诉我,有时候觉得我是一个自负、并且气量小的人。我想了想,她说的没错,我对于某些事会认为很简单,不值得一提,那些事我没有去做过,就直接认为很简单。我活在自己营造的主观世界里,气量小也让我很困惑,有时候我和她沟通时常会被她呛到,气得说不出话。我只是想让她知道一下我那个时候的心情,我想我那样做肯定是错误的吧,但我不知道别的情侣是怎么去处理的。

前几天我们分手了,因为处理不好两人沟通的方式。我们在一起也不算短,算算有两年啦。可是那种堆积起来的无力感,真的没有办法呀,明明双方都是爱彼此的。也希望能通过李老师感知一下其他情侣吧。想问一下李老师,男孩子该具备哪些品格呢?(问题来自微博私信)

你听说过博弈论(game theory)里有一个经典问题叫「囚徒困境」(Prisoner’s Dilemma)吗?

警察逮捕了两名嫌疑犯,但没有足够证据指控两人有罪。于是警察给两个人提供了相同的选择:认罪或者保持沉默。如果两人里只有一人认罪,认罪的人无罪释放,另一人获刑十年。如果两人都认罪,两人各获刑五年。如果两人都保持沉默,则两人各获刑一年。

哈哈,估计五十年代把这个故事写到论文里的那哥们儿警匪片儿看多了——里面动不动就有逮捕嫌犯的场景:「You have the right to remain silent. Anything you say can and will be used against you in a court of law.」

在囚徒困境的故事里,如果两名嫌犯都自私地为自己争取最大利益(刑期尽量短),他们都会认罪。即使两人都明明知道如果两人合作双双保持沉默的话,刑期只有一年——两人还是都会认罪。

永远为自己争取最大利益得到的均衡点,叫纳什均衡(Nash Equilibrium)。这个博弈论的故事告诉我们,从全局来看,纳什均衡往往并不一定是最好的结果。

如果你和你女朋友出现矛盾,吵架升级到了冷战的局面,你是认错道歉呢,还是保持沉默僵持不下?

如果两人都认错,结果是和好如初;两人都保持沉默呢,结果是分手。但是如果一个人认错,另外一个人保持沉默呢,结果是认错的这方丢尽了脸,还不如分手的好。

按照博弈论的理论,如果你自私地为自己争取最大利益,你应该保持沉默,让冷战继续僵持下去。

可惜的是,你们俩都太聪明了,明明知道合作就可以和好如初,最后还是要分手。

而证明任何博弈游戏里都存在纳什均衡的 John Nash,却依靠他的天才证明得了诺贝尔经济学奖。

你一定要问,那也不能一直忍让啊,时间长了,女朋友岂不是更要蹬鼻子上脸,欺人太甚了?

好吧,现在我们又要用到一个理论。不过这回咱不玩儿博弈游戏,而是去解一个优化问题。

计算一个优化问题的最优解,乍一看似乎很简单——只需要每一步都去挑选这一步里所有选择最好的一个,慢慢地不就逼近全局最优了吗?

其实不然:这样的算法叫做贪心(greedy)算法,大多数情况下,贪心算法会让自己陷入「局部最优解」中。就好像你去爬山,如果只上山而不下山,就有可能陷在一座小山的山顶上,雾气缭绕之中,看不见远处还有更高的山峰在等着你。

那怎么办?五十年代初有一个叫 Nicholas Metropolis 的物理学家写了篇论文提出了一个算法:你还是像以前那样爬山,每一步如果是上山就迈出这一步,如果是下山呢,那你根据一个概率随机抽一个奖,如果抽中就迈出这一步。这样我们利用一个随机算法,就可以离开小山头,向大山头进军了。

这个算法后来以他命名,属于一种蒙特卡洛算法(Monte Carlo method)。蒙特卡洛算法的精髓就在于它的随机性,后来广泛应用于很多科学研究领域。比如谷歌鼎鼎大名的AlphaGo,所有人都知道是基于机器学习,但其实它的算法的核心是蒙特卡洛树搜索(Monte Carlo Tree Search),同样是利用算法的随机性去试探搜索树中的一些未知节点。

回到你的问题上——你的最优策略是,在明知吃亏时掷出一枚硬币,如果正面朝上,即使吃点亏也认了。

你瞧,我完全不认识你,还在这里一个字一个字地回答你的问题,不正是「吃点亏也认了」嘛。

那男生应该具备什么样的品格呢?

哈哈,光《小学生守则》就有十条,可以列举的优秀品格太多了。

不过我印象最深的还是最后一条:「诚实勇敢,不说谎话,有错就改。」

勇敢地跟你的女朋友认个错吧,说不定还能和好如初。

当然如果能再懂一点儿计算机算法,就更完美啦。

2018年11月,多伦多