Idiomas

Deixe que eles ganhem

O Dilema do Prisioneiro é um dos assuntos mais estudados pela teoria dos jogos, um ramo da economia que estuda tomada de decisões estratégicas. Ele pode ser resumido no seguinte experimento mental:

Imagine que você seja um traficante e em dado momento você e seu parceiro são pegos cometendo um furto. A polícia pode prender vocês por 1 ano, mas ela sabe que vocês cometeram crimes muito mais graves além desse, que dariam penas mais severas, só que ela não tem nenhuma prova.

Então você é levado a uma sala, onde um investigador lhe faz a seguinte proposta: Você pode confessar todo o histórico de crimes da sua quadrilha e com isso você vai ganhar um bônus na sua pena. Ele diz que seu parceiro está em outra sala e outro policial está fazendo a mesma proposta a ele. Vocês não podem se falar até decidirem, e o bônus na pena vai depender da resposta de vocês dois, na seguinte forma:

  • Caso você confesse e seu parceiro negue, seu parceiro vai pegar toda a pena, de 5 anos, e você fica livre.
  • Caso seu parceiro confesse e você negue, você vai pegar toda a pena, de 5 anos, e seu parceiro fica livre.
  • Caso vocês dois confessem, os dois serão presos, mas com o bônus da confissão pegarão apenas 2 anos de prisão cada.
  • Caso os dois neguem, serão indiciados apenas pelos furtos, pegando apenas 1 ano cada.

Matriz de representação gráfica do dilema do prisioneiro
Dilema do prisioneiro representado na forma normal da teoria dos jogos.

O que você faria?


Estratégia dominante

O dilema foi proposto em 1950 e é largamente estudado por economistas. A ideia é que se você pensar racionalmente, a melhor escolha que você pode fazer nessa situação é confessar o crime, pois ela lhe dará o melhor resultado, independente do que seu parceiro faça:

  • Caso ele negue, é melhor você confessar, pois assim você vai ser solto, ao invés de pegar 1 ano caso você negue.
  • Caso ele confesse, também é melhor você confessar, pois assim você vai pegar 2 anos, ao invés de 5, se negar.

Caso você ainda não tenha percebido, essa situação é simétrica, portanto seu parceiro pode ter exatamente o mesmo raciocínio, daí a melhor escolha para ele também é confessar. Essa escolha, que é a melhor independente do que o outro fizer, é chamada de estratégia dominante.

Só que existe um porém: Ainda que a melhor escolha para cada um seja a de confessar, essa escolha dá um resultado pior para os dois: Caso ambos tivessem negado, cada um deles ficaria preso apenas por 1 ano, ao invés dos 2 que ambos vão pegar por escolherem suas estratégias dominantes.

Analisando a situação individualmente, a estratégia dominante é a melhor a ser tomada, mas ela ainda trás um resultado individual pior do que poderia ser quando analisamos a situação como um todo. A melhor escolha que cada um pode fazer não é a que dá o melhor resultado para cada um individualmente. Eis o porquê se ser um tamanho dilema.


Aplicações no mundo real

A ideia de ser um traficante preso por furto não é comum para a maioria das pessoas, mas a estrutura do dilema do prisioneiro pode ser aplicada em situações mais realistas.

Pense em uma disputa de preços entre comerciantes, por exemplo: Um deles pode pensar que é mais vantajoso reduzir um pouco seu preço para ganhar clientes do outro e faturar mais em volume. Mas se ambos seguirem essa linha e abaixarem seus preços, nenhum deles vai ter um preço mais baixo que o outro para ganhar mais clientes. E sem novos clientes, eles só tem a perder, pois o preço de cada venda será menor.

No mundo real, também são raras as situações que tenham apenas dois agentes. Em geral, existem várias partes envolvidas, cujas ações de cada uma afetam o resultado geral, e elas também podem ser modeladas como um dilema do prisioneiro.

As propagandas no espaço urbano são um outro exemplo comum. Quando uma empresa quer chamar atenção dos clientes, ela coloca anúncios grandes e chamativos. Só que toda empresa quer chamar atenção, assim a tendência é que todas elas coloquem anúncios cada vez maiores e mais coloridos que os das concorrentes, e logo todos os anúncios na cidade são enormes, brilhantes e custaram uma fortuna.

Anúncios na Times Square
Não dá para chamar atenção na Times Square sem usar a estratégia dominante, porque todos lá a usam.

No entanto, por competirem com outros anúncios majestosos dos concorrentes, eles mal conseguem se distinguir um do outro, muito menos chamar um pouco de atenção dos clientes e converter em vendas. Apesar do alto investimento, eles se mostram bem pouco efetivos, o que em termos de custo-benefício é um péssimo negócio. Isso acontece porque todas as empresas seguiram a estratégia dominante de aumentar o tamanho do seu próprio anúncio.

A Guerra Fria é considerada outro exemplo de dilema do prisioneiro: Os Estados Unidos e União Soviética, na hora de fazer investimentos militares, se viram diante de uma estratégia dominante bastante clara: Aumentar seus recursos bélicos até ultrapassar os do inimigo. E fazer questão de deixar isso claro a ele. Ele vai pensar duas vezes antes de o atacar.

Mas se ambos têm condições de equiparar seu poder de fogo, a estratégia dominante é uma escolha possível para os dois lados. O resultado é que os dois países começaram a disputar quem estava mais preparado para uma possível guerra, e assim surgiu o que nós conhecemos como corrida armamentista.

Anúncios na Times Square
Armas nucleares dos EUA e URSS. Os dois decidiram que reduzir seu poder de fogo era a melhor opção para ambos os lados. Gráfico: Wikipedia.

Em um determinado momento, ambas as nações estavam tão bem armadas que um conflito inevitavelmente levaria a perdas significativas para os dois lados. Nesse ponto ficou claro que, para ambas, aumentar seu poder militar não era a melhor opção. Aquilo que parece ser a melhor escolha individual, assim como no dilema do prisioneiro, não é a melhor escolha a ser feita.

Na verdade, um jogo é um modelo simplificado de uma situação 2 ou mais participantes interagem entre si de forma que o conjunto de suas ações define o destino de todos. E o dilema é um jogo onde os jogadores têm a opção de cooperar para obter o melhor resultado para o grupo ou trair para obter o melhor resultado para si.

E por isso ele pode ser visto em diversas situações do mundo real, de interações entre empresas, países ou organizações, até relações amorosas, de emprego, competições, entre outras interações entre indivíduos.


Múltiplas partidas

Até então, o dilema era considerado uma contradição insolúvel, até que o cientista político Robert Axelrod se perguntou: E se repetirmos o jogo à exaustão?

Então ele criou um torneio: Bolou um campeonato que consiste em várias partidas do jogo contra diferentes oponentes e convidou colegas acadêmicos para participarem enviando estratégias, que seriam rodadas por um programa de computador.

Matriz de representação gráfica do dilema do prisioneiro invertido para o uso em múltiplas partidas
O mesmo dilema, mas com as opções invertidas: Quanto mais pontos, melhor.

Cada disputa dava uma certa quantidade de pontos, na mesma proporção dos anos de prisão, mas agora o objetivo, ao invés de ficar menos tempo na prisão, era acumular mais pontos ao final de várias rodadas. Basicamente o mesmo dilema, mas com as escolhas invertidas.

A grande sacada é que nessas partidas, os participantes sabiam, ao final de cada jogo, quais foram as escolhas dos adversários nos jogos anteriores. Isso foi o que abriu várias possibilidades de estratégias diferentes, que se baseavam nas escolhas prévias do oponente.

Exemplos de resultados parciais do acúmulo de pontos em uma amostra de múltiplas partidas do dilema do prisioneiro
Com múltiplas partidas, o objetivo de cada estratégia é somar mais pontos no final.

Por exemplo, uma estratégia poderia considerar que se um oponente cooperou 5 vezes seguidas, ele está cooperando sempre, e então começar a trair sempre, pois é a melhor escolha contra cooperar  —  novamente, não há nenhum julgamento moral aqui, “trair” faz parte do jogo e o que vale é a quantidade de pontos recebidos. Outra pode analisar os últimos passos do oponente e com isso calcular com qual probabilidade ele trai ou coopera, agindo de acordo.

Algumas estratégias enviadas eram algoritmos enormes, que faziam várias análises complexas nos movimentos passados do adversário para tentar descobrir qual será sua próxima escolha. Uma delas, ao contrário, fazia escolhas completamente aleatórias.

Mas entre todas uma se destacou: Enviada pelo matemático russo Anatol Rapoport, ela era tão simples que foi escrita em apenas quatro linhas de código, e pode ser resumida da seguinte forma: Comece cooperando, e em seguida faça tudo o que o oponente fez na rodada anterior. Se ele cooperou, coopere na próxima. Se ele traiu, traia na próxima. Por ser basicamente uma cópia das ações do adversário, ela foi chamada de “Tit for Tat”, ou, em bom português, Olho por Olho.

Representação gráfica do funcionamento da estratégia olho por olho
Olho por olho pode ser entendida por um diagama simples.

O que ela tem de tão especial? Apesar da simplicidade, no final do torneio, ela foi a que acumulou mais pontos entre todas. Surpreso? Axelrod também ficou. E por isso, pouco depois, ele resolveu organizar outro torneio e desafiar mais acadêmicos.

Dessa vez o objetivo era bem claro: Derrotar a olho por olho. Participaram cientistas de toda a parte do mundo, e o número de estratégias inscritas quadruplicou, mas, no final, por mais que todos conhecessem seus pontos fracos, novamente ninguém conseguiu derrotar a olho por olho e ela se tornou bi-campeâ.

Como isso é possível?


O que está em jogo

Os estudiosos analisaram várias características da estratégia para tentar explicar seu sucesso. Uma delas é que ela reage rapidamente às ações do oponente. Ela é vingativa se ele trai, mas ela também perdoa se ele volta a cooperar.

Mas a característica mais interessante é a gentileza. Ela começa cooperando, e continua assim até que o outro traia primeiro. Só então ela reage. E, com isso, assim como a estratégia dominante do dilema do prisioneiro original, nós corremos o risco de fazer uma análise errada se limitarmos o nosso campo de visão: Racionalmente, pelo própria natureza gentil da olho por olho, é impossível que ela ganhe uma partida. Isto é, não importa o que aconteça, ela nunca fará mais pontos que cada um de seus adversários.

Desse ponto de vista, ela não parece muito promissora. E ainda assim ela foi a campeã. Duas vezes. Sem ter vencido sequer um oponente.

Quando as outras estratégias jogam contra a olho por olho, elas invariavelmente vencem e ganham mais pontos, que lhes dão uma vantagem parcialmente, mas quando elas são colocadas umas contra as outras, elas acabam com perdas significativamente maiores, que lhes custam o resultado final.

O maior mérito da olho por olho é que ela joga bem contra qualquer outro jogador. Se ele é mais agressivo, ela será mais vingativa. Se ele cooperar mais, ela jogará mais limpo.

Ela nunca tenta tirar vantagem, e, acima de tudo, ela otimiza o máximo os ganhos para os dois lados, ainda que isso implique que no final o adversário vai ganhar mais que ela. Mas isso não importa, pois ela garantiu que houve a maior distribuição de ganhos nessa interação. E na próxima. E na seguinte. E apenas ela participou de todas essas partidas mais proveitosas.

Jogar olho por olho é deixar de olhar apenas os resultados imediatos e, ao invés disso, fazer uma análise do que está em jogo a longo prazo. Trata-se de deixar sempre o outro jogador ganhar, enquanto se beneficia da forma mais proveitosa possível. É como perder todas as batalhas para, finalmente, vencer a guerra.

E para isso, a melhor escolha é estar aberta a fazer aquilo que dê os melhores benefícios mútuos, mesmo que correndo os maiores riscos. Mas não cegamente: Se for traída, retalhe. E ainda assim, esteja pronta para perdoar e voltar ao arriscado jogo de ganhos compartilhados quando o outro quiser.

Parece uma ideia suicida? Mas é: É a única que você vai sempre perder. Mas é aquela em que você tem mais a ganhar. Qual a sua escolha?

Categoria: 

Comentar