sábado, 23 de agosto de 2008

Dilema do Prisioneiro


O dilema do prisioneiro é um problema da teoria dos jogos e um exemplo claro, mas atípico, de um problema de soma não nula. Neste problema, como em outros muitos, supõe-se que cada jogador, de modo independente, quer aumentar ao máximo a sua própria vantagem sem lhe importar o resultado do outro jogador.


Em jogo de soma-zero o beneficio total para todos os jogadores, para cada combinação de estratégias, sempre somam zero (ou falando mais informalmente, um jogador só lucra com base no prejuízo de outro). O Poker exemplifica um jogo de soma zero (ignorando possíveis vantagens da mesa), porque o vencedor recebe exatamente a soma das perdas de seus oponentes. A maioria dos jogos clássicos de tabuleiro é de soma zero, incluindo o Xadrez. Muitos dos jogos estudados pelos pesquisadores da teoria dos jogos são jogos de soma não nula, porque algumas saídas têm resultados combinados maior ou menor que zero. Informalmente, em jogos de soma diferente de zero, o ganho de um dos jogadores não necessariamente corresponde à perda dos outros.É possível transformar qualquer jogo em um jogo de soma zero pela adição de jogadores espúrios (freqüentemente chamados de o tabuleiro), para o qual as perdas compensam o total alcançado pelos vencedores.

As técnicas de análise da teoria de jogos padrão - por exemplo determinar o equilíbrio de Nash - podem levar cada jogador a escolher trair o outro, mas curiosamente ambos os jogadores obteriam um resultado melhor se colaborassem. Infelizmente (para os prisioneiros), cada jogador é incentivado individualmente para defraudar o outro, mesmo após lhe ter prometido colaborar. Este é o ponto-chave do dilema.


O Equilíbrio de Nash representa uma situação em que, em um jogo envolvendo dois ou mais jogadores, nenhum jogador tem a ganhar mudando sua estratégia unilateralmente. Se cada jogador escolheu sua estratégia, e nenhum deles pode se beneficiar apenas pela alteração de sua estratégia enquanto os demais jogadores conservam as deles, então as escolhas estratégicas e as penalizações do jogo configuram um "equilíbrio de Nash". (à esquerda o matemático John Nash)

No dilema do prisioneiro iterado, a cooperação pode obter-se como um resultado de equilíbrio. Aqui joga-se repetidamente, pelo que, quando se repete o jogo, oferece-se a cada jogador a oportunidade de castigar ao outro jogador pela não cooperação em jogos anteriores. Assim, o incentivo para defraudar pode ser superado pela ameaça do castigo, o que conduz a um resultado melhor, cooperativo.

O dilema do prisioneiro foi originalmente formulado por Merrill Flood e Melvin Dresher enquanto trabalhavam na RAND em 1950. Mais tarde, Albert W. Tucker fez a sua formalização com o tema da pena de prisão e deu ao problema geral esse nome específico. O dilema do prisioneiro (DP) dito clássico funciona da seguinte forma:
"Dois suspeitos, A e B, são presos pela polícia. A polícia tem provas insuficientes para os condenar, mas, separando os prisioneiros, oferece a ambos o mesmo acordo: se um dos prisioneiros, confessando, testemunhar contra o outro e esse outro permanecer em silêncio, o que confessou sai livre enquanto o cúmplice silencioso cumpre 10 anos de sentença. Se ambos ficarem em silêncio, a polícia só pode condená-los a 6 meses de cadeia cada um. Se ambos traírem o comparsa, cada um leva 5 anos de cadeia. Cada prisioneiro faz a sua decisão sem saber que decisão o outro vai tomar, e nenhum tem certeza da decisão do outro. A questão que o dilema propõe é: o que vai acontecer? Como o prisioneiro vai reagir?"
O fato é que pode haver dois vencedores no jogo, sendo esta última solução a melhor para ambos, quando analisada em conjunto. Entretanto, os jogadores confrontam-se com alguns problemas:
Confiam no cúmplice e permanecem negando o crime, mesmo correndo o risco de serem colocados numa situação ainda pior, ou confessam e esperam ser libertados, apesar de que, se ele fizer o mesmo, ambos ficarão numa situação pior do que se permanecessem calados?
Um experimento baseado no simples dilema encontrou que cerca de 40% de participantes cooperaram (i.e., ficaram em silêncio).
Em abstrato, não importa os valores das penas, mas o cálculo das vantagens de uma decisão cujas conseqüências estão atreladas às decisões de outros agentes, onde a confiança e traição fazem parte da estratégia em jogo.
Casos como este são recorrentes na economia, na biologia e na estratégia. O estudo das táticas mais vantajosas num cenário onde esse dilema se repita é um dos temas da teoria dos jogos.

Nenhum comentário: