Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

Jogos de Empresas

No description
by

Splicenet Servicos

on 8 December 2014

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Jogos de Empresas

Jogos de Empresas
Porque a redução no preço provoca aumento nas vendas?
Suponha que uma barra energética seja inicialmente vendida por U$ 3 e seu preço diminua para $ 1,50. Isto estimula as pessoas a substituirem as bebidas energéticas por barras energéticas (efeito substituição). Como o orçamento fica mais folgado devido ao preço mais baixo, as pessoas compram mais unidades (efeito renda). A quantidade vendida de barras energéticas aumenta por essas duas razões.
Ao contrário, uma barra energética que seja inicialmente vendida por $ 3 tem seu preço aumentado para $ 6. As pessoas passarão a comprar menos barras energéticas e mais bebibas energéticas (efeito substituição). Diante de um orçamento mais apertado, as pessoas compram ainda menos barras energéticas (efeito renda). A quantidade demandada de barras energéticas diminui por duas razões.
Será que todos os bens tem a mesma elasticidade da demanda? Vejamos...
O que faz a demanda por alguns bens ser elástica e a demanda por outros bens ser inelática?
A magnitude da elasticidade da demanda depende dos seguintes fatores:
• Proximidade de bens substitutos.
• Proporção da renda gasta com o bem.
Proximidade de bens substitutos
Quanto mais próximos forem os bens ou serviços substitutos, mais elástica é a demanda por eles. Por exemplo, o petróleo, utilizado para produzir a gasolina, tem bens substitutos, mas, no presente momento, nenhum que seja muito próximo (imagine um carro movido a vapor ou a carvão). Desta maneira, a demanda por petróleo é inelástica. Já os plásticos são substitutos próximos dos metais, de modo que a demanda por metais é elástica.
Em linguagem cotidiana, chamamos alguns bens, como alimentação e moradia, de bens essenciais e outros, como férias em lugar exótico, de bens de luxo. Um bem essencial é aquele que tem substitutos ruins e é fundamental para nosso bem-estar. Desta maneira, geralmente um bem essencial tem uma demanda inelástica. NaTabela 4.1, alimentação e petróleo podem ser classificados como bens essenciais.
Um bem de luxo é aquele que normalmente tem muitos substitutos, entre os quais está a opção de não comprá-lo. Desta maneira, um bem de luxo em geral tem demanda elástica. Na Tabela 4.1, móveis e veículos motorizados podem ser classificados como bens de luxo.
Proporção da renda gasta com o bem
Pense em sua própria elasticidade da demanda por
chicletes
e
moradia
. Se o preço dos chicletes dobra, você continua a consumir praticamente a mesma quantidade de chicletes que antes - sua demanda por chicletes é inelástica. Se o aluguel de seu apartamento dobra, você se assusta e procura mais estudantes para dividir as acomodações com você - sua demanda por moradia é mais elástica do que sua demanda por cicletes.
O que explica essa diferença?
A moradia representa uma grande proporção de seu orçamento, e os chicletes representam uma proporção muito pequena. Você não gosta de nenhum dos dois aumentos de preço, mas mal percebe o preço mais alto do chiclete, enquanto o aluguel mais elevado deixa seu orçamento bastante apertado.
À medida que a renda aumenta e a proporção da renda gasta em alimentação diminui, a demanda por alimentos se torna menos elástica.
Quanto maior é a proporção da renda gasta em alimentação, maior é a elasticidade-preço da demanda por alimentação. Por exemplo, na Tanzânia, um país no qual a renda média representa 3,3 por cento da renda média nos Estados Unidos e onde 62 por cento da renda média é gasta em alimentos, a elasticidade-preço da demanda por alimentação é de
0,77
. Em comparação, nos Estados Unidos, onde 12 por cento da renda é gasta em alimentos, a elasticidade-preço da demanda por alimentação é de
0,12
Diferenciação do produto
Uma empresa pratica a
diferenciação
do produto se faz um produto ligeiramente diferente daqueles das empresas concorrentes.
Por exemplo, as empresas Adidas, Asics, Diadora, Etonic, Fila New Balance, Nike, Puma e Reebok produzem tênis de corrida diferenciados. Com todos os outros fatores mantidos constantes, se o preço dos tênis de corrida da Adidas aumenta e os preços dos outros tênis permanecem constantes, a Adidas vende menos calçados, e os outros fabricantes vendem mais.
A diferenciação do produto permite que uma empresa concorra com outras em três áreas:
Qualidade
A qualidade de um produto consiste nos atributos físicos que o tornam diferente dos produtos de outras empresas. A qualidade inclui o design, a confiabilidade, o serviço prestado ao comprador e a facilidade do acesso do comprador ao produto. A qualidade pode ser medida em uma escala que vai de alta a baixa.
Alguma empresas - Dell Computer Corp. - oferecem produtos de alta qualidade. Todos são confiáveis e bem projetados, e o cliente recebe um serviço rápido e eficiente. outras empresas oferecem um produto de qualidade mais baixa, não tão bem projetado, que pode não funcionar perfeitamente e que requer que o comprador se desloque para adquiri-lo.
Uma empresa que faz um produto de alta qualidade pode cobrar um preço mais alto que o de uma empresa que faz um produto de qualidade inferior.
O marketing assume duas formas principais: propaganda e embalagem. Uma empresa que faz um produto de alta qualidade deseja vendê-lo por um preço adequadamente alto. Para isso, ela deve anunciar e embalar seu produto de um modo que convença os compradores de que estão obtendo a masi alta qualidade, pela qual estão pagando um preço superior.
Por exemplo, empresas farmacêuticas anunciam e embalam seus medicamentos que têm nome de marca para persuadir os compradores de que esses itens são superiores às alternativas genéricas de preço mais baixo. Similarmente, um produtor de baixa qualidade utiliza a propaganda e a embalagem para convencer os compradores de que, apesar de a qualidade ser baixa, o preço inferior mais do que compensa o fato.
A propaganda e outros esforços de venda alteram a demanda pelo produto de uma empresa. Mas como? A demanda aumenta ou diminui?
A resposta mais natural é que a propaganda aumenta a demanda. Ao informar as pessoas sobre a qualidade de seus produtos ou a persuadi-las a trocar os produtos de outras empresas pelos seus, uma empresa pode esperar aumentar a demanda por seus próprios produtos.
Alguns anúncios, como os da câmera Maria Sharapova da Canon na televisão e em entrevistas, ou as enormes quantias que a Coca-Cola e a Pepsi gastam parecem difíceis de entender. Não parece haver nenhuma informação concreta sobre uma câmera no sorriso cintilante de uma jogadora de tênis. Por outro lado, certamente todos já conhecem a Coca-Cola e a Pepsi. Qual é a vantagem de gastar milhões de dólares por mês na propaganda desses refrigerantes já conhecidos?
Uma resposta é que a propaganda é um sinal ao consumidor de um produto de alta qualidade. Um sinal é uma ação que uma pessoa (ou empresa) informada realiza para enviar uma mensagem a pessoas não informadas. Pense sobre dois refrigerantes de cola: a Coca-Cola e a Oka-Kola. A Oka-Kola sabe que seu refrigerante não é muito bom e que o sabor varia muito dependendo do lote barato de xarope que sobra para a empresa comprar a cada semana.
Desta maneira, a Oka-Kola sabe que, apesar de a propaganda conseguir fazer com que muitas pessoas experimentem seu refrigerante, elas rapidamente descobririam que se trata de um produto ruim e voltariam a comprar o refrigerante que consumiam antes. A Coca-Cola, por outro lado, sabe que seu produto tem um sabor consistente de alta qualidade e que, uma vez que os consumidores o experimentem, há boas chances de eles nunca consumirem outro refrigerante. Com base nesse raciocínio, a Oka-Kola não faz propaganda, mas a Coca-Cola faz. A Coca-Cola gasta muito dinheiro para fazer um grande alarde.
Os consumidores de refrigerantes de cola que vêem os anúncios chamativos da Coca-Cola sabem que a empresa não gastaria tanto dinheiro em propaganda se o produto não fosse verdadeiramente bom. Assim, os consumidores inferem que a Coca-Cola é de fato um produto muito bom. O anúncio dispendioso e extravagante sinaliza que a Coca-Cola é excelente sem dizer nada sobre o produto.
Observe que, se a propaganda é um sinal, ela não precisa transmitir nenhuma informação específica sobre o produto. Ela só precisa ser cara e muito veiculada. É por isso que muitas propagandas são parecidas umas com as outras. Assim, a teoria da sinalização da propaganda prevê grande parte da propaganda que chega até nós.
Na medida em que a propaganda e os nomes de marca proporcionam aos consumidores informações sobre a natureza exata das diferenças entre produtos e sobre a qualidade do produto, eles beneficiam o consumidor e permitem uma melhor escolha de produtos.
A Teoria dos Jogos
Os economistas utilizam um conjunto de ferramentas chamado Teoria dos Jogos para estudar mercados em livre concorrencia…

A Teoria dos Jogos foi criada por John Von Newmam em 1937 e ampliada por Oscar Morgensterm em 1944. Hoje em dia ela representa um dos principais campos de pesquisa no estudo da economia…
“ O que você faria no lugar deles ? ”
Para prever esse resultado, utilizamos o conceito de equilíbrio proposto por John Nash da Universidade de Princeton, que recebeu o Prêmio Nobel de Economia em 1994 e retratado por Russel Crowel no filme "Uma mente brilhante" em 2009.
E qual é a utilidade prática disso tudo?
O dilema dos prisioneiros é uma formulação abstrata de algumas situações muito comuns nas quais a deserção é estimulada:
O melhor exemplo disso é a tentativa de se estabelecer um acordo de preços em um mercado com poucos fornecedores (oligopólio)
Por exemplo, no longo prazo interessa a todos os fabricantes de computadores estabelecer um precó mais elevado para seus produtos… De tempos em tempos porém, um indivíduo cede à tentação de ganhar uma fortuna do dia para a noite e baixa seus preços… De imediato, seus vizinhos seguem o exemplo, e uma onda de descontos se espalha.
Veja por exemplo o que aconteceu em 2006…
DELL X HP
EEE - Estratégia Evolutivamente Estável
Quando se disputa o dilema dos prisioneiros uma única vez, ambos os jogadores sabem que a melhor opção para cada um é TRAIR…
O que ocorre quando essa jogada é repetida inúmeras vezes?
As jogadas sucessivas poderiam dar a eles a oportunidade de desenvolver a confiança no adversário… de responder na mesma moeda uma deserção… de buscar uma conciliação futura…
Num jogo infinitamente longo o que interessa é a possibilidade de ambos ganharem às custas da banca, no lugar de apenas um ganhar, à custa do outro.
Foi John Maynard Smith quem primeiro introduziu o conceito de EEE - Estratégia Evolutivamente Estável
Se B for um
elefante-marinho
possuidor de um grande harém cheio de fêmeas, e se eu, outro elefante-marinho, puder me apoderar desse harém, matando-o, pode ser uma boa idéia tentar fazê-lo. Existem contudo riscos, na belicosidade. Para B, seria vantajoso contra-atacar e defender a sua valiosa propriedade. Se eu começar uma luta, tenho a mesma probabilidade que ele de morrer. Ou talvez tenha, até mesmo, uma probabilidade maior.
B detém um recurso valioso e é por isso que quero lutar com ele. Ma por que é que ele o possui? Talvez porque o tenha conquistado num combate. Provavelmente já venceu outros desfiantes antes de mim. Desse modo, é muito provável que seja um bom lutador. Ainda que eu vença a luta e me apodere do harém, pode ser que sais tão ferido que não seja mais possível desfrutas os benefícios da minha vitória. Além disso, a luta consome tempo e energia. Talvez seja melhor conservá-los por enquanto.
Se eu me concentrar em me alimentar bem e evitar problemas durante algum tempo, ficarei maior e mais forte. No final das contas, irei lucar com ele pelo harém, mas minhas chances de derrotá-lo serão mais efetivas.
Os benefícios potenciais não estão todos do lado da opção de lutar. Do mesmo modo, durante a luta, cada decisão tática relativa à sua intensificação ou moderação apresenta custos e benefícios que poderiam, em princípio, ser analisados.
Independente do que o outro jogador faça a melhor opção é
TRAIR SEMPRE!
E no entanto, cada um deles sabe muito bem que bastaria ter cooperado para que alcançassem uma recompensa de $ 300 pela cooperação mútua.
… é por isso que o jogo merece o nome de
"DILEMA"
qualidade
preço
marketing do produto.
Suponha que existem apenas dois tipos de estratégia de luta numa população de elefantes marinhos, a
estratégia de falcão
e a
estratégia de pombo
. (Os nomes se referem ao uso convencional que os humanos fazem deles e não têm conexão alguma com os hábitos das aves das quais foram derivados: os pombos, na realidade, são aves bastante agressivas.) Todo indivíduo da nossa população hipotética é classificado como falcão ou como pombo.
Os falcões lutam sempre da forma o mais dura e agressiva possível, e só se retiram do embate quando seriamente feridos. Os pombos limitam-se a fazer ameaças convencionais, sem ferir o adversário. Se um falcão luta contra um pombo, este último logo bate em retirada e, desse modo, não é ferido. Se um falcão luta contra outro falcão, o combate prossegue até que um deles seja gravemente ferido ou morto.
Se um pombo se encontra com outro pombo
, ninguém sai machucado;
eles se ameaçam mutuamente
durante um longo tempo, até que um dos contendores se canse ou decida não importunar mais o outro e se retire. Por enquanto, estamos assumindo que não há como o indivíduo saber de antemão se um determinado rival é um falcão ou um pombo. Ele só descobre isso ao lutar contra ele, uma vez que não conta com nenhuma recordação de lutas passadas com outros indivíduos que possa guiá-lo.
Agora, arbitrariamente, vamos atribuir
"pontos"
aos competidores. Por exemplo, 50 pontos por vitória, 0 por uma derrota, -100 por ter sido gravemente ferido e -10 por ter desperdiçado tempo com um combate longo. Podemos pensar nesses pontos como se fossem diretamente convertíveis na moeda corrente da sobrevivência dos genes. Um indivíduo que obtenha uma pontuação alta, que alcance um "ganho" médio elevado, é um indivíduo que garante a sobrevivência de muitos dos seus genes no
pool gênico.
O importante é que nós
não
estamos interessados em saber se os falcões tendem a derrotar os pombos quando em luta contra eles. Já sabemos a resposta: os falcões ganham sempre. O que queremos saber é se o falcão e o pombo são estratégias evolutivamente estáveis.
Vamos supor que temos uma população constituída inteiramente por pombos. Sempre que eles lutam, ninguém sai ferido. Os combates consistem em torneios rituais prolongados, talvez desafios de olhares, que só terminam quando um dos rivais desiste.
O vencedor ganha então 50 pontos por ter se apoderado do bem em disputa, mas perde 10 por ter desperdiçado tempo num prolongado desafio de olhares, de maneira que, no total, obtém 40 pontos. Também o perdedor é penalizado com 10 pontos pelo desperdício de tempo. Em média, qualquer pombo individual pode esperar vencer a metade das suas lutas e perder a outra metade. Portanto, o ganho médio por combate está na média entre +40 e -10, ou seja, +15. Assim, cada um dos pombos de uma população de pombos parece sair-se bastante bem.
Imagine agora que surge um falcão mutante nessa população. Como ele é o único falcão existente, todas as suas lutas serão contra um pombo. Os falcões sempre vencem os pombos, de forma que ele marca 50 pontos em todos os combates, e esse será o seu ganho médio. Ele desfruta de enorme vantagem sobre os pombos, cujo ganho líquido é de apenas 15 pontos. Como decorrência, os genes do falcão se disseminarão rapidamente pela população.
A esta altura, porém o falcão já não pode ter a certeza de que todo adversário que encontrar será um pombo. Para dar um exemplo extremo, se o gene do falcão disseminar-se com tanto sucesso a ponto de a população se tornar inteiramente constituída por falcões,
todos os combates se darão entre falcões
. As coisas se mostrariam bem diferentes.
Quando dois falcões se encontram, um deles sai seriamente ferido, o que o leva a perder 100 pontos, enquanto o vencedor ganha 50. Cada falcão, numa população de falcões, pode esperar vencer metade das suas lutas e perder a outra metade. Seu lucro médio será, por conseguinte, a média entre +50 e -100, ou seja, -25.
Agora considere um único pombo numa população de falcões. Não há dúvidas de que ele perde todos os combates em que se envolva, mas, em compensação, nunca sai ferido. Seu ganho médio é zero, ao passo que o ganho médio de um falcão numa população de falcões é -25. Os genes do pombo tenderão, portanto, a espalhar-se pela população.
O modo como contei a história dá a impressão de que haverá uma oscilação contínua na população. Os genes do falcão ascenderão rapidamente; depois, em consequência de os falcões se encontrarem em maioria, os genes do pombo de novo se colocarão em vantagem e aumentarão em número até que os genes do falcão comecem uma vez mais a prosperar, e assim por diante. Entretanto, uma oscilação como essa não precisa necessariamente ocorrer.
Há uma proporção entre falcões e pombos que é estável. No sistema de pontuação arbitrário que estamos utilizando, a proporção estável, se a calcularmos, será de 5/12 pombos para 7/12 falcões. Quando ela for atingida, o ganho médio dos falcões será exatamente igual ao dos pombos. Portanto, a seleção não favorecerá nenhum deles em relação ao outro. Se o número de falcões na população começasse a subir de tal maneira que a sua proporção deixasse de ser 7/12, então os pombos obteriam ligeira vantagem e a proporção oscilaria de volta ao seu estado de equilíbrio.
Do mesmo modo como veremos que a proporção estável entre os sexos é de cinquenta para cinquenta, a proporção estável dos pombos em relação aos falcões, neste exemplo hipotético, é de sete para cinco. Em ambos, se existirem oscilações em relação ao ponto de estabilidade, não serão muito grandes.
É verdade que todos se sairiam melhor num grupo só de pombos do que num grupo constituído nos termos de uma EEE. Infelizmente, numa conspiração de pombos, um único falcão seria tão bem-sucedido que nada poderia deter a evolução dos falcões. A conspiração estaria, portanto, fadada a ser destruída por uma traição vinda do interior da população.
Uma
EEE
é estável não porque seja particularmente boa para os indivíduos que dela participam, mas simplesmente porque é imune à traição de dentro da população.
O falcão e o pombo não são as únicas possibilidades. Uma estratégia mais complexa, introduzida por J. Maynard Smith e G. R. Price, é chamada de
Retaliador
.
Um retaliador se comporta como um pombo no início de cada luta. Ou seja, ele não ataca com ferocidade máxima, como um falcão, mas faz uso convencional de ameaças na sua disputa.
Entretanto, se o adversário o ataca, ele retalia. Em outras palavras, um
Retaliador
comporta-se como um falcão quando é atacado por um falcão, e comporta-se como um pombo quando diante de um pombo.
Outro estrategista é o
Fanfarrão
. Um fanfarrão comporta-se como um falcão até que alguém contra-ataque; então,
foge imediatamente.
Há ainda outro: o
Sondador-Retaliador
. Um sondador-retaliador é basicamente como um retaliador, porém em certas ocasiões ele experimenta lutar um pouco mais violentamente. Se o adversário não revida, ele persiste num comportamento semelhante ao do falcão. Se, por outro lado, o oponete contra-ataca, ele retorna à disputa de ameaças convencional, comportando-se como um pombo. Se é atacado, contra-ataca, exatamente como um retaliador.
O pombo não é estável, pois uma população de pombos seria invadida por falcões e por fanfarrões. O falcão não é estável porque uma população de falcões seria invadida por pombos e por fanfarrões. O fanfarrão tampouco o é, visto que uma população de fanfarrões seria invadida pelos falcões.
Uma população de retaliadores não seria invadida por nenhuma outra estratégia, uma vez que não existe estratégia mais bem-sucedida do que a deles. O pombo, contudo, se sai igualmente bem numa população de retaliadores. Isso significa que, o número de pombos poderia elevar-se pouco a pouco. Mas, se o número de pombos subisse significativamente, os falcões e os fanfarrões começariam a ficar em posição vantajosa, já que se saem melhor contra os pombos do que os retaliadores.
Essa conclusão teórica não está muito longe daquilo que de fato acontece com a maioria dos animais selvagens.
Suponha que tais indivíduos
calculassem de antemão
o tempo exato que, valeria um determinado bem, como uma fêmea, por exemplo. Um indivíduo mutante que estivesse disposto a perseverar um pouquinho mais venceria sempre. Essa estratégia seria vantajosa numa população em que a maioria dos licitantes abandonasse a disputa logo após seu início.
É óbvio que, na guerra de atrito, é vital que os indivíduos
não forneçam
nenhuma pista sobre o momento em que irão desistir. Aquele que traísse a si mesmo, revelando, pelo mais leve tremular dos bigodes, que estava começando a pensar em entregar os pontos, de pronto se veria em desvantagem.
Se, por exemplo, o tremor dos bigodes fosse um sinal confiável de que a retirada se daria um minuto depois, a estratégia para vencer seria muito simples: "Se o bigode do seu adversário tremer, espere mais um minuto, independentemente dos seus planos anteriores sobre o momento de desistir. Se os bigodes do seu oponete ainda não tremeram e você estiver a um minuto do momento em que tinha de fato a intenção de desistir, então desista agora mesmo e não perca mais tempo. Nunca deixe seus próprios bigodes tremerem".
Assim, a seleção natural rapidamente penalizaria o tremular dos bigodes e todas as pistas análogas sobre o comportamento futuro. A expressão impassível dos jogadores de pôquer se desenvolveria.
Mas por que a expressão impassível, no lugar de mentiras descaradas?
Porque, mais uma vez, a mentira não é estável.
COOPERAR E TRAIR…
QUAL ESTRATÉGIA ACUMULA MAIS PONTOS?

"Uma
EEE
(Estratégia Evolutivamente Estável) é estável não porque seja particularmente boa para os indivíduos que dela participam, mas simplesmente porque é imune à traição de dentro da população"
Suponha que um jogador siga a estratégia de sempre desertar (
SEMPRE D
)…
Se outro jogador nunca cooperar, o melhor à fazer é sempre desertar.
Na sequencia o
SEMPRE D
enfrenta
OLHO POR OLHO
, que coopera na primeira jogada e depois faz o mesmo que o outro fez na jogada anterior.
A primeira pergunta que se faz é
"Qual é a melhor estratégia?"
Esta foi a tarefa que
Robert Axelrod
impôs a si mesmo. Ele teve a idéia divertida de lançar uma competição e solicitou, num anúncio, que os especialistas em teoria dos jogos inscrevessem suas estratégias. Quatorze estratégias foram apresentadas. Axelrod acrescentou uma 15ª que chamou de
"ACASO"
e que se limitara a
COOPERAR
e
TRAIR
aleatoriamente, servindo como uma espécie de linha de base: se uma estratégia não conseguir se sair melhor do que
ACASO
, será necessariamente muito ruim.
Robert Axelrod
Axelrod traduziu todas as quinze estratégias numa linguagem de programação comum e lançou-as umas contra as outras num computador potente. Cada estratégia foi escalada para jogar o
"Dilema do Prisioneiro Iterativo"
contra todas as outras estratégias (inclusive contra uma cópia de si mesma). Como eram quinze, havia 15 x 15, ou seja, 225 jogos separados acontecendo no computador.
Quando cada dupla de opositores tivesse completado duzentas partidas, os pontos eram totalizados e definia-se o vencedor.
Não nos interessa saber que estratégia venceu qual oponente em particular. O que nos importa saber é qual estratégia acumulou mais
"dinheiro"
no somatório dos quinze emparelhamentos.
"Dinheiro"
significa simplesmente
"pontos"
.
A pontuação máxima que uma estratégia podeia atingir era 15 mil pontos (duzentas partidas a 5 pontos por partida, para cada um dos quinze oponentes). A pontuação mínima era zero. Não é preciso dizer que nenhum dos dois extremos se concretizou. A pontuação que uma estratégia pode esperar ganhar, em termos realistas, na média dos seus quinze emparelhamentos, não deve ultrapassar muito os 600 pontos.
O notável é que a estratégia vencedora era a mais simples e, à primeira vista, a menos inventiva de todas. Chamava-se
"Olho por Olho"
e foi apresentada pelo professor Anatol Rapoport, um psicólogo e teórico dos jogos de Toronto bastante conhecido. Olho por Olho cooperava na partida e, da segunda em diante, simplesmente copiava o movimento anterior do adversário.
Suponhamos, em primeiro lugar, que outro jogador seja igualmente Olho por Olho. Os dois jogadores começam cooperando. Na rodade seguinte, cada um deles copia o movimento precedente do outro, que foi
COOPERAR
. Ambos continuam a
COOPERAR
até o final do jogo e terminam com pontuação máxima de 100%, os 600 pontos que eram a marca de referência.
Imaginemos agora olho por Olho joga contra uma estratégia chamada
"Sondador Ingênuo"
.
Ela é basicamente idêntica a Olho por Olho, exceto pelo fato de que, de quando em quando, digamos, uma vez em cada 10 partidas, ao acaso, ela trai gratuitamente e obtêm a pontuação elevada da Tentação. Até que Sondador Ingênuo experimente uma das suas traições de sondagem, os jogadores são exatamente como doi Olho por Olho.
Inicia-se uma sequência longa e mutuamente lucrativa de cooperação, com uma pontuação confortável de 100% da marca de referência para ambos os jogadores. Mas, subtamente, sem nenhum aviso, digamos que na oitava partida, Sondador Ingênuo joga
TRAIR
. Olho por Olho, é claro, jogou
COOPERAR
, e portanto fica com o ganho do trouxa, que é zero. Sondador Ingênuo parece ter se saído bem, uma vez que obteve 5 pontos.
Mas, na partida seguinte, Olho por Olho
"retalia"
. Seguindo sua regra de imitar o movimento precedente do outro jogador, ele joga
TRAIR
. Sondador Ingênuo, enquanto isso, segue cegamente a sua própria regra de cópia e, portanto, copia o movimento anterior do seu adversário,
COOPERAR
. Agora é a vez dele ficar com o ganho do trouxa, ao passo que Olho por Olho conquista a pontuação máxima de 5 pontos.
Na partida seguinte, Sondador Ingênuo retalia - embora possamos pensar que injustamente - pela traição de Olho por Olho. E, assim, a alternância entre os dois continua. Durante esta série de partidas em alternância, os dois jogadores obtêm uma média de 2,5 pontos por partida (a média entre 5 e 0) - pontuação inferior aos 3 pontos por partida que cada um dos jogadores pode acumular numa sequência estável de cooperação mútua.
Assim, quando Sondador Ingênuo joga contra Olho por Olho, ambos têm um desempenho pior do que quando Olho por Olho joga contra outra estratégia Olho por Olho. E, quando Sondador Ingênuo joga contra outro Sondador Ingênuo, ambos tendem a se sair ainda pior, visto que as sequências reverberantes de traição tendem a comeár mais cedo.
Considere agora outra estratégia, chamada Sondador Arrependido. Ela assemelha-se a Sondador Ingênuo, exceto pelo fato de tomar medidas ativas para quebrar os ciclos de recriminações alternadas. Para tanto, necessita de uma
"memória"
ligeiramente mais longa do que a de Olho por Olho ou de Sondador Ingênuo. Sondador Arrependido lembra-se se traiu espontaneamente e se sua traição resultou na pronta retaliação do oponente. Se isso tiver acontecido, ela é levada, por
"remorso"
, a conceder ao oponente o direito de atacá-lo por uma vez, sem retaliação - o que significa que as séries de recriminações mútuas são cortadas pela raiz.
Se imaginarmos um jogo hipotético entre Sondador Arrependido e Olho por Olho, descobriremos que os eventuais ciclos de retaliação mútua são prontamente anulados. A maior parte do jogo decorre em cooperação mútua, com ambos os jogadores a gozar da pontuação generosa correspondente. Sondador Arrependido se sai melhor contra Olho por Olho do que Sondador Ingênuo, a despeito de não alcançar um desempenho tão bom quanto o da estratégia Olho por Olho jogando contra si mesma.
Algumas das estratégias inscritas no torneio de Axelrod eram muito mais sofisticadas do que Sondador Arrependido ou Sondador Ingênuo, mas todas terminaram com uma pontuação inferior à simples Olho por Olho.
É interessante classificar as estratégias segundo determinadas categorias e examinar o sucesso das divisões mais abrangentes. A categoria mais importante que Axelrod reconheceu foi
"amável".
Uma estratégia amável é definida como aquela que nunca é a primeira a trair. Olho por Olho é um exemplo de estratégia amável. Ela é capaz de trair, mas o fará apenas em retaliação.
Sondador Ingênuo e Sondador Arrependido são estratégias
maldosas
, porque, por mais raramente que seja, elas traem, mesmo que não tenham sido provacadas. Das quinze estratégias que entraram na competição, oito eram amáveis. É signifivativo que as oito estratégias mais bem classificadas tenham sido precisamente as oito estratégias amáveis - as sete
estratégias maldosas ficaram bem atrás.
Olho por Olho obteve uma média de 504,5 pontos, 84% da marca de referência (600), e uma boa pontuação. As demais estratégias amáveis pontuaram apenas ligeiramente abaixo disso, variando entre 83,4% e 78,6% da pontuação de referência. Há um grande intervalo entre essas pontuações e os 66,8% obtidos por Graaskamp, a mais bem-sucedida de todas as estratégias maldosas. A idéia de que os bons rapazes se dão bem nesse jogo parece bastante convincente.
Outro dos termos técnicos usados por Axelrod para classificar as estratégias é
"indulgente"
. Uma estratégia indulgente é aquela que, embora possa retaliar, tem memória curta. Ela tende a esquecer rapidamente os delitos do passado. Olho por Olho é uma estratégia indulgente. Ela devolve o golpe do traidor imediatamente, mas, depois, são águas passadas. O Rancoroso do capítulo 10 é inclemente. A sua memória dura o jogo inteiro. Ele nunca esquece seu ressentimento contra um jogador que já o traiu, mesmo que tenha sido uma única vez.
Uma estratégia tormalmente idêntica a Rancorosa foi induzida no torneio de Axelrod com o nome de Friedman e não se saiu particularmente bem. De todas as estratégias amáveis (note-se que, tecnicamente, se trata de uma estratégia amável, apesar de totalmente inclemente), Rancoroso/Friedman ficou entre os piores. As estratégias inclementes não alcançam bom desempenho porque não conseguem quebrar os ciclos de recriminação mútua, ainda que o adversário se mostre
"arrependido"
.
É possível ser ainda mais indulgente do que Olho por Olho. A estratégia Olho por Dois Olhos permite aos oponentes duas traições em sequência antes de revidar, o que poderia parecer excessivamente virtuoso e magnânimo. Entretanto, Axelrod calculou que, se alguém tivesse submetido uma estratégia deste tipo, teria vencido a competição, por se tratar de uma estratégia muito eficaz no que se refere a evitar os ciclos de recriminação mútua.
Identificamos, por conseguinte, duas características das estratégias vencedoras: a amabilidade e a indulgência. Esta conclusão quase utópica - de que a amabilidade e a indulgência compensam - foi uma surpresa para muitos dos especialistas, que tentaram ser astutos demias para apresentar estratégias sutilmente maldosas. Mesmo os proponentes das estratégias amáveis não haviam se atrevido a conceber uma estratégia tão indulgente quanto Olho por Dois Olhos.
A estratégia
UM OLHO POR DOIS OLHOS
é aquela que deserta somente quando o adversário desertou nas duas jogadas anteriores. Assim, sua resposta é de um-para-dois. Essa estratégia relativamente indulgente teria vencido a primeira fase do Torneio de Computador para o Dilema do Prisioneiro caso fosse apresentada. Ela teria bom desempenho porque evitaria recriminações mútuas com algumas das outras estratégias que criaram problemas até mesmo para a
OLHO POR OLHO
. No entento, na segunda fase do torneio quando a
UM OLHO POR DOIS OLHOS
foi enviada; nem sequer ficou entre as três primeiras colocadas, porque na segunda fase havia algumas estratégias capazes de explorar sua boa vontade para perdoar deserções isoladas.
TRAKER (
RASTREADOR
)
Após alguns experimentos em pequena escala Jefferson e Taylor decidiram simular o comportamento das formigas aprendendo a seguir uma trilha de feromônio.
"O que realmente procurávamos era uma tarefa simples, que criaturas simples realizam, mas cuja programação não era óbvia. Acabamos tendo a idéia de seguir uma trilha - e não uma trilha limpa, mas uma trilha barulhenta, uma trilha interrompida."
Os dois cientistas criaram uma grade virtual de quadrados, desenhando sobre ela um caminho em forma de meandro com 82 quadrados. O objetivo era desenvolver um programa simples e uma formiga virtual que pudesse trilhar toda a extensão em um tempo definido, usando somente informação limitada sobre as voltas e curvas do caminho. Em cada ciclo, uma formiga tinha a opção de
"farejar"
o quadrado à sua frente, avançando para o próximo ou dobrando à direita ou à esquerda 90 graus.
Jefferson e Taylor deram as suas formigas 100 ciclos para trilhar o caminho; cada vez que uma formiga usava seus 100 ciclos, o software calculava o número de quadrados da trilha que ela havia atingido com sucesso e dava uma pontuação. Uma formiga que se perdesse após o primeiro quadrado, teria a nota 1; uma formiga que completasse a trilha com suscesso antes do final dos 100 quadrados, teria a nota máxima, 82.
O sistema de notas permitiu a Jefferson e Taylor criarem critérios de aptidão que determinavam quais as formigas que tinham permissão para se reproduzir. O programa Tracker começou simulando 16 mil formigas - uma para cada processador da Máquina de Conexões - com cerca de 16 mil estratégias aleatórias para trilhar o caminho.
Uma formiga podia começar com a estratégia de andar direto à frente; outra poderia desviar para frente e para trás entre farejos e rotações de 90 graus; uma terceira podia seguir regras mais rebuscadas. A grande maioria dessas estratégias acabaria em completo fracasso, mas algumas conseguiram percorrer uma porção maior da grade. Essas formigas mais bem-sucedidas teriam permissão para se acasalar e se reproduzir, criando uma nova geração de 16 mil formigas prontas a enfrentar a trilha.
A trilha
- apelidada de Trilha John Muir em homenagem ao famoso ambientalista - começava com um trecho relativamente reto, com várias viradas à direita seguidas de mais trechos retos, e rapidamente tornava-se cada vez mais complicada. Hoje, Jefferson diz que projetou o Tracker daquele modo porque ficou preocupado que as primeiras gerações fossem tão incompetentes que um trecho mais difícil as confundisse.
"É bom lembrar que, quando começamos a experiência, não tínhamos idéia se uma população de 16.600 era um número apropriado para facilitar uma evolução darwiniana",
explica.
"E eu não sabia se eram necessários dez, cem ou dez mil gerações"
. Não havia teoria para nos orientar quantitativamente sobre o tamanho da população no espaço e a extensão do experimento no tempo.
Passar por cem gerações levou cerca de duas horas; Jefferson e Taylor montaram o sistema de modo a receber atualizações em tempo real sobre as formigas mais talentosas de cada geração. Como um registrador de estoques, a Máquina de Conexões fornecia um número atualizado no fim de cada geração: se o melhor seguidor de trilha de uma geração conseguia alcançar 15 quadrados em 100 ciclos, a Máquina de Conexões apontava 15 como o recorde atual e então se direcionava para a geração seguinte.
"Para nosso espanto e total alegria"
, recorda-se Jefferson,
"a coisa funcionou na primeira vez. Nós ficamos lá, sentados, vendo os números aparecerem: uma geração produzia 25, depois 25 de novo, depois 27, a seguir 30. No final vimos um escore perfeito, logo após uma centena de gerações. Foi um assombro"
. O software fizera evoluir uma população inteira de peritos seguidores de trilha, apesar de Jefferson e Taylor não terem dotado a primeira geração de formigas de qualquer habilidade específica.
Em vez de projetar uma solução para o problema de seguir trilhas, os dois professores da UCLA haviam feito surgir uma solução; haviam criado um grupo de programas possíveis, depois construído um mecanismo de feedback que permitia o surgimento de programas cada vez melhores. De fato, o sucesso dos programas foi tão grande, que eles criaram soluções específicas para seus ambientes.
Quando Jefferson e Taylor
"dissecaram"
uma das formigas campeãs no final, para ver que estratégias de seguimento de trilhas ela tinha desenvolvido, descobriram que
o software tinha evoluído
no sentido de preferir dobrar à direita, em resposta às três viradas iniciais à direita que Jefferson construíra na trilha John Muir. Era como observar um organismo que vive na água desenvolver guelras: mesmo na tosca e abstrata grade do Tracker, as formigas virtuais desenvolveram uma estratégia de sobrevivência que era adaptada somente a seu meio ambiente.
De qualquer ponto de vista, o
Tracker
foi um autêntico desbravador. Finalmente, as ferramentas da computação moderna tinham atingido o ponto em que se podia simular inteligência emergente e ver seu desdobramento na tela em tempo real, como Turing, Selfridge e Shannon sonharam anos antes. E, por feliz coincidência, Jefferson e Taylor escolheram para suas simulações justamente o organismo mais celebrado por seu comportamento emergente: a formiga. Naturalmente, eles partiram da mais elementar forma de inteligência de formiga - cheirar trilhas de feromônio -,
mas as possibilidades sugeridas pelo sucesso do Tracker eram infinitas.
Charles Taylor
David Jefferson
TRACKER
é um programa idealizado em meados dos anos oitenta por dois professores da UCLA, David Jefferson e Chuck Taylor (Jefferson era do departamento de computação, e Taylor era biólogo)
Neste ponto um comentário se impõe:
1 )
A punição para aprender a não ser trouxa equivale, a cair no
“conto do bilhete premiado”.
2 )
Estratégias enganadoras costumam trazer altos benefícios à quem as pratica... daí o prêmio de R$ 500 pela traição ardilosa.
3 )
As traições podem ser de duas naturezas: as abertas e as sutis. Lidar com traidores abertos é relativamente simples: basta deixar de jogar com ele. O complicado é lidar com traidores sutis, que não se recusam a retribuir, mas retribuem em valor inferior ao que seria justo, ou ficam somente na promessa.
4 )
À medida em que as vítimas ficam vacinadas, o trapaceiro desenvolve estratégias cada vez mais sofisticadas para enganar a outra parte.
5 )
As regras desse jogo são frequentemente encontradas na natureza. Os animais também agem de maneira enganadora.
Full transcript