Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

ARQUITETURA DE CLUSTER DA GOOGLE

Apresentação do artigo “Web Search for a Planet: The Google Cluster Architecture”
by

Uallas Oliveira

on 2 October 2012

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of ARQUITETURA DE CLUSTER DA GOOGLE

Arquitetura de cluster
da Google Uallas dos Santos Oliveira Clusters da Google RAID
(Redundant Array of Inexpensive Drives) Manutenções com o RAID é possível somar a capacidade e o desempenho de vários HDs,
ou então sacrificar parte do espaço de armazenamento
em troca de mais confiabilidade. Segundo Barroso, Dean e Hoe (2003), as atualizações do
sistema não são frequentes, mas quando é preciso,
as consultas realizadas por usuários são mantidas longe dos
servidores que estão sendo atualizados para evitar inconsistências de dados. A requisição é tratada no cluster onde é avaliado quais
Google Web Servers (GWSs) estão disponíveis Cada cluster possui alguns milhares de máquinas.

Distribuídos em lugares diferentes do mundo, mantém o sistema seguro Como a pesquisa é feita quando um usuário faz uma pesquisa no site da Google,
o browser executa o DNS que irá mapear o www.google.com
a um determinado IP como é necessário muito poder de processamento, a
Google utiliza vários clusters ao pelo mundo para processar
essas pesquisas feitas. Paralelismo técnica utilizada em grandes e complexas tarefas
para obter resultados de forma mais rápida possível,
dividindo-se em pequenas tarefas pequenas que
serão distribuídas em vários processadores
para serem executadas simultaneamente Sistemas distribuídos Segundo Neto e Lins (2006),
as arquiteturas tradicionais de Sistemas Distribuídos
tem relativa fragilidade, pois acoplam seus componentes Consultas do Google Uma única busca do Google lê centenas de megabytes de dados
e consome dezenas de bilhões de ciclos de CPU.

Consultas diferentes podem ser executadas em diferente
processadores e uma única consulta pode usar também
múltiplos processadores. a arquitetura de software da Google
consiste em duas ideias fornecer confiabilidade em software em vez de hardware, por isso podem usar PCs comodatos para poder fazer um alto processamento de dados a um preço relativamente baixo melhorar o tempo de resposta dos fluxos de requisições, gerenciando requisições individuais utilizando o paralelismo o DNS irá escolher o cluster mais próximo fisicamente do usuário o navegador então envia uma requisição HTTP para esse cluster e nele são processados os dados A partir daí é realizado o balanceamento de carga de pedidos entre cada servidor disponível Depois de receber a consulta, uma máquina GWS coordena a execução da consulta e formata os resultados e devolve a resposta para o browser do usuário em um Hypertext Markup Language (HTML)
Full transcript