Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

ARS Medidas

Measures for Network Analysis
by

Ricardo Sampaio

on 5 May 2015

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of ARS Medidas

Centralidade de Grau
Centralidade de Intermediação
Coeficiente de
Clusterização
Componentes ou Subredes
Coesão
Medidas e Estrutura de Redes
Coeficiente de Assortatividade
Componente Gigante e Cliques
Densidade
Diâmetro e Distância Média da Rede
Modularidade
K-core
Centralidade
Tipos de Centralidade
Definição da Rede
Manipulação da Rede
Determinaçãdas Características Estruturais
Inspeção Visual
Resultados
Modelo Exploratório para
Análise de Redes

Analista de Dados
Analista de Redes
Como utilizar as medidas de Rede para apoiar a determinação de suas Características Estruturais
Grau Medio e
Ponderado

Centralidade de Proximidade
Centralidade de Autovetor
Comparativo entre Medidas de Centralidade
Medidas WEB
Page Rank
Medidas WEB
HITS:
Hubs e Authority
Random Network
Small World
Uma rede Mundo Pequeno é um tipo de gráfico matemático em que a maioria dos nós não são vizinhos um do outro, mas a maioria dos nós pode ser alcançado pelos demais nós por um pequeno número de saltos ou passos. Especificamente, uma rede Mundo Pequeno é definida para ser uma rede onde a distância L (o número de etapas necessárias) entre os dois nós escolhidos aleatoriamente cresce proporcionalmente em escala com o crescimento logaritmo do número de nós da rede (Watts e Strogatz 1998) enquanto que o coeficiente de clusterizacao permanece estavel.
Scale Free
A característica mais notável em uma rede livre de escala é o aparecimento comum de nós ou vértices com um grau que excede em muito a média dos demais nós da rede. Os nós de mais alto grau são frequentemente chamados de "hubs", e normalmente tem uma função e propósitos muito específicos em suas redes mas que pode variar bastante dependendo do domínio.
Core Periphery
Outro conceito comum, mas informal, em análise de redes sociais ou complexas é o de uma estrutura de núcleo e periferia. A concepção implica uma rede com um núcleo denso e coeso e uma periferia esparsa e desconectada. De acordo com Borgatti e Everett (2000), “a noção de uma Rede Núcleo Periferia pode ser vista como um centro com vários núcleos e uma comunidade periférica que estão ligados aos diferentes núcleos”. Esse conceito pode ser avaliado de outra forma, buscando detectar o coeficiente do Clube dos Ricos (COLIZZA et al., 2006), que avalia a proporção de relacionamentos dentro e fora de grupos específicos.
Redes Sociais normalmente possuem conjuntos de elementos densamente conectados. Estes sub-grupos dentro da rede são chamados de grupos coesos

Os motivos pelos quais esses grupos possuem esse tipo de relação mais densa pode diferir para cada tipo de rede

As estruturas e características dessas relações mais ou menos frequentes são normalmente o objeto de estudo das redes
Há uma expectativa que atores com características similares interajam com maior frequência
A Densidade de uma rede é calculada com base no número de linhas que esta possui dividido pelo número máximo possível de linhas para esta rede
Densidade
10/10=1
Densidade
1/10=0,1
Densidade
5/10=0,5
O diâmetro da rede é calculado como sendo a distância mínima entre os dois nós mais distantes da rede

A distância média da rede é calculada utilizando a distância mínima entre todos os nós da rede. A distância mínima entre dois nós da rede é também chamado de distância Geodésica

O conceito de distância média está relacionado ao termo “6 graus de separação” e é utilizada para avaliar a estrutura “Small World” descrita por Wats e Strogatz (1998)
Diâmetro desta rede é 6
Distância média da rede é 3
Na teoria dos grafos, o coeficiente de clusterização é uma medida do grau em que os nós em um grafo tendem a se agrupar. Evidências sugerem que na maioria das redes do mundo real, e em especial nas redes sociais, os nós tendem a criar grupos coesos caracterizados por uma densidade relativamente alta, maior que uma probabilidade estabelecida aleatoriamente entre dois nós (Holland e Leinhardt, 1971; Watts e Strogatz, 1998)

O coeficiente de clusterização é calculado avaliando se os nós aos quais determinado nó mantém relações possuem relações entre eles
Avaliando o Coeficiente de Clusterização do nó azul escuro
C=1 C=2/3 C=1/3
O Coeficiente de Assortatividade calcula o quanto um nó se relaciona com outros nós similares a ele.

Normalmente é utilizado o grau do nó como característica de comparação mas outros parâmetros também podem ser utilizados
Componentes são grupos de nós que possuem relações entre eles de maneira que se partindo de um nó pode-se alcançar um outro nó do mesmo componente

Nas redes direcionadas esses componentes podem ser caracterizados como fortes ou fracos com base na capacidade de se sair de um nó e chegar a outro nó do mesmo componente sem repetir nenhum nó deste componente

Para redes não direcionadas os componentes são percebidos como subredes não conectadas entre si
Componente Gigante é o maior componente da rede onde todos os elementos estão conectados entre si

Grande parte das medidas e análise de redes são feitas à partir do componente gigante
3 componentes na Rede
O componente Gigante está na cor verde
Clique é uma subrede onde todos os nós dessa subrede estão conectados entre si
Uma subrede é um conjunto de nós ou subdivisão de uma rede maior

Esta subrede pode ser dividida com base em diversas características como grau, número ou tipo de relações, categorias e outros

Uma subrede pode ou não ser um componente
A modularidade é uma medida da estrutura de redes ou grafos. Ele foi projetado para medir a força da divisão de uma rede em módulos (também chamados de grupos ou comunidades). Redes com alta modularidade têm conexões densas entre os nós dentro dos módulos, mas ligações esparsas entre nós em diferentes módulos. A modularidade é frequentemente usada em métodos de otimização para a detecção de estrutura de comunidade em redes.
Ref.:Newman, M. E. J. (2006). "Modularity and community structure in networks". Proceedings of the National Academy of Sciences of the United States of America
Relações mais fortes entre elementos de um mesmo módulo
O k-core é uma subrede em que cada nó se relaciona a outros nós, com pelo menos, um número k de relacionamentos com outros nós nessa mesma sub-rede (NEWMAN, 2010). O k-core divide os grupos com base nos seus relacionamentos.
k-core 1 todos os elementos possuem pelo menos grau 1

k-core 6 todos os elemento possuem pelo menos grau 6
Algorítimos de Clusterização
Uma série de algoritmos são utilizados para a busca de comunidades, clusters ou grupos coesos: edge betweenness, fastgreedy, label propagation, leading eigenvector, multilevel, optimal, spinglass, walktrap
As comunidades encontradas por esses algorítimos, pelo k-core ou por cliques são todas subredes
Na ARS, atores importantes são tais que estão frequentemente envolvidos na relação com outros atores. Estes envolvimentos os tornam mais visíveis, possuindo a maioria do acesso ou controle, sendo considerados mais centrais na rede. É neste sentido que as medidas de centralidade tentam descrever as propriedades da localização de um ator na rede. Estas medidas levam em consideração as diferentes maneiras em que um ator interage e se comunica com o restante da rede, sendo mais importantes, ou centrais, aqueles vértices localizados em posições mais estratégicas na rede.
A noção de centralidade em redes sociais foi introduzida por Bavelas, em 1948 (BAVELAS, 1948 apud FREEMAN, 1979), quando ele afirma que, num grupo de pessoas, um particular indivíduo que se encontra estrategicamente localizado num caminho mais curto de comunicação entre pares de indivíduos, está numa posição mais central da rede. Ele será responsável por transmitir, modificar, ou reter a informação entre membros do grupo e será tão mais influente quanto mais central estiver posicionado na rede.
Grau, Proximidade, Intermediação e Autovetor
O grau é uma medida da influência direta que um vértice tem em relação a seus contatos
A proximidade está relacionada com o tempo que uma informação leva para ser compartilhada por todos os vértices na rede
A intermediação de um vértice pode ser considerada como o controle da comunicação entre todos os demais pares de vértices da rede
O Autovetor é calculado com base na proximidade com nós importantes da rede
As medidas de centralidade podem ser calculadas para o nó ou para toda a rede. Para a rede é calculada a média entre todos os nós.
A centralidade de grau é calculado levando-se em consideração o número de relações que um nó possui
Em uma rede direcionada o grau pode ser de entrada ou de saída
Em uma rede não direcionada o grau é o número de linhas que o nó possui
Centralidade de grau do nó vermelho
4 out degree - 4 in degree - 4 total
0 in degree - 0 out degree - 4 total
O Grau Médio é calculado com base na média de grau de todos os nós da rede

O Grau ponderado va em consideração não só o número de relações mas o peso dessas relações
A Centralidade de Intermediação é calculada de acordo com a capacidade de intermediar a conexão de qualquer dois nós da rede
A Centralidade de Proximidade é calculada levando-se em consideração a soma do caminho mais curto de todos os nós da rede para com um nó específico. O nó mais central da rede é aquele com menor valor
Bonacich (1987) propôs uma medida denominada centralidade de autovetor (eigenvector centrality), cujo objetivo é medir a importância de um nó em função da importância de seus vizinhos.
Isto quer dizer que, mesmo se um nó está conectado somente a alguns outros vértices da rede (tendo assim uma baixa centralidade de grau), estes vizinhos podem ser importantes e, consequentemente, o nó será também importante, obtendo uma centralidade de autovetor elevada.
Grau
Intermediacao
Proximidade
Auto Vetor
Algumas medidas foram criadas com foco nas páginas WEB
Criada pelos Fundadores do Google Lawrence Page e Sergey Brin o algoritmo foi patenteado pela Universidade Stanford. Funciona de forma similar a centralidade de autovetor onde uma página se torna “central" quando outras páginas importantes mencionam ou fazem links para esta página
HITS: Calcula duas medidas.
Hubs que avalia o número de linhas saindo do nó ou a capacidade do nó de levar informação.
Authority a capacidade do nó de receber informações ou de outros nós apontarem para ele
Em matemática, um grafo aleatório é o termo geral para se referir as distribuições de probabilidades sobre as redes. Redes aleatórias podem ser descritas simplesmente por uma distribuição de probabilidade, ou por um processo aleatório que os gera (Bollobás 2001). Do ponto de vista da ciência de redes, grafos aleatórios são usados para responder a perguntas sobre as propriedades de redes típicas. As suas aplicações práticas são encontradas em todas as áreas nas quais as redes complexas precisam ser modeladas. Um grande número de modelos de redes aleatórias são conhecidas, o que reflete os diversos tipos de redes complexas encontradas em áreas diferentes. Em um contexto matemático, gráfico aleatório refere-se quase exclusivamente ao modelo gráfico aleatório Erdös-Rényi (1959).
Small World - Scale Free - Random
A atividade de definição da rede compõe o primeiro passo no modelo exploratório proposto

A Definição da Rede é a definição do universo que será pesquisado contendo o recorte dos nós e tipos de relações que serão analisadas

É muito importante nesse momento entender os tipos de relações possíveis para a análise de redes
Manipulação da rede é fase onde os dados levantados são tratados os ajustes são realizados dentro do recorte que foi escolhido

No caso da análise de colaboração científpode-se escolher por analisar somente pesquisadores que tenham um mínimo de publicações na área
Nesse estágio são utilizadas as medidas de rede estudadas para se entender as características da rede

Qual o tipo de estrutura que a rede poss ou quais os elementos mais centrais na rede são algumas das análises estruturais que podem ser feitas

Para essas análises normalmente se utiliza ferramentas / softwares de rede para conseguir os resultados
Essa é a última etapa do modelo proposto

A inspeção visual auxilia na interpretação daede e pode trazer elementos ou informações que não seriam facilmente percebidas com outros métodos

Para evitar confusões na análise visual é considerado um número máximo de nós
Por último é preparado um relatório contendo as medidas da rede, algumas figuras e suas legendas e a interpretação do analista sobre os resultados
Full transcript