Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Copy of sdfasdfasdfasdfasdfasdfasdf

No description
by

Angélica Ribeiro

on 26 November 2017

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Copy of sdfasdfasdfasdfasdfasdfasdf

Algoritmo de Similaridade em redes de Informação Heterogênea por meio de Redes Complexas
Roteiro
Requisitos Funcionais
Requisitos Não Funcionais
Modelo de Caso de Uso
Diagrama Conceitual
Diagrama de Atividades
Objetivo

Criar um algoritmo de similaridade para verificar similaridade entre tipos 
diferentes de documentos em Redes de Informação Heterogênea usando
artefatos linguísticos

Quais vértices são mais similares entre si?

Roteiro
Fundamentos Teóricos
Recuperação de Informação
Processamento de Língua Natural
Redes Complexas
Artefatos linguísticos como ontologias
Informações disponíveis nos documentos (metadados)
Fundamentação Teórica
Propriedade do Documento
Fundamentação Teórica
Processamento de Língua Natural (PLN)
Conhecimento linguístico
Fonética fonologia
Morfologia
Sintáxe
Semântica
...
Representações computacionais
Máquinas de estado
Sistemas de regras formais
Lógica
Teoria da probabilidade
Aprendizado de máquinas
Fundamentação Teórica
Processamento de Língua Natural (PLN)
Extração de informação
Texto livre ou estruturado
Fala -> Escrita
Correção de ortografia
Verificação de gramática ( frases verbais, nominais... )
Extração de Part-of-Speech ( subs., verb., adj.)
Eliminação de ambiguidades
Ontologias de entidades
Tesauro de sinônimos e abreviaturas
Fundamentação Teórica
Redes Complexas
Redes Regulares
Rede Randômicas
Redes de Mundo Pequeno
Redes de livre escala
Clustered Randon Networks
Redes com Mistura de Padrões
Fundamentação Teórica
Fundamentação Teórica
Redes de Informações Heterogêneas

Fundamentação Teórica
Redes Heterogêneas
Meta-paths de uma rede de co-autoria
Referências
[1] AMANCIO, D. R. et al. Comparing intermittency and network measurements of words
and their dependence on authorship. New Journal of Physics, IOP Publishing, v. 13,
n. 12, p. 123024, 2011.

[2] BAEZA-YATES, R.; RIBEIRO-NETO, B. Modern information retrieval. 1nd. ed. [S.l.]:
ACM Press New York, 1999. v. 463.

[3] SILVA, T. C. Machine learning in complex networks: modeling, analysis, and applications.
Tese (Doutorado) | Universidade de São Paulo, 2012.

[4] SHI, C. et al. Hetesim: A general framework for relevance measure in heterogeneous
networks. IEEE Transactions on Knowledge and Data Engineering, IEEE, v. 26, n. 10, p.
2479

[5] SHI, C. et al. Relevance search in heterogeneous networks. In: ACM. Proceedings of the
15th international conference on extending database technology. [S.l.], 2012. p. 180

Validação: Dataset
Prontuários médicos
MIMIC (https://mimic.physionet.org/gettingstarted/access/)
NCBI (http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4147615/)
NLP (https://www.i2b2.org/NLP/DataSets/Main.php)
MTsamples (http://www.mtsamples.com/)
Artigos Científicos
Pubmed
Google Scholar
Dataset de Referências em Redes Heterogêneas
DBLP, Pubmed, IMBD
Flickr
Google News
Dataset de Referências do grupo de pesquisa
Estrutura da Rede Atualmente
A base do Algoritmo
1. Entrada de documentos de mídias diferentes
2.Relaciona-se os documentos entre si
1.Por meio de algoritmos de similaridade clássicos vetoriais (cosseno, jaccard, distância euclidiana)
2.E ou estendidos por artefatos linguísticos(tesauros dicionários, ontologias)
3.Retorna uma Rede de Informação Heterogêneas G=(E, V, C,W)
4.Calcula-se as similaridades dos nós de G=(E, V, C, W) por meio de:
1.Métricas de redes complexas
2.Meta-path (por links)
3.Artefatos linguísticos(tesauros dicionários, ontologias)
4.Retorna o ranqueamento dos documentos similares
O trabalho
Trabalhos de Suporte
Framework para sistemas de Vigilância para doenças crônicas (SisVidas)
Framework para redução de descontinuidade semântica em imagens médicas (FREDS)
Question-Answering surveillance framework (QASF)

Fundamentação Teórica
Problemas no estado da arte
Não consideram a dinâmica das redes
Utilizam o meta path
Custo computacional grande
Não utilizaram ontologias nem tesauros
As redes heterogêneas estudadas:
Redes pré estabelecidas (Vértices possuem uma ligação explícita.)
Nós são extraídos de apenas 1 tipo de documento.
As redes heterogêneas criadas nesse trabalho
Documentos são os vértices
As arestas entre os vértices não estão explícitas
Cosseno
Palavras chaves + ontologias + código CID
Redes isomórficas
Fundamentação Teórica
Fundamentação Teórica
Algoritmos de Similaridade
Abordagens em Características
Vetores de características
Cosseno
Coeficiente de jaccard
Distância euclidiana
Abordagens em Links
PageRank
SimRank

sdfasdfasdfasdfasdfasdfasdf
asdfasdfasdfasdfasdfasdfasdfasdfasdf
sdfasdfasdfasdfasdfasdfasdf
asdfasdfasdfasdfasdfasdfasdfasdfasdf
sdfasdfasdfasdfasdfasdfasdf
asdfasdfasdfasdfasdfasdfasdfasdfasdf
sdfasdfasdfasdfasdfasdfasdf
asdfasdfasdfasdfasdfasdfasdfasdfasdf
sdfasdfasdfasdfasdfasdfasdf
asdfasdfasdfasdfasdfasdfasdfasdfasdf
sdfasdfasdfasdfasdfasdfasdf
asdfasdfasdfasdfasdfasdfasdfasdfasdf
sdfasdfasdfasdfasdfasdfasdf
asdfasdfasdfasdfasdfasdfasdfasdfasdf
sdfasdfasdfasdfasdfasdfasdf
asdfasdfasdfasdfasdfasdfasdfasdfasdf
sdfasdfasdfasdfasdfasdfasdf
asdfasdfasdfasdfasdfasdfasdfasdfasdf
Título
Autor
Co-autor
Abstract
DOI
Palavras chaves

Sintomas
Diagnósticos
Hábitos pessoais
Exames médicos
Palavras chaves
Palavras Chaves
Descritores
Posts
Relacionamentos

Medidas de grau e correlação de grau
Distâncias e métricas de caminhos na rede
Métricas estruturais da rede
Nós com várias características de cada documento
Nós são diferentes de acordo com o tipo de documento.

Orientanda: Angélica A. P. Ribeiro
Orientadora: Alessandra A. Macedo

Programa de Pós-Graduação em Computação Aplicada​
Redes Heterogêneas
Esquemas de Rede
Restrições
A maioria das medidas de similaridade existentes são para
redes de informação homogêneas.
Texto
Links
Multimídia
Modelos Clássicos de RI
(Textos não Estruturados)
Booleano
Vetorial
Probabilístico
Textos Semi Estruturados
Nós Próximos, Outros
Modelos em XML
Web
Page Rank
Hubs & Autoridades
Recuperação de Imagens
Recuperação de Áudio e Música
Recuperação de Vídeo
Teoria dos conjuntos
Fuzzy
Booleano Estendido
Conjuntos
Algébricos
Vetorial Generalizado
Latent Semantic Analysis
Redes Neurais
Probabilísticos
BM25
Modelos de Linguagens
Divergencia da Aleatoriedade
Redes Bayesianas
Algoritmos de Similaridade
Trabalhos de Suporte
Proposta
Resultados
Introdução
Redes Sociais
Artigo
PEPs
Imagens
Medidas de centralidade
Requisitos Funcionais
Engenharia de Software
Profa: Alessandra Alaniz Macedo

Universidade de São Paulo

Requisitos de Caso de Uso
Modelo Conceitual


O algoritmo deverá fazer o uso de técnicas computacionais de reconhecimento de padrões, processamento de linguagem natural, recuperação de informação e Sistemas Complexos.

O algoritmo deverá criar uma rede de informações heterogêneas entre documentos biomédicos a partir da sililaridade ou relacionamento semântico extraído por meio de ontologias juntamente com métricas e medidas de similaridade.

O algoritmo deverá conectar os documentos biomédicos sendo eles laudos médicos, exames médicos, prontuários, artigos científicos, entre si de acordo com o grau de relacionamento semântico entre os conceitos dos documentos e/ou domínios.

O algoritmo será capaz de identificar automaticamente os tipos de atributos de cada vertice da rede. Assim como os atributos de cada aresta.

O algoritmo será capaz de extrair da rede complexa a simililaridade entre os documentos similares por meio dos caminhos formados pela construcao da rede complexas por meio da avaliação da qualidade dos relacionamentos entre os artefatos, usando medidas como graus de saída dos vértices, coeficientes de aglomeração, correlação de grau, resistência e etc.
Diagrama de Atividades
Full transcript