Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

BrasNAM-CSBC2015

No description
by

Johnnatan Messias

on 1 September 2016

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of BrasNAM-CSBC2015

Bazinga! Caracterizando e Detectando Sarcasmo e Ironia no Twitter
johnnatan@dcc.ufmg.br
BraSNAM - CSBC2015
Recife - PE
Introdução
Terminologia
Mas o que são:
Sarcasmo
Ironia

Sarcasmo
Indireto
Zombaria
Ofensivo
"Super glad I got a sinus infection during finals week" #sarcasm
Ironia
Discordância
"Steve Jobs did not allow his kids to use iPads #irony"
Caracterização
Bazinga! Caracterizando e Detectando Sarcasmo e Ironia no Twitter
Metodologia
Coleta da base de dados


Caracterização


Predição de Sarcasmo e Ironia

Análise de Sentimentos, Mineração de Opiniões
Twitter
280 mi de usuários ativos por mês
500 mi de tweets diários

Caracterizar e detectar #sarcasm e #irony no Twitter
Utilizar abordagens:
Machine Learning: SVM
Atributos do usuário e tweets
Polaridade dos tweets
Scarina
Verificar o contexto dos tweets

Histórico de postagem do usuário

Quais termos de BoW são mais importantes na identificação

Combinar mais técnicas
Trabalhos Futuros
Trabalhos Futuros
Obrigado!
Coleta dos Dados
Coleta da base de dados
Período da coleta: Fevereiro 2014 a Fevereiro 2015

Dados coletados
2628 tweets de #sarcasm
2628 tweets de #irony
2628 tweets aleatórios

Tweet: timestamp, retweets e favoritos, informação do usuário

API do Twitter: 1% dos tweets públicos
Conclusão
Conclusão
Sarcasmo e Ironia são formas de discurso linguístico complexas

Mensagens com teor sarcástico ou irônico:
usam 2 vezes mais pronomes na terceira pessoa do que mensagens aleatórias
possuem menos informações externas
são mais negativas

Apenas atributos do LIWC aplicados ao SVM não são suficientes para a detecção de sarcasmo e ironia no Twitter
Resultados
Características Linguísticas
Identificação Automática
Atributos de Usuário
Análise de Sentimentos
Será que é possível caracterizar e detectar #sarcasm e #irony no Twitter?
Proposta
Tema relevante e complexo
Serviço Secreto dos EUA interessado na detecção de sarcasmo em OSN, diz "BBC"
Pollyanna Gonçalves, Daniel Dalip, Julio Reis, Johnnatan Messias, Filipe Ribeiro, Philipe Melo, Leandro Araújo, Marcos Gonçalves, Fabrício Benevenuto
http://johnnatan.me
Características Linguísticas
Atributos linguísticos
LIWC
Atributos de usuários e tweets
Quantidade de amigos e seguidores, retweets, URLs, mídias e hashtags
Análise de Sentimentos
Positivo, negativo e neutro
Predição
Predição
SVM
LIWC
BoW
Kernel Linear
LIWC + BoW
Cross Validation: 5 folds
Acurácia e Macro F1
Grid Search
2 x (P x R) / (P + R)
Sarcasmo
Ironia
Full transcript