Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

10. motori di ricerca & deep-web

No description
by

Fabio Ciracì

on 24 October 2016

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of 10. motori di ricerca & deep-web

Persuasione meditatica
Search Engine Persuasion (SEP), “persuasione dei motori di ricerca”, cioè l’insieme delle tecniche messe in atto per manipolare i ranking dei motori di ricerca (generalmente per far avere artificialmente, cioè immeritatamente se vogliamo, più successo ad alcune persone. […]).
Il SEP è anche conosciuto, ai giorni nostri, col nome di “SEO”
(Search Engine Optimization), che è un nome in realtà abbastanza
fuorviante e più recentemente creato dal fiorente mercato di ditte che offrono questo servizio, laddove sembra che si stia “ottimizzando” (parola politicamente corretta…?) i risultati dei motori di ricerca, mentre appunto in realtà di manipolazione si tratta
Legge di Zipf
Secondo la legge di Zipf, al di là del tipo di testo consultato e della lingua scritta,
l’80% del documento in esame contiene solamente il 20% di parole non comuni o discriminanti.
Google, motore di ricerca sociale?
Nel 1998 = 36 milioni di host e 4 milioni di siti web.
Posizionamento nei SERP--> sponsorizzazioni.
tecniche per aggirare l’indicizzazione automatizzata: cloaking, link farm, comment spam.

Nel 1998 (Università di Stanford): Larry Page e Sergey Brin,
Google
. “Googol”, ovvero


Oggigiorno si contano i dati del web già nell’ordine dei petabyte
Petabit /s


motore di ricerca
Un motore di ricerca (ingl. search engine) è un sistema informatizzato di ricerca automatica.
deep e surface
WEB
Motori di ricerca:
stopword, parole discriminanti,
bolla di filtri

Oltre ai motori di ricerca (Search Engine):

Computational Knowledge Engine

motori di conoscenza
- forniscono risposte dirette a delle domande formulate nel
linguaggio naturale, invece di rispondere con una lista di collegamenti a siti o a dati
indicizzati.
Es. WolframAlpha
del fisico britannico Stephen Wolfram, docente del Caltech - California Institute of Technology
25 anni di WEB: 40% people "wired"
fonte:http://googleblog.blogspot.it/2014/03/on-25th-anniversary-of-web-lets-keep-it.html
fonte: M. Marchiori, Motori di ricerca web e specchi della società, cit., p. 5. Nello stesso articolo l’autore spiega con chiarezza quali sono gli “effetti collaterali” e gli “sfasamenti” dei motori di ricerca
80%
STOP-WORD

ovvero

20%
PAROLE DISCRIMINANTI

5. Dal web 1.0 ai motori di ricerca
Alla base di un motore di ricerca vi è un software, istallato su più computer, chiamato spider oppure crawler, che richiede pagine web dai server, estraendo e indicizzando i links.

Come i browsers (navigatori) di rete, gli spider sono automatizzati per visitare pagine web, secondo scadenze preimpostate, diverse a seconda dei siti

NB: da marzo 2010 Internet Explorer non è più preistallato in Win 7

MOTORI DI RICERCA
funzioni di ricerca

motori di ricerca:

I risultati restituiti dal motore di ricerca in base ad una interrogazione dipendono essenzialmente da due fattori

POTENZA DEL MOTORE DI RICERCA
1. CAPACITÁ EURISTICA

2. VISIBILITÁ DELL’OGGETTO RICERCATO: STRUTTURA DELL’OGGETTO.

3. SPONSORIZZAZIONE


Cosa possiamo controllare?

- logica di Boole - Sì (AND, OR, NOT)
- logiche monotòne - Sì, in parte: operatori logici di prossimità "" / [ * ]
- PageRanke: NO
MOTORI DI RICERCA
funzioni di ricerca


Il presente materiale è pubblicato con licenza Creative Commons “Attribuzione - Non commerciale - Condividi allo stesso modo - 2.5 Italia” http://creativecommons.org/licenses/by-nc-sa/2.5/it/.





Credits

Del materiale in rete si indica sempre la fonte; la segnalazione di dimenticanze ed errori di fatto, lapsus calami et alias, è sempre gradita per migliorare il presente lavoro.

Il deep-web e Google

MOTORI DI RICERCA:
metafora dell'un universo in crescita

Gli spiders (ragni) indicizzano i contenuti del net (della rete) e rendo visibili i siti al motore di ricerca

Il web: metafora della rete

Processo comunicativo lineare

(contenuto) (espressione)

NON ESISTE IL “DATO” PURO – ESISTE SOLO IL DATO “STRUTTURATO”

Sorgente trasmettitore Canale ricevitore destinatario

Messaggio Segnale Segnale ricevuto Messaggio ricevuto

Il modello di
Shannon e Weaver (1949)

dati invisibili

TAG

TAG

BROWSER: NAVIGATORI

surface-web: web di superficie

deep-web: sommerso

TAG

Il web: metafora del mare

Database e codici di programmazione. Per es. html, xml

VISIONE LOGICA

catalogo

database

software

catalogo

Web profondo

Web di superficie

Web di superficie e web profondo

Utilizza un PageRank, vale a dire un algoritmo di ricerca basato sulla “popolarità” delle pagine, ovvero quelle con piú links e piú visitati
→ il problema del “non emerso”: Google riesce parzialmente ad esplorare il Deep Web, ossia quelle informazioni contenute nel web ma non indicizzate dai motori di ricerca e contenute nei database.

Google indicizza:
documenti in formati testuali, non testuali, immagini, files.PDF, presentazioni PPT, fogli di calcolo EXL, immagini JPEG, TIFF ecc.),

non indicizza:
i contenuti audio e video. I video e le immagini trovate sono associate a dei tags (etichette)

Esistono motori di ricerca che eslporano il web attraverso una ricerca per immagini (anche Google Immagini). Per es. retrievr http://labs.systemone.at/retrievr/



http://www.ted.com/talks/eli_pariser_beware_online_filter_bubbles?language=it
Bolla di filtri
2,7 miliardi nel 2013
fonte: ""ITC Facts and Figures 2013", Brahima Sanou, Telecommunication Development Bureau, International Telecommunications Union (ITU), Geneva, February 2013. Retrieved 23 May 2015
Full transcript