Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

Análisis de la web

No description
by

Manuel Blázquez

on 11 May 2015

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Análisis de la web

Análisis de la Web
Prof. Manuel Blázquez Ochando
Dpto. Biblioteconomía y Documentación
Universidad Complutense de Madrid
Bibliometría
Cibermetría = Webometría
Cienciometría
Webometría =
Webmetría
Ley de crecimiento exponencial
Ley de productividad de los autores
Ley de obsolescencia de la literatura científica
Ley de dispersión de la literatura científica
Indicadores de producción
Indicadores de circulación
Indicadores de dispersión
Indicadores de uso de la literatura científica
Indicadores de visibilidad o impacto
Indicadores de colaboración
Informetría
Estudio de los
aspectos cuantitativos de la información

Aborda el estudio de la
comunicación formal, informal, científica y no científica

Análisis de
todos los tipos de información

Análisis de la información producida por los
medios de comunicación
Debate científico en torno a la significación de los conceptos
Pueden ser considerados términos sinónimos
Webmetría se orienta al análisis de enlaces
Disciplina científica encargada del
estudio de la producción científica
en las ramas de la Ciencia (Humanidades, Ciencias Sociales, Ciencias Puras y Ciencias Experimentales)

El objetivo de la Cienciometría es
medir cuantitativa y cualitativamente la producción científica
.
Webometrics
[Análisis de la Web]
La Webometría estudia la Web, estructura, hipertexto, topografía
Estudio
estadístico
y
cuantitativo
de la literatura científica

Estudio de la
producción científica
de los investigadores

Estudio de las
citas bibliográficas

Comprobación de las
leyes bibliométricas

Estudio
evolutivo
de las publicaciones científicas

Estudio de la
relevancia
de las publicaciones científicas

Evaluación de la ciencia basada en la
productividad

Estudio de la
diseminación y redifusión
de la ciencia
Leyes
Indicadores
Frecuencia de aparición de términos, expresiones e informaciones
Producción informativa de autores
Estudio de las fuentes de información y la citación
Obsolescencia de la información
Demanda y oferta de la información
Crecimiento de la literatura según temáticas
Análisis cuantitativo de la
comunicación y producción de información en el ciberespacio

El ciberespacio tiene un
alcance global
superior a la webometría y la webmetría
Análisis de la Web a nivel
Macro
Estudio de la Web de un país a través de un dominio específico
Estudio de la Internet Pública, Visible e Invisible
Estudios demográficos de la Web (Cibergeografía)
Estudio de los dominios físicos y lógicos
Björneborn, L. 2002. The deep Web: surfacing hidden value
Webometría o Webmetría
Webometrics or Webmetrics
Es Una Cuestión de matiz
It is a matter of nuance
É uma questão de matiz

Es Una Cuestión de Enfoque
It is a matter of focus
É uma questão de foco

Es Una Cuestión de superposición
It is a question of overlap
É uma questão de sobreposição

Es Una Cuestión de Definir el estudio
It is a question of defining the study
É uma questão de definição do estudo
Cibercienciometría
Informetría
Cienciometría
Bibliometría
Cibermetría
Webometría
Webmetría
Web
Producción científica
Información
Análisis cuantitativo
Mismas leyes de la información
Mismas relaciones entre sujeto productor, citante, citado y publicación
Metrías de la información
Núcleo de estudio
Quién produce la información

Qué información produce

Cuanta información produce

Qué propiedades tiene la información

Qué y a quién referencia

Por quién es referenciado

Qué reciprocidad existe en la referenciación
Personas, Instituciones, Bots, Sitios web, Países...
Páginas web, Documentos, Artículos, Investigaciones, Set de Datos...
Producción científica por autor, institución, país... según medio o fuente de información
Tamaño, tipo, caracterización, peso, valor...
Referencias bibliográficas, enlaces salientes o externos (outlinks), relación con otros documentos, personas...
Enlaces entrantes (inlinks), citas recibidas, menciones, reseñas...
A
B
A
cita a
B
B
cita a
A
Doc1
Doc2
Doc3
A
cita a
B
Deudor - Acreedor
Enfocar el análisis de la Web
Análisis Macro
Análisis Micro
Selección de una
muestra
representativa
Por ejemplo
Web de la
Universidad
Web de la
Administración pública
Web
gubernamental
Web de
centros de investigación
Web de
revistas
de un sector temático
Web de
medios
de comunicación
Plantear el alcance del análisis
Estudios Macro

Estudios Micro

Estudios Adhoc
Toda la web

Muestra de la web
Estudio de la Web Portuguesa
Partiendo de una
muestra
de sitios web representativos
Usando todos los sitios web de Portugal según dominio
Estudio de la Web de Universidades Españolas
Usando todos los sitios web de Universidades Españolas
Criterios

de selección (
Fecha, temática, idiomica, país, palabra clave, sector...
)
¿Qué
herramientas
se necesitan para
estudiar la web
?
1. WebCrawler
2. Motores de búsqueda
3. Visualización
WebCrawler
Motores de búsqueda
Herramientas de visualización
Permite realizar estudios de la Web

Análisis de la Web a través de los enlaces

Extracción de código fuente de la Web

Extracción de los contenidos de un sitio web

Extracción y gestión de recursos de información

Creación de archivos de BigData
Servicio de búsqueda orientado al usuario

Consulta de contenidos indexados por WebCrawler

Obtención de datos estadísticos por consulta

Permite realizar estudios de la Web

Dependencia del Buscador para obtener resultados

Requiere métodos de consulta avanzados
Representar la Web analizada

Mostrar áreas de interés de una muestra Web

Visualizar principales núcleos de relación

Generar un grafo de sitios web, páginas y relaciones

Complementación del estudio de la Web
Nutch
Heritrix
Wire
SocSciBot
Mbot
PHPCrawl
Google
Yahoo
Bing
WauSearch
Duck Duck Go
Graphviz
Gephi
Cytoscape
Linkurious
MentionMap
Pasos para analizar la Web
1. Crear una muestra de enlaces de dominios o sitios que serán analizados

2. Verificar la corrección de los enlaces de la muestra

3. Cargar la semilla de enlaces en el programa WebCrawler

4. Configurar el programa WebCrawler para el análisis de la muestra

5. Ejecutar el programa WebCrawler y verificar su funcionamiento

6. Guardar, exportar resultados y repetir la prueba

7. Comparación de los resultados de las pruebas y verificación

8. Estudio de los resultados del análisis Web
Qué puede ser analizado 1
Qué puede ser analizado 2
Qué puede ser analizado 3
Qué puede ser analizado 4
Qué puede ser analizado 5
Número de
páginas web por Sitio Web
y
Estadística básica

Enlaces externos

entrantes
a un Sitio Web

Enlaces internos
entrantes
de un Sitio a una página Web

Enlaces salientes
a un Sitio Web externo

Número de
coenlaces
entre Sitios y páginas Web internos y externos

Anclajes
- Anchors
Enlaces erróneos -
Errores
de codificación

Densidad
hipertextual (
Número de enlaces / Palabras
)

Métrica de contenidos
(
Palabras, frases, párrafos, titulares, encabezados, número de caracteres
)

Cabeceras
de las páginas web (headers)

Tiempo de carga
de las páginas web

Tamaño
de un Sitio Web o una página web
Documentos
ofimáticos
(
doc, ppt, xls, mdb
)

Densidad de
documentos por página

Web
dinámica
(
PHP, ASP
) y Web
estática
(
HTML
)

Documentos
multimedia
(
Imágenes por formato, Audio por formato, Vídeo por formato
)

Densidad
multimedia por página

Tiempo de
actualización
de páginas y Sitios Web
Metaetiquetas -
metatags

Metadatos
Dublin Core
DC y Qualified

Canales de sindicación
RSS, Atom, OPML

Web Semántica
RDF

Ontologías
OWL

Rango
de un sitio o página web (
PageRank, Alexa Rank
)
Peso
o
coeficiente de importancia
de un Sitio Web

Análisis de la
web social
(
Enlaces a Facebook, Twitter...
)

Distribución
idiomática


Bancos de datos (
SQL
, CSV, TAB, XML Raw...
)

Correos electrónicos
Email
Cómo se crea una muestra o semilla?
Cómo se trabaja con un WebCrawler?
¿Por dónde empezar?
Preparando semillas!
Salida de datos activa!
Extracción de metadatos activada!

Filtros de palabras clave activados!

Práctica 1
Práctica 2
Full transcript