Introducing 

Prezi AI.

Your new presentation assistant.

Refine, enhance, and tailor your content, source relevant images, and edit visuals quicker than ever before.

Loading content…
Loading…
Transcript
  • Web de la Universidad
  • Web de la Administración pública
  • Web gubernamental
  • Web de centros de investigación
  • Web de revistas de un sector temático
  • Web de medios de comunicación

¿Por dónde empezar?

Cienciometría

Bibliometría

Análisis de la Web

Leyes

  • Disciplina científica encargada del estudio de la producción científica en las ramas de la Ciencia (Humanidades, Ciencias Sociales, Ciencias Puras y Ciencias Experimentales)

  • El objetivo de la Cienciometría es medir cuantitativa y cualitativamente la producción científica.
  • Ley de crecimiento exponencial
  • Ley de productividad de los autores
  • Ley de obsolescencia de la literatura científica
  • Ley de dispersión de la literatura científica
  • Estudio estadístico y cuantitativo de la literatura científica

  • Estudio de la producción científica de los investigadores

  • Estudio de las citas bibliográficas

  • Comprobación de las leyes bibliométricas

  • Estudio evolutivo de las publicaciones científicas

  • Estudio de la relevancia de las publicaciones científicas

  • Evaluación de la ciencia basada en la productividad

  • Estudio de la diseminación y redifusión de la ciencia
  • Indicadores de producción
  • Indicadores de circulación
  • Indicadores de dispersión
  • Indicadores de uso de la literatura científica
  • Indicadores de visibilidad o impacto
  • Indicadores de colaboración

Prof. Manuel Blázquez Ochando

Indicadores

Dpto. Biblioteconomía y Documentación

Universidad Complutense de Madrid

Informetría

  • Estudio de los aspectos cuantitativos de la información

  • Aborda el estudio de la comunicación formal, informal, científica y no científica

  • Análisis de todos los tipos de información

  • Análisis de la información producida por los medios de comunicación

Cibermetría = Webometría

  • Análisis cuantitativo de la comunicación y producción de información en el ciberespacio

  • El ciberespacio tiene un alcance global superior a la webometría y la webmetría
  • Frecuencia de aparición de términos, expresiones e informaciones
  • Producción informativa de autores
  • Estudio de las fuentes de información y la citación
  • Obsolescencia de la información
  • Demanda y oferta de la información
  • Crecimiento de la literatura según temáticas
  • Análisis de la Web a nivel Macro
  • Estudio de la Web de un país a través de un dominio específico
  • Estudio de la Internet Pública, Visible e Invisible
  • Estudios demográficos de la Web (Cibergeografía)
  • Estudio de los dominios físicos y lógicos
  • Debate científico en torno a la significación de los conceptos
  • Pueden ser considerados términos sinónimos
  • Webmetría se orienta al análisis de enlaces

Webometría = Webmetría

Webometrics

  • La Webometría estudia la Web, estructura, hipertexto, topografía

[Análisis de la Web]

Björneborn, L. 2002. The deep Web: surfacing hidden value

Metrías de la información

Núcleo de estudio

Doc1

Plantear el alcance del análisis

A cita a B

Doc2

Análisis cuantitativo

Webometría o Webmetría

Webometrics or Webmetrics

Personas, Instituciones, Bots, Sitios web, Países...

Páginas web, Documentos, Artículos, Investigaciones, Set de Datos...

Cibercienciometría

Informetría

Cienciometría

Bibliometría

Cibermetría

Webometría

Webmetría

Web

Producción científica

Información

Producción científica por autor, institución, país... según medio o fuente de información

B

A

Toda la web

Muestra de la web

  • Quién produce la información

  • Qué información produce

  • Cuanta información produce

  • Qué propiedades tiene la información

  • Qué y a quién referencia

  • Por quién es referenciado

  • Qué reciprocidad existe en la referenciación

Tamaño, tipo, caracterización, peso, valor...

Doc3

Estudios Macro

Estudios Micro

Estudios Adhoc

B cita a A

Referencias bibliográficas, enlaces salientes o externos (outlinks), relación con otros documentos, personas...

Es Una Cuestión de matiz

It is a matter of nuance

É uma questão de matiz

Es Una Cuestión de Enfoque

It is a matter of focus

É uma questão de foco

Es Una Cuestión de superposición

It is a question of overlap

É uma questão de sobreposição

Es Una Cuestión de Definir el estudio

It is a question of defining the study

É uma questão de definição do estudo

Mismas leyes de la información

A cita a B

Enlaces entrantes (inlinks), citas recibidas, menciones, reseñas...

Mismas relaciones entre sujeto productor, citante, citado y publicación

Criterios de selección (Fecha, temática, idiomica, país, palabra clave, sector...)

Deudor - Acreedor

Estudio de la Web Portuguesa

  • Partiendo de una muestra de sitios web representativos
  • Usando todos los sitios web de Portugal según dominio

Estudio de la Web de Universidades Españolas

  • Usando todos los sitios web de Universidades Españolas

Enfocar el análisis de la Web

Análisis Macro

Análisis Micro

Selección de una muestra representativa

¿Qué herramientas se necesitan para estudiar la web?

Por ejemplo

Pasos para analizar la Web

1. WebCrawler

2. Motores de búsqueda

3. Visualización

1. Crear una muestra de enlaces de dominios o sitios que serán analizados

2. Verificar la corrección de los enlaces de la muestra

3. Cargar la semilla de enlaces en el programa WebCrawler

4. Configurar el programa WebCrawler para el análisis de la muestra

5. Ejecutar el programa WebCrawler y verificar su funcionamiento

6. Guardar, exportar resultados y repetir la prueba

7. Comparación de los resultados de las pruebas y verificación

8. Estudio de los resultados del análisis Web

Herramientas de visualización

WebCrawler

Motores de búsqueda

Qué puede ser analizado 1

  • Número de páginas web por Sitio Web y Estadística básica

  • Enlaces externos entrantes a un Sitio Web

  • Enlaces internos entrantes de un Sitio a una página Web

  • Enlaces salientes a un Sitio Web externo

  • Número de coenlaces entre Sitios y páginas Web internos y externos

  • Anclajes - Anchors
  • Representar la Web analizada

  • Mostrar áreas de interés de una muestra Web

  • Visualizar principales núcleos de relación

  • Generar un grafo de sitios web, páginas y relaciones

  • Complementación del estudio de la Web
  • Servicio de búsqueda orientado al usuario

  • Consulta de contenidos indexados por WebCrawler

  • Obtención de datos estadísticos por consulta

  • Permite realizar estudios de la Web

  • Dependencia del Buscador para obtener resultados

  • Requiere métodos de consulta avanzados
  • Permite realizar estudios de la Web

  • Análisis de la Web a través de los enlaces

  • Extracción de código fuente de la Web

  • Extracción de los contenidos de un sitio web

  • Extracción y gestión de recursos de información

  • Creación de archivos de BigData

Qué puede ser analizado 2

Qué puede ser analizado 3

  • Documentos ofimáticos (doc, ppt, xls, mdb)

  • Densidad de documentos por página

  • Web dinámica (PHP, ASP) y Web estática (HTML)

  • Documentos multimedia (Imágenes por formato, Audio por formato, Vídeo por formato)

  • Densidad multimedia por página

  • Tiempo de actualización de páginas y Sitios Web
  • Enlaces erróneos - Errores de codificación

  • Densidad hipertextual (Número de enlaces / Palabras)

  • Métrica de contenidos (Palabras, frases, párrafos, titulares, encabezados, número de caracteres)

  • Cabeceras de las páginas web (headers)

  • Tiempo de carga de las páginas web

  • Tamaño de un Sitio Web o una página web

Graphviz

Cytoscape

Google

Yahoo

Heritrix

Nutch

Gephi

Linkurious

WauSearch

Bing

SocSciBot

Wire

Qué puede ser analizado 5

Qué puede ser analizado 4

MentionMap

Duck Duck Go

Mbot

PHPCrawl

  • Peso o coeficiente de importancia de un Sitio Web

  • Análisis de la web social (Enlaces a Facebook, Twitter...)

  • Distribución idiomática

  • Bancos de datos (SQL, CSV, TAB, XML Raw...)

  • Correos electrónicos Email
  • Metaetiquetas - metatags

  • Metadatos Dublin Core DC y Qualified

  • Canales de sindicación RSS, Atom, OPML

  • Web Semántica RDF

  • Ontologías OWL

  • Rango de un sitio o página web (PageRank, Alexa Rank)

Cómo se crea una muestra o semilla?

Práctica 1

Cómo se trabaja con un WebCrawler?

Salida de datos activa!

Preparando semillas!

Extracción de metadatos activada!

Filtros de palabras clave activados!

Práctica 2

Learn more about creating dynamic, engaging presentations with Prezi