- Web de la Universidad
- Web de la Administración pública
- Web gubernamental
- Web de centros de investigación
- Web de revistas de un sector temático
- Web de medios de comunicación
Análisis de la Web
- Disciplina científica encargada del estudio de la producción científica en las ramas de la Ciencia (Humanidades, Ciencias Sociales, Ciencias Puras y Ciencias Experimentales)
- El objetivo de la Cienciometría es medir cuantitativa y cualitativamente la producción científica.
- Ley de crecimiento exponencial
- Ley de productividad de los autores
- Ley de obsolescencia de la literatura científica
- Ley de dispersión de la literatura científica
- Estudio estadístico y cuantitativo de la literatura científica
- Estudio de la producción científica de los investigadores
- Estudio de las citas bibliográficas
- Comprobación de las leyes bibliométricas
- Estudio evolutivo de las publicaciones científicas
- Estudio de la relevancia de las publicaciones científicas
- Evaluación de la ciencia basada en la productividad
- Estudio de la diseminación y redifusión de la ciencia
- Indicadores de producción
- Indicadores de circulación
- Indicadores de dispersión
- Indicadores de uso de la literatura científica
- Indicadores de visibilidad o impacto
- Indicadores de colaboración
Prof. Manuel Blázquez Ochando
Dpto. Biblioteconomía y Documentación
Universidad Complutense de Madrid
- Estudio de los aspectos cuantitativos de la información
- Aborda el estudio de la comunicación formal, informal, científica y no científica
- Análisis de todos los tipos de información
- Análisis de la información producida por los medios de comunicación
- Análisis cuantitativo de la comunicación y producción de información en el ciberespacio
- El ciberespacio tiene un alcance global superior a la webometría y la webmetría
- Frecuencia de aparición de términos, expresiones e informaciones
- Producción informativa de autores
- Estudio de las fuentes de información y la citación
- Obsolescencia de la información
- Demanda y oferta de la información
- Crecimiento de la literatura según temáticas
- Análisis de la Web a nivel Macro
- Estudio de la Web de un país a través de un dominio específico
- Estudio de la Internet Pública, Visible e Invisible
- Estudios demográficos de la Web (Cibergeografía)
- Estudio de los dominios físicos y lógicos
- Debate científico en torno a la significación de los conceptos
- Pueden ser considerados términos sinónimos
- Webmetría se orienta al análisis de enlaces
- La Webometría estudia la Web, estructura, hipertexto, topografía
Björneborn, L. 2002. The deep Web: surfacing hidden value
Metrías de la información
Plantear el alcance del análisis
Webometría o Webmetría
Webometrics or Webmetrics
Personas, Instituciones, Bots, Sitios web, Países...
Páginas web, Documentos, Artículos, Investigaciones, Set de Datos...
Cibercienciometría
Informetría
Cienciometría
Bibliometría
Cibermetría
Webometría
Webmetría
Web
Producción científica
Información
Producción científica por autor, institución, país... según medio o fuente de información
Toda la web
Muestra de la web
- Quién produce la información
- Cuanta información produce
- Qué propiedades tiene la información
- Por quién es referenciado
- Qué reciprocidad existe en la referenciación
Tamaño, tipo, caracterización, peso, valor...
Estudios Macro
Estudios Micro
Estudios Adhoc
Referencias bibliográficas, enlaces salientes o externos (outlinks), relación con otros documentos, personas...
Es Una Cuestión de matiz
It is a matter of nuance
É uma questão de matiz
Es Una Cuestión de Enfoque
It is a matter of focus
É uma questão de foco
Es Una Cuestión de superposición
It is a question of overlap
É uma questão de sobreposição
Es Una Cuestión de Definir el estudio
It is a question of defining the study
É uma questão de definição do estudo
Mismas leyes de la información
Enlaces entrantes (inlinks), citas recibidas, menciones, reseñas...
Mismas relaciones entre sujeto productor, citante, citado y publicación
Criterios de selección (Fecha, temática, idiomica, país, palabra clave, sector...)
Estudio de la Web Portuguesa
- Partiendo de una muestra de sitios web representativos
- Usando todos los sitios web de Portugal según dominio
Estudio de la Web de Universidades Españolas
- Usando todos los sitios web de Universidades Españolas
Enfocar el análisis de la Web
Análisis Macro
Análisis Micro
Selección de una muestra representativa
¿Qué herramientas se necesitan para estudiar la web?
Por ejemplo
Pasos para analizar la Web
1. WebCrawler
2. Motores de búsqueda
3. Visualización
1. Crear una muestra de enlaces de dominios o sitios que serán analizados
2. Verificar la corrección de los enlaces de la muestra
3. Cargar la semilla de enlaces en el programa WebCrawler
4. Configurar el programa WebCrawler para el análisis de la muestra
5. Ejecutar el programa WebCrawler y verificar su funcionamiento
6. Guardar, exportar resultados y repetir la prueba
7. Comparación de los resultados de las pruebas y verificación
8. Estudio de los resultados del análisis Web
Herramientas de visualización
Qué puede ser analizado 1
- Número de páginas web por Sitio Web y Estadística básica
- Enlaces externos entrantes a un Sitio Web
- Enlaces internos entrantes de un Sitio a una página Web
- Enlaces salientes a un Sitio Web externo
- Número de coenlaces entre Sitios y páginas Web internos y externos
- Representar la Web analizada
- Mostrar áreas de interés de una muestra Web
- Visualizar principales núcleos de relación
- Generar un grafo de sitios web, páginas y relaciones
- Complementación del estudio de la Web
- Servicio de búsqueda orientado al usuario
- Consulta de contenidos indexados por WebCrawler
- Obtención de datos estadísticos por consulta
- Permite realizar estudios de la Web
- Dependencia del Buscador para obtener resultados
- Requiere métodos de consulta avanzados
- Permite realizar estudios de la Web
- Análisis de la Web a través de los enlaces
- Extracción de código fuente de la Web
- Extracción de los contenidos de un sitio web
- Extracción y gestión de recursos de información
- Creación de archivos de BigData
Qué puede ser analizado 2
Qué puede ser analizado 3
- Documentos ofimáticos (doc, ppt, xls, mdb)
- Densidad de documentos por página
- Web dinámica (PHP, ASP) y Web estática (HTML)
- Documentos multimedia (Imágenes por formato, Audio por formato, Vídeo por formato)
- Densidad multimedia por página
- Tiempo de actualización de páginas y Sitios Web
- Enlaces erróneos - Errores de codificación
- Densidad hipertextual (Número de enlaces / Palabras)
- Métrica de contenidos (Palabras, frases, párrafos, titulares, encabezados, número de caracteres)
- Cabeceras de las páginas web (headers)
- Tiempo de carga de las páginas web
- Tamaño de un Sitio Web o una página web
Qué puede ser analizado 5
Qué puede ser analizado 4
- Peso o coeficiente de importancia de un Sitio Web
- Análisis de la web social (Enlaces a Facebook, Twitter...)
- Bancos de datos (SQL, CSV, TAB, XML Raw...)
- Correos electrónicos Email
- Metadatos Dublin Core DC y Qualified
- Canales de sindicación RSS, Atom, OPML
- Rango de un sitio o página web (PageRank, Alexa Rank)
Cómo se crea una muestra o semilla?
Cómo se trabaja con un WebCrawler?
Extracción de metadatos activada!
Filtros de palabras clave activados!