Introducing
Your new presentation assistant.
Refine, enhance, and tailor your content, source relevant images, and edit visuals quicker than ever before.
Trending searches
ACFAS 2012
Transformations des pratiques culturelles à l’ère du numérique : nouvelles technologies, nouveaux publics ?
Jean-Robert BISAILLON
l/as/tt - INRS - UCS - Institut national de la recherche scientifique - Urbanisation Culture Société
Les métadonnées musicales : un enjeu de diversité culturelle
8 mai – 10h15 (20 minutes de présentation et 20 minutes de questions) - Palais des congrès (513F)
Notre typologie propose quelques douze types plus ou moins différents de bases de données et métadonnées.
Elle met en lumière un nombre élevé d'initiatives parallèles en lien avec la constitution de bases de métadonnées musicales.
Elles ont toutes leurs caractéristiques propres sur le plan de...
leur liberté d'accès
leur inter-opérabilité
l'exhaustivité des répertoires qu'elles proposent
leur qualité en matière de témoignage sur la diversité culturelle
Elles interrogent...
l'apport des industries culturelles ou de la société civile à leur constitution
les approches choisies pour incruster les dites métadonnées dans les fichiers audio-numériques
la corrélation entre les fichiers audio-numériques qui circulent en-ligne et les bases de métadonnées servant à leur identification
l'éventuelle rémunération des ayants droit associés à ces oeuvres et leur usage
Une gouvernance existe désormais pour définir des standards en ces matières dans la sphère commerciale, notamment chez DDEX et la Global Répertoire Database (GRD).
Il existe divers lieux décisionnels discutant des enjeux de constitution de telles bases de données dans les sphères documentaire, institutionnelle et patrimoniale. Citons notamment IMR-WIPO et le RDA Joint Steering Committee (Ressource Description and Access).
Voici ce que je vous propose comme typologie (document Google International_Musical_Databases_(Master) créé par Jean-Robert Bisaillon)
Les métadonnées sont des codes informatiques de description de contenus associés aux fichiers numérisés porteurs de ces dits contenus. Ce sont des textes, des images, des hyperliens ou encore des numéros de référence qui accompagnent le son.
Par exemple, le format audio numérique MP3 permet d'associer jusqu'à 74 champs d'information divers aux bits d'information composant le signal sonore (voir le standard ID3 V2.3 - http://www.id3.org/Home – http://www.id3.org/id3v2.3.0)
4.2.1 TALB [#TALB Album/Movie/Show title]
4.2.1 TBPM [#TBPM BPM (beats per minute)]
4.2.1 TCOM [#TCOM Composer]
4.2.1 TCON [#TCON Content type]
4.2.1 TCOP [#TCOP Copyright message]
4.2.1 TDAT [#TDAT Date]
4.2.1 TDLY [#TDLY Playlist delay]
4.2.1 TENC [#TENC Encoded by]
4.2.1 TEXT [#TEXT Lyricist/Text writer]
Quant à lui, le standard de métadonnées SONY-Gracenote utilisé par Apple/iTunes, permet pour sa part d'annexer quelques 25 champs d'information aux fichiers audio-numériques. On comprendra que ces champs n'étant pas du même nombre, ils ne sont pas davantage libellés selon les mêmes termes.
Les bases de données musicales utilisées par les divers services commerciaux de musique en ligne, les bases de données bibliographiques utilisée par les bibliothèques ou médiathèques de prêts ou encore les bases de données des gestionnaires collectifs de droits d'auteur permettent toutes la consignation de telles métadonnées. Toutefois, leurs architectures sont toutes différentes.
Dès lors se pose la question de la complémentarité et de l'interopérabilité de ces diverses bases de données, de leur capacité ou de leur pertinence à communiquer entre elles. Je crois que de cette communication pourrait dépendre leur exhaustivité, leur richesse de contenus.
Mon intuition de départ est à l'effet qu'un très fort déterminisme technique est à l'oeuvre actuellement dans les divers processus de numérisation de la musique, de catalogage informatique de celle-ci et de la définition des métadonnées dans les bases de données musicales industrielles et institutionnelles en ligne et hors ligne.
À terme, je souhaite questionner les effets de ce déterminisme sur la diversité culturelle et questionner les processus sociaux-politiques à l'oeuvre ayant une influence sur les biais culturels que pourraient induire ces technologies.
Ma présentation consiste à partager avec vous une typologie des bases de données musicales existantes qui soulèvera je l'espère des questionnements en lien avec mon hypothèse. Ce travail préliminaire s'inscrit dans un projet de recherche-action conduisant à la maîtrise.
Je débute actuellement une série d'entretiens avec des acteurs québécois et étrangers engagés dans l'usage et les réflexions autour des métadonnées musicales.
Ma présentation avait pour but d'illustrer les déterminismes techniques potentiellement présents dans les processus de définition des bases de métadonnées musicales.
La suite de mes recherches s'attardera à vérifier si ceux-ci sont contrebalancés par des usages sociaux, des processus d'adoption de normes qui offriront certaines garanties de préservation de la diversité culturelle dans cet environnement technique et industriel.
C'est en usant d'une approche interdisciplinaire et épistémologique en sciences sociales du champ culturel, que je chercherai à mieux comprendre les déterminismes actifs dans cette problématique. L'exemple des métadonnées musicales et de leurs usages sur Internet est peut-être un épiphénomène riche en enseignements.
La française Madeleine Akrich et sa théorie du « script »,
l'américain Larry Lessig dans ses écrits sur le rôle du « Code »,
le britanique Steve Woolgar dans ce qu'il appelle la « User Configuration »
et divers autres auteurs, ont évoqué ces biais induits par le « design technologique », allant parfois jusqu'à évoquer l'idée de la présence d'un racisme dans le design
(voir à ce sujet Jauréguiberry F, Proulx S. (2011) Usages et enjeux des technologies de communication. Toulouse).
Si les bases de données informatiques associées aux biens culturels ne tiennent pas parfaitement compte de la richesse des caractéristiques culturelles à priori, l'enjeu de la constitution de bases de métadonnées culturelles deviendra dès lors un enjeu de préservation de la diversité culturelle et de développement durable.
Enfin, les nouvelles théories du bigdata, de plus en plus associées à la création et le recours aux bases de données, est à l'effet que celles-ci atteignent désormais des tailles qu'il est impossible de traiter par les approches conventionnelles associées à l'informatique des bases de données.
Notre projet de recherche-action prévoit éventuellement une phase complémentaire qui abordera cette question de la taille et des processus liés au nettoyage des bases de données culturelles, de leur mise à jour.
Merci.
Importance de la valeur économique des propositions se situant dans la longue traîne.
Le journaliste et économiste des technologies de l'information Chris Anderson a actualisé la théorie économique de la courbe de Vilfredo Pareto (1848-1923) et baptisé sa nouvelle théorie « The Long Tail ». Cette nouvelle théorie fait toujours l'objet d'un grand nombre d'écrits et de critiques. (voir notamment Anita Elberse : Should You Invest in the Long Tail? Harvard Business Review. 2008.)
Chris Anderson affirme que les deux premières forces de la longue traîne ont enrichi l'offre et démocratisé la distribution des contenus numérisés pour peupler la traîne. Il poursuit en affirmant que dans ce nouveau contexte d'hyper-choix, une troisième force « qui aide les gens à trouver ce qu’ils veulent au sein de cette surabondance nouvelle. » est devenue nécessaire. Elle s'incarne dans les outils de recherche et de recommandation. L'efficacité de ces outils repose notamment sur le recours aux métadonnées.
Mon hypothèse de travail est à l'effet que les impacts économiques et culturels de la nouvelle économie de la longue traîne, sont tributaires d'une nécessaire étape de constitution des métadonnées. Il s'agit pour moi du principal oubli que font les critiques de la théorie de la longue traîne. Enfin, cet enjeu en est un de diversité culturelle. De la qualité et de l'interopérabilité des bases de données dépendrait la circulation des contenus.
Supply Chain Market Data (9) - Données de marché
Services aux industries fondés sur des bases de données privées et des protocoles permettant de fournir des données de marchés sur les flux de circulation des oeuvres.
BigChampagne témoigne notamment de l'impact des échanges de fichiers entre usagers ou encore Nielsen produit des données de ventes de phonogrammes en magasin et dispose conséquemment d'importantes bases de données informatiques de titres.
Copyright Management (6 +) - Gestion collective de droits
Bases de données propriétaires créés par les collectifs de gestion de droits d’auteur.
Souvent fondées sur des impératifs territoriaux, nous observons une volonté de fusion des ces bases tel que l'incarne le consortium FastTrack DCN qui regroupe les collectifs AKM (Autriche), ASCAP et BMI (USA), Buma / Stemra (Hollande), GEMA (Allemagne), PRS for Music (UK), SABAM (Belgique), SACEM (France), SGAE (Espagne), SIAE (Italie), SOCAN (Canada), SUISA (Suisse).
Global Reference Database (4) - Bases de références globales
Bases de données propriétaires ou libres, alimentées ou non par la foule (user generated/crowsourced), ayant pour objectif de constituer une référence universelle et exhaustive.
Le consortium GRD vient de chiffrer à 30M d'Euros les coûts de constitution et de nettoyage d'une telle base mondialisée. L'initiative open source MusicBrainz propose une base aux objectifs similaires selon un modèle de production collaborative.
Stakeholder Dialogue Structure (4) - Organismes de gouvernance
Consortiums visant la définition de standards et organismes de gouvernance ou de médiation sectorielle.
DDEX (Digital Data Exchange) est un protocole d'interopérabilité standardisé, mis sur pied par un consortium sectoriel industriel. Deux protocoles sont particulièrement utilisés : Release Notification Standard, qui signale la publication de nouveautés et le Sales Reporting Standard, qui signale les ventes et usages.
Editorial Content (4) - Sites éditoriaux
Bases de connaissances fournissant des données biographiques associées aux contenus musicaux.
ROVI All Music et MusicStory possèdent des archives éditoriales dignes d'intérêt pour compléter les informations biographiques d'artistes pouvant être associées aux fichiers audio-numériques.
Industry Private Database (1) (+- 4) - Données industrielles propriétaires
Bases de données des multinationales de la distribution commerciale (UMG, SONY, WARNER, EMI).
Unique ID database (3) - Identifiants uniques
Organismes attribuant des codes alphanumériques permettant l’identification d’oeuvres.
IFPI et l'attribution des codes ISRC (ISO3901)
ISWC.org pour le International Standard Musical Work Code (ISO15707)
Audio Reference Data (3) - Bases de références audio
Services dépositaires d’empreintes audio spectrales (audio fingerprints) ou de systèmes de reconnaissance spectrale.
Shazam et SoundHound, deux concurrents de la reconnaissance spectrale sur appareil mobile permettent de suivre les paroles d'une chanson en temps réel sur l'écran de son téléphone
Recommendation Engine (2) - Moteurs de recommandations profilées
Applications technologiques permettant de profiler les goûts et de proposer des contenus variant selon les habitudes d'écoute et les besoins présumés des internautes.
Last.fm Scrobbler et API The Echo Nest
https://docs.google.com/spreadsheet/ccc?key=0ArlZg_F_pbkrdG9jM05sby1RSnVlZlFjVnUwdmF4LXc
http://bit.ly/inrsmeta