EMS Proceedings and Other Publications

Des index aux bases de connaissances : prospection sémantique pour une musicologie de l’électroacoustique

Bruno Bossis

France, Université Paris IV-Sorbonne, Université Rennes 2
bruno.bossis@uhb.fr

Article

PDF - 134 ko
Téléchargez l’article

Résumé

Depuis de nombreuses années, des répertoires compilant les références des écrits consacrés à la musique ou les sources musicales elles-mêmes ont été développés sur papier puis sur le web. Si le RILM et le RISM ne sont pas spécialisés sur des styles, des genres et des périodes, d’autres recensions sont plus particulièrement orientées vers les musiques électroacoustiques. Après les premiers ouvrages imprimés répertoriant les œuvres de ce domaine, différents projets ont publié en ligne de vastes recensions, au MINT de l’Université Paris IV-Sorbonne (sommaires de publications, répertoire d’analyses hypermédias), au Research Center de l’Université de De Montfort (portail EARS), au FEMS de l’Université de Floride (recension de liens vers des lieux, des genres et des sociétés)... Ces quelques exemples sont avant tout des listes. Le collectage, l’hébergement et l’interrogation de ces données ne posent pas de grandes difficultés, et les contraintes liées à la langue et à la traduction restent raisonnables. Extrêmement précieux pour les musiciens et les musicologues, ces travaux ne sont cependant pas orientés vers le contenu, même si l’accès aux sommaires des publications constitue un premier pas vers une exploration des connaissances.

Pourtant, dans d’autres domaines, les bases de données se transforment ou cohabitent de plus en plus souvent avec des bases de connaissances. Si les sciences humaines ont peu développé ce type de ressources, les sciences techniques en ont déjà une longue expérience, notamment dans le cadre des veilles technologiques. Cette fois, l’objet collecté et manipulé est le contenu. Mais cette prise en compte de l’aspect sémantique a plusieurs conséquences. D’une part, le langage étant indispensable à la connaissance, le rapport à la langue devient primordial. Pour qu’il y ait compréhension d’un champ sémantique, pour une analyse de contenu, il faut un contexte, des expressions ou des termes communs. D’autre part, les connaissances sont habituellement structurées de manière complexe en catégories, réseaux, hiérarchies. Les bases de connaissances étant déjà exploitées dans les sciences techniques et les entreprises, il existe des procédés généraux pour la capitalisation, la gestion et le partage de connaissances. Ainsi, la méthode MASK analyse le corpus selon trois approches : l’information (données brutes), la signification (concepts) et le contexte. Ce type de système est actuellement utilisé dans des domaines d’applications aussi divers que le biomédical, la météorologie ou l’audiovisuel.

Concevoir un tel système sémantique dans le domaine de la musicologie de l’électroacoustique sollicitera des compétences croisées issues de ce champ de recherche et de la théorie des bases de connaissances et les applications associées. Quelles pistes sont envisageables ? Pour établir une base de connaissances, trois étapes sont nécessaires : la capture des données par l’analyse des contenus, la génération de descripteurs, la recherche d’informations sémantiques et leur visualisation. Dans certains cas, la capture pourra prendre appui sur l’interprétation de documents structurés. En France, l’Irisa mène des recherches avancées dans cette direction (édition de partitions orientée stylet par exemple, en collaboration avec le MIAC de l’Université Rennes 2). Par ailleurs, quel que soit le domaine, les descripteurs unifiés sont souvent basés sur une syntaxe XML. En musicologie, ces descripteurs devront prendre en compte les métadonnées préexistantes (comme celles contenues dans le standard MPEG7). Enfin, l’interrogation, l’extraction et la présentation des connaissances peuvent bénéficier de l’expérience du monde industriel (data mining).

Plusieurs particularités doivent être prises en compte en musicologie. Dans une base de connaissances, le rapport à la langue est beaucoup plus étroit que dans les index. En effet, la dimension sémantique est indissociable du langage et joue un rôle déterminant dans l’acquisition et la valorisation de connaissances. Pour qu’il y ait compréhension, il faut un contexte commun aux interlocuteurs. La précision des définitions et traductions d’expressions comme « musique électroacoustique » ou « musique électronique », « tape music », etc., prennent alors une importance d’autant plus considérable. De plus, en musicologie, les concepts maniés ne sont pas tous d’ordre scientifique. Toutes les catégories d’items ne sont pas équivalentes, et certains items restent difficilement classables. Par ailleurs, la musique contemporaine ne constituant pas un domaine défini une fois pour toutes, la mise à jour de la base serait réalisée sur des connaissances aux caractéristiques inconnues pendant la conception du système.

Malgré ces difficultés, l’élaboration de bases de connaissances est une étape indispensable vers une musicologie systématique. Le champ disciplinaire concerné se révèle éminemment complexe, mais hautement structuré. Ainsi, l’utilisation des technologies de gestion des connaissances peut participer à l’avancée de l’histoire et de l’analyse des musiques électroacoustiques et les décrire. L’objectif est de passer d’un empilement de références donnant accès à des sources à une vision structurée permettant de dégager des invariants.