CWRC Ontology Preamble


Résumé

1. Introduction

2. Contexte des données source d'Orlando

ICD-10-SMoL was chosen because it is a simplified version of the ICD-10. ICD (International Classification of Diseases) "is the foundation for the identification of health trends and statistics globally, and the international standard for reporting diseases and health conditions. It is the diagnostic classification standard for all clinical and research purposes. ICD defines the universe of diseases, disorders, injuries and other related health conditions" [http://www.who.int/classifications/icd/en/].

Version 1.0 of this ontology was compiled for the CWRC ontology project and reflects the need to have causes of death and health issues organized in a way to allow for analysis of cultural data. A simplified list was deemed sufficient since the domain under study (cultural documents) will not have detailed medical information with regards to cause of death or health issues. But instead of accepting a list of general usage terms for causes of death or health issues that appear in some sources (e.g. Wikipedia, Wikidata, etc.), a standardized, medical classification was selected so that it could be of use for future analysis regarding questions involving the intersection of health and culture.

ICD-10-SMoL was chosen since it was the latest version of this list (June, 2018). A stable version of ICD-11 was to be available in June 2018 but there was no ICD-11-SMoL available at this time. To obtain the ICD10-SMoL: http://www.who.int/healthinfo/civil_registration/ICD_10_SMoL.pdf?ua=1

3. À propos de ce document

Ce document est une version de l'ontologie lisible par l'utilisateur qui ne peut pas documenter toutes ses structures de données. L'ontologie elle-même devrait servir de source principale à la compréhension de son fonctionnement.

Ce document est destiné au public académique qui souhaite comprendre la façon dont l'ontologie traite les problèmes concrets relatifs à l’enregistrement de données et aux professionnels des webs de données qui souhaitent utiliser l'ontologie.

4. Statut de l'ontologie dynamique

Ce document et l'ontologie associée sont développés de façon itérative et des modifications y seront apportées au fil du temps à mesure que les données sont progressivement traduites et que de nouveaux problèmes ontologiques sont identifiés. L'utilisation des annotations d'ontologies OWL pour la compatibilité ontologique ainsi que les classes et propriétés obsolètes assure sa continuité. Les termes supprimés de l'ontologie restent présents mais sont signalés comme tels.

L'ontologie est comprise comme un document évolutif qui ne prétend pas à l’exhaustivité. En particulier, les instances sont dérivées de jeux de données spécifiques et seront développées progressivement. Nous acceptons les suggestions de nouvelles classes, de propriétés et de prédicats de la part des personnes souhaitant utiliser l'ontologie pour leurs propres jeux de données, ainsi que des suggestions sur les termes de vocabulaires complexes déjà existants.

5. Data Sources

6. Objectifs ontologiques fondamentaux

a. Liens vers d'autres ontologies

Nous employons plusieurs stratégies afin de nous relier à d'autres ontologies. Notre architecture n’importe pas intégralement d'ontologies tierces, mais renvoie à d'autres vocabulaires larges de façon précise. Nous nous efforçons de ne pas abuser du prédicat sameAs (Halpin, Hayes et al., 2010). Nous adoptons des espaces de noms, des classes et des termes associés dans la mesure du possible lorsqu'ils sont couramment employés et que leurs vocabulaires sont majoritairement compatibles avec le nôtre, comme c'est le cas du FOAF et du BIBO . Pour certains termes, tels que les dénominations religieuses ou les genres littéraires, nous nous appuyons volontiers, en partie ou en totalité, sur les termes et définitions d'autres vocabulaires comme dans le cas du Getty Art and Architecture Thesaurus (Getty Research Institute). D'autres termes sont référencés avec du recul critique. Ceci s’applique plus particulièrement au vocabulaire en lien avec la classe Forme Culturelle (voir ci-dessous), qui est avant tout considérée comme représentative et au sein de laquelle les termes d’identité sont entrés comme étiquettes rattachées à des instances internes plus précises, signalant l'intersection dudit terme avec un ou plusieurs types de catégorisation identitaire. Celles-ci sont à leur tour rattachées à des ontologies externes en tant que sous-classes, <rdfs:subClassOf> (or <owl:equivalentClass>, <skos:narrower>, <skos:broader>, etc...) pour indiquer qu'en dépit de leur proximité ces termes et leurs définitions ne ne sont pas comparables à ceux utilisés par le vocabulaire du CSÉC. Au moyen de cette structure, notre vocabulaire positionne tous les termes associés aux processus de Forme culturelle comme des "étiquettes", conservant ainsi au sein de la prose la complexité des termes relatifs à la complexe construction sociale des identités.

La récupération de vocabulaires a présenté certains défis au CSÉC puisque les vocabulaires utilisés dans le balisage à l'origine du RDF peuvent être employés de façon ambigüe, à un tel point que leur réutilisation devient difficile.

Les termes relatifs à la religion sont des exemples typiques de ces ambiguïtés, car il est difficile de déterminer si un terme représente effectivement une religion comme système de croyances, une adhésion formelle à l’organisation religieuse associée, des comportements sociaux souvent laïques oules affiliations en lien avec la religion, ou quelque autre combinaison des exemples ci-dessus.

b. Provenance et contextes

7. Règles de conception de l'ontologie de l’ontologie du CSÉC

Au-delà du formalisme du OWL 2 Web Ontology Language, l'ontologie du CSÉC suit les principes de design et les styles suivants:

  • ...

8. Notes sur les langages SKOS et OWL

Le SKOS (Simple Knowledge Organization System) jouit d'une grande popularité au sein de la communauté du web sémantique, car il fournit des termes simples pour les taxonomies sans exiger la présence d’un agent raisonneur. Chaque fois que cela s'avère approprié, les termes SKOS sont insérés dans cette ontologie pour relier les termes entre eux. Cependant, étant donné que ces termes ne sont pas ontologiquement renseignés, leur capacité d’évolution est limitée car chaque couche de termes supplémentaire dans une taxonomie nécessite une autre requête auprès de la base de données.

Certaines des constructions de l'ontologie du CSÉC sont complexes et requièrent un raisonnement. OWL est le moyen privilégié pour utiliser cette ontologie, bien que l'utilisation des termes, dans le style de ceux de SKOS, soit possible.

10. Conclusion et travail futur

Ce brouillon d’ontologie est un travail en cours. Il continuera d’être développé, étendu et révisé à mesure que nous découvrons ce qu’implique la structure de l’ontologie à travers l’extraction et l'exploration de nos données, puisque de nouvelles informations et divers cas d’utilisation nécessitent un travail d’élargissement ou de précision, et que nous identifions de nouveaux besoins, de nouvelles interprétations et de nouveaux débats.

11. Historique des versions

  • 1.0 - Version publique initiale.
  • 1.1 -

12. Bibliographie