SemWeb.Pro 2020

Journée de présentations et de rencontres
dédiées au web sémantique dans le monde professionnel

Du 16 au 27 novembre 2020, en ligne

Les techniques et standards du Web sémantique se sont imposés dans de nombreux domaines. En facilitant l'interopérabilité au travers du Web, ils donnent un nouveau souffle à l'intégration de données hétérogènes et à la construction de graphes de connaissances qui servent de fondations à des écosystèmes métiers dynamiques. Cette édition de SemWeb.Pro sera l'occasion de mettre en avant les synergies et complémentarités entre le Web sémantique et les approches connexes issues des bases de graphe (Property Graph, GraphQL, etc), qui accélèrent le développement d'applications concrètes dans différents secteurs d'activités : industrie, médical, culture et bien d'autres.

Accessible à tout public !

Vu la durée de la crise sanitaire découlant de l'épidémie de covid-19, nous ne pourrons pas cette année réunir tout le monde une journée à Paris comme nous le faisions jusqu'à maintenant. Cette année,SemWeb.Pro sera donc organisée "chacun derrière son écran" et sera gratuite.

Retrouvez les éditions précédentes : 2011, 2012, 2014, 2015, 2016, 2017, 2018 et 2019.

Programme

ScoLOMFR est le standard de description documentaire qui permet la mutualisation des ressources numériques, gratuites et payantes pour l'enseignement scolaire. Issu d'un schéma de données reposant sur la norme LOMFR (2010), il est composé d’une soixantaine de champs organisés en 9 éléments et d'un ensemble de vocabulaires communs aux différents acteurs de l'enseignement scolaire.

Créé et est maintenu par la DNÉ et Réseau Canopé, ce projet est géré en co-pilotage stratégique entre les deux acteurs. Le pilotage opérationnel est assuré par Réseau Canopé grâce au travail combiné d’une équipe, de terminologues et d’informaticiens, et d’un prestataire expert Thomas Francart (Sparna).

Le Ministère de l’Éducation Nationale, de la Jeunesse et des Sports préconise ScoLOMFR auprès des producteurs de ressources numériques scolaires, pour assurer l’interopérabilité entre leurs données. Sejer, KNÉ, mais aussi le GAR, les projets « Banques de ressources numériques », « EDUbases », « Eduthèque » ou encore « Etincel », pour ne citer qu’eux, l’utilisent. Le nouveau catalogue documentaire de Réseau Canopé, Syrtis, l’intègre également.

Les vocabulaires de ScoLOMFR reprennent le plus fidèlement possible le contenu des programmes et intègrent les dernières réformes engagées par l’éducation nationale.

Cette année, la publication de sa version 6 s’accompagne de l’ontologie ScoLOMFR. Cette dernière permet de déclarer les classes d’objets, les propriétés et les relations qui définissent et lient les concepts entre eux. Ainsi présentée, l’organisation des données et des éléments de ScoLOMFR offre un ensemble structuré dans lequel chaque concept est un élément caractérisé et identifiable au sein d’un tout. Il devient alors possible d’en déduire plus simplement des liens ou des relations plus spécifiques à une ou des recherches ou besoins particuliers.

ScoLOMFR est disponible sur le site : https://www.reseau-canope.fr/scolomfr/.

La description des activités législatives et de la loi par des graphes de connaissance illustre le dynamisme et l’adaptabilité aux cas d’usage des technologies du web sémantique. Au travers de cas concrets de mise en œuvre de graphes de connaissances, d’annotations sémantiques de sites web, de publication de vocabulaires contrôlés réutilisables nous montreront la capillarité des standards, leur capacité d’adaptation, et la création progressive d’un graphe distribué sur les législations et sur l’activité législative en Europe.

Nous verrons dans cette présentation comment depuis FRBR l’Office des Publications de l’union européenne conçu une ontologie adaptée à la description de la législation européenne et un graphe de connaissance qui sert de pilier à la dissémination de la législation, comment cette première réalisation a servi d’inspiration pour la réalisation par le Luxembourg de graphes de connaissances qui couvrent la diffusion de la législation mais aussi toutes l’activité législative, projet aujourd’hui adapté par la Suisse pour les besoins de la législation fédérale.

En parallèle, et toujours sur la base de FRBR, nous verrons comment le forum des journaux officiels européens, financé par l’UE, a pu définir le standard ELI pour l’annotation des pages des sites des journaux officiels pour décrire de manière standardisée et interopérable les législations des différents pays, avec une adoption par 13 pays aujourd’hui.

Nous verrons également comment la mise en œuvre de ces graphes de connaissances a permis, à large échelle, la création de vocabulaires contrôlés SKOS, et le partage de certains de vocabulaires sous l’initiative de l’équipe EU Vocabulary.

Nous verrons comment d’une description de ressources documentaires et de leurs relations, ces ontologies du droit basées sur FRBR ont adopté les concepts de CIDOC-CRM pour permettre la description de l’activité législative, enchaînement d’événements et de production de textes.

Finalement nous présenterons comment le besoin d’une bonne visibilité de la législation dans le web a motivé une collaboration entre les éditeurs de l’ontologie ELI et les éditeurs de schema.org pour proposer une extension de schema.org dédiée à la législation.

En conclusion, il s’est construit en 15 ans un ensemble de standards, d’ontologies, de graphes de connaissances, de vocabulaires contrôlés, d’annotations sémantiques parfaitement adaptés à leurs usages de description de la législation au travers de l’Europe. Ces différents projets ont permis de former des équipes métiers et des équipes IT à Malte, au Portugal, en Irlande, en France, en Suisse… capable de comprendre et mettre en œuvre ces technologie, d’adapter des ontologies, de partager des terminologies.

Standard ELI : https://eur-lex.europa.eu/eli-register/about.html et https://joinup.ec.europa.eu/collection/eli-european-legislation-identifier Vocabulaires contrôlés de l’UE : https://op.europa.eu/en/web/eu-vocabularies Open data du service de la législation du Luxembourg : http://data.legilux.public.lu/ Extension législative de schema.org : https://schema.org/Legislation

Depuis 2013, un groupe de travail du Conseil international des Archives (ICA-Expert Group on Archival Description ; voir https://www.ica.org/en/about-egad) prépare un nouveau standard pour la description des archives, Records in Contexts (RiC). L’objectif est de fournir au métier des archives un cadre conceptuel abstrait et un modèle formel (ontologie OWL) génériques, centrés sur les entités à décrire et compatibles avec les modèles de métadonnées antérieurs. Comme CIDOC-CRM pour les œuvres d’art et IFLA-LRM pour les livres et autres objets édités conservés en bibliothèque, RiC modélise sous forme de graphe les archives et les différents contextes dans lesquelles celles-ci s’inscrivent. Après la publication d’une version 0.1 du modèle conceptuel RiC-CM en août 2016, le groupe EGAD a publié en décembre 2019 une version 0.2 preview du modèle conceptuel (https://www.ica.org/sites/default/files/ric-cm-0.2_preview.pdf), et une version 0.1 de l’ontologie (https://www.ica.org/standards/RiC/ontology). Les sources de RiC-O, des exemples et pages de documentation ont par ailleurs été rendus publiques sur un entrepôt GitHub en mars 2020 (https://github.com/ICA-EGAD/RiC-O). Les Archives nationales sont très impliquées dans l’élaboration de RiC.

Nous présenterons les travaux en cours aux Archives nationales pour mettre en œuvre RiC. En effet, après la mise en ligne en mars 2018 d’une preuve de concept (PIAAF), des opérations de plus grande ampleur y sont menées.

En particulier, la société Sparna a réalisé pour les Archives nationales RiC-O Converter, un outil de conversion en données RDF conformes à RiC-O de l’ensemble des métadonnées de description des archives conservées dans cette institution. Le code source et la documentation de ce convertisseur ont été publiés sous licence libre en avril 2020 (https://github.com/ArchivesNationalesFR/rico-converter). Nous pourrons présenter rapidement cet outil ainsi que les données RDF des Archives nationales.

Solid est un ensemble de standards visant à amener un nouveau paradigme Web: les données, au lieu d'être accumulées par les applications, sont en la possession de l'utilisateur. Ce principe fondateur a plusieurs conséquences, mais d'un point de vue de développeur, la barre à passer pour construire une application descend d'un cran. Plus besoin de collecter les données: c'est l'utilisateur-ice qui les amène avec lui-elle. Qui mieux que la personne concernée peut déterminer quelles données elle souhaite partager avec vous ? De plus, même sans parler d'infrastructure, les données coûtent cher: en plus de les collecter en premier lieu, il sera de votre responsabilité de les conserver en sécurité, il faudra faire attention à les sauvegarder, tout en se conformant aux règlements comme le RGPD... Pourquoi ne pas couper la poire en deux, pour que des profesionnels puissent se consacrer soit au stockage des données, soit à leur mise en jeu dans des applications, sans être obligé de faire les deux ?

L'architecture Solid repose sur trois composants principaux, qui sont trois services entièrement décentralisés (possiblement auto-hébergés): identité, stockage, et application. Cette présentation donnera une vue d'ensemble de ces trois composants, de leurs interactions, et du rôle de chacun envers l'utilisateur. Pour permettre de mettre ces principes en application, des outils disponibles pour soutenir le développement d'applications sans être expert dans les standards mis en jeux seront aussi présentés.

Évidemment, si un seul standard pouvait régler tous les problèmes du Web et du Web sémantique, ça se saurait. Un stockage de données complètement générique sur lequel les applications viennent se greffer pose évidemment d'épineux problèmes d'interopérabilité, et c'est par l'émergence de bonnes pratiques à travers toute l'industrie que ceux-ci pourront être abordés.

Une librarie pour interagir avec un Pod Solid: https://github.com/inrupt/solid-client-js Deux serveurs Solid open source: https://github.com/solid/community-server, https://github.com/solid/node-solid-server Le site web du projet Solid: https://solidproject.org/

Popock un réseau social basé sur le matching des centres d’intérêts, expertises, compétences & projets...

Le projet Solid de Tim Berners Lee vise à fournir à chacun des espaces de stockage personnels avec des containers LDP2 (Linked Data Platform).

L’utilisateur peut y stocker tout type de fichier et notamment de l’information structurée sous forme de triplets au format turtle. Ces espaces de stockages sont appelés POD (personnal online datastore) et sont accessibles via une url.

On a ainsi la possibilité de lier des ressources (fichiers) les unes aux autres qu’elles se trouvent sur le même POD ou sur un POD différent.

Ceci nous offre la possibilité d’imaginer des applications décentralisées. Selon les spécifications de Solid, il est important de désolidariser les données et les applications. Ainsi les données des utilisateurs peuvent être manipulées par ceux-ci grâce à des applications différentes.

Un utilisateur peut par exemple utiliser l’application Plume pour poster un article sur son POD. Celui-ci étant enregistré conformément à un certain schéma pourra être lu par un autre utilisateur avec une autre application. (https://spoggy.solid.community/public/blog/2020-09-28.ttl )

Popock vise à faciliter, pour un utilisateur, l’interaction avec ses données, à explorer les données publiques de ses amis, ou encore à parcourir des bases de connaissances telles que Semapps3, ou tout autre triplestore tel que celui de Persée.

Popock propose, en plus de la visualisation de graphes, plusieurs fonctionnalités intéressantes basées sur le Web Sémantique :

  • un profil Solid étendu par l’ajout de centres d’intérêts (ajout futur de compétences, soft-skills, projets…)
  • un explorateur de POD similaire à un gestionnaire de fichiers
  • gestion des « amis » (foaf:kwows) exploration de leur POD, rebond vers les POD de leurs amis et ainsi de suite. Les POD exposant des centres d’intérêts communs gravitent naturellement autour des nœuds représentant ces concepts sur le graphe.
  • Popock fournit plusieurs outils de communication s’appuyant eux aussi sur Solid & le Web Sémantique : Chat (LongChat specification5 Solid), Boîte mail, Parle / Expérimentation de Chat imbriqué
  • Un éditeur de texte, de fichiers turtle
  • Un éditeur de graphes sémantiques collaboratifs en temps réel pour faciliter la collaboration lors de la conception de données sémantiques
  • Un gestionnaire de signets/bookmarks
  • multi-language i18n
  • WebApplication : installable comme une application mobile (notifications,…), responsive avec Bootstrap
  • Technologies utilisées opensource : nodejs, vuejs, composants web, visjs, librairies de la communauté Solid et d’Inrupt...

Développements actuels :

  • des outils de gouvernance partagée inspirés de l’holacratie (création de tensions, groupes, cercles, roles…)
  • gestion de « petites annonces » pour partager offres & les matcher avec les besoins
  • formulaires basés sur les shapes ShEx
  • tutoriels d’utilisation de Popock, de création et de gestion d’un POD, de création de modules applicatifs ou un Popock personnalisé à partie de zéro

Envie d’avoir un peu plus de maîtrise sur vos données ? d’interopérabilité ? D’exploration ? De partage d’expertise ? d’apporter votre expérience ?

Nous avons besoin de développeurs et de financements pour les rémunérer, former d’autres développeurs à intégrer les concepts de séparations entre les données et les applications...

Le projet Popock commencé début août avance et a maintenant besoin de retours utilisateurs, donc n’hésitez pas à tester Popock, éprouver, triturer, & à partager vos remarques en créant des « Tensions6 »

Popock : https://scenaristeur.github.io/solid-vue-panes Contributions, idées & suggestions: https://github.com/scenaristeur/solid-vue-panes

SemApps est une boîte à outils logicielle permettant de déployer et de configurer facilement des systèmes d'information sémantiques. Il permet de produire et de partager des données hautement structurées, compréhensibles par les humains et les machines.

Construit sur les standards RDF, OWL, SPARQL, LDP, ActivityPub et sur la spécification SOLID, SemApps est facilement interopérable avec le Linked Open Data ainsi qu’avec les plateformes respectant les standards du web sémantique.

SemApps permet de créer des bases de connaissances sémantiques et collaboratives, de cartographier la plupart des domaines métiers, de créer des réseaux sociaux P2P et des places de marché décentralisées. Son objectif majeur : Favoriser la mise en réseau des acteurs grâce à la mise en synergie de leurs systèmes d’information. Permettre ainsi la création d’un réseau social de la transition dont l’architecture serait décentralisée.

SemApps est constitué de briques logicielles, fonctionnelles et métiers : - Une base de donnée sémantique, appelée TripleStore : Jena TDB dans la version générique - Un serveur Solid + ActivityPub développé en Node.JS, lui-même décomposable en micro-services substituables : - Un front-end standard permettant l’affichage des données dans des formats multiples. - L’ontologie PAIR et l’approche métier associée (pour la version générique de SemApps). - + de nombreux services métiers qui pourront être construits autour du coeur de SemApps.

Ces briques sont conçues de manière modulaire, elles se relient entre elles et avec d’autres : - Par les technologies, protocoles et standards du web sémantique : RDF-OWl, Sparql, LDP, SOLID, ActivityPub. - Par des ontologies (assimilables à des vocabulaires) communes ou alignées - Par une architecture de type « microservices » , permettant à chacune des briques d’être déployée à la carte, y compris dans des environnements autres que SemApps.

SemApps propose un environnement technologique où les données, les serveurs et les interfaces sont dissociés, facilement connectables et aisément substituables.

- Documentation : https://semapps.org/ - Démos et vidéos en ligne : https://www.youtube.com/channel/UCg7sYh_Y8cHFT4s82K4SVmA/ - Github : https://github.com/assemblee-virtuelle/semapps - Article en français : virtual-assembly.org/semapps

De plus en plus de jeux de données en RDF sont disponibles sur le Web dans des entrepôts SPARQL. Bien que certains logiciels permettent une visualisation de ces données, ils sont souvent soit très spécifiques à un jeu de données particulier, soit trop génériques pour être adaptés à un besoin. Il n'est donc pas toujours aisé d'explorer un jeu de données sans avoir à écrire de requête SPARQL. Ce qui ne rend pas les données accessibles à tous.

Nous proposons SparqlExplorer, un outil qui permet de naviguer dans les données de n'importe quel entrepôt SPARQL et de les afficher de manière contextualisée. En plus de l'URL de l'entrepôt SPARQL à explorer, il est possible de spécifier un serveur de vue, tel que défini dans nos précédents travaux concernant le navigateur pour le web de données liées.

Un serveur de vue met des vues, i.e. composants d'affichage de triplets RDF, à disposition sur le Web. Les vues sont spécifiques à des données RDF. Par exemple, une vue "Carte" permettra la représentation de triplets contenant des informations de géolocalisation. Un mode automatique permet de sélectionner automatiquement la vue du serveur la plus adaptée aux données. Si aucun serveur de vue n'est spécifié, ou aucune vue n'est selectionnée ou applicable pour les triplets RDF à afficher, SparqlExplorer affiche les triplets sous forme tabulaire.

Nous souhaitons poursuivre ces travaux pour permettre de spécifier plusieurs serveurs de vues avec un ordre de priorité. De plus, il serait intéressant d'étendre la notion de vue pour qu'une vue puisse être utilisée dans une autre. De cette façon il serait possible de faire des compositions de vues.

- Dépôt de code libre: https://forge.extranet.logilab.fr/open-source/LDBrowser/sparqlexplorer - Démonstration en ligne: https://open-source.pages.logilab.fr/LDBrowser/sparqlexplorer/ - Serveur de vues de démonstration: https://culture.pages.logilab.fr/culture-views/ - Sparql endpoint de démonstration: https://sparql-culture.demo.logilab.fr/graphe-culture/sparql

Pouvoir décrire des valeurs quantitatives et leur unité est une exigence qui est commune à de nombreuses applications dans plusieurs secteurs industriels tels que l'industrie manufacturière, le transport et la logistique, la santé personnelle et publique, les villes intelligentes, l'énergie, l'environnement, les bâtiments, l'agriculture et les sciences en général. Nous proposons de le faire en introduisant un type de données RDF qui s'appuie sur le code unifié des unités de mesure (UCUM), un système de code destiné à inclure toutes les unités de mesure utilisées actuellement dans les sciences, l'ingénierie et les affaires internationales. Le type de données personnalisé introduit dans notre spécification peut être utilisé pour le codage et l'interrogation simplifiés de valeurs de quantité, dans une large gamme d'applications où la représentation et le raisonnement avec des types de quantité et des valeurs sont plus importants que le raisonnement avec des unités.

L’ontologie SmartM2M SAREF (Smart Applications REFerence ontology) a pour ambition de contribuer à la transformation numérique de l’industrie en Europe, en prenant en compte les difficultés liées à l’interopérabilité sémantique sur l’Internet des Objets et les applications web. Il s'agit d'un standard de l’ETSI (European Telecommunications Standards Institute), organisme de normalisation européen du domaine des télécommunications qui travaille à la mise en œuvre de normes et de standards autour des objets connectés, des données collectées et des applications. SAREF consiste en une ontologie noyau versionnée, et différents ontologies satellites versionnées également qui ciblent des domaines métiers comme l'énergie, l'environnement, le bâtiment, la ville intelligente, l'industrie du future, l'agriculture numérique, l'automobile, le eHealth, les wearables, la gestion de l'eau. Chacune de ces ontologies est versionnée.

Je présenterai brièvement le nouveau portail web de l'ontologie modulaire et versionnée SAREF [1], le framework de développement de SAREF [2], et le pipeline open source d'intégration et de déploiement continue qui l'outille [3]. Ce sont là les résultats du projet ETSI STF 578 « Specification of the SAREF development framework and workflow, and development of the Community SAREF Portal for user engagement ».

[1] SAREF portal - https://saref.etsi.org/ [2] ETSI TS 103 673 V1.1.1 (2020-08) SAREF Development Framework and Workflow, Streamlining the Development of SAREF and its Extensions [3] SAREF Pipeline - https://saref.etsi.org/sources/saref-pipeline [4] ETSI STF 578 - https://portal.etsi.org/STF/STFs/STF-HomePages/STF578

The representation of resources plays a fundamental role for manufacturing knowledge representation and data management. However, standards and ontologies used in engineering understand resources differently, e.g., sometimes in connection to processes occurring in time at the factory's shop floor, sometimes in relation to plans which are only possibly executed. Because of this conceptual heterogeneity, misunderstandings arise concerning the basic features that characterize resources. For instance, if a resource is an entity to be used in a manufacturing process, then it must be a material entity available in the factory. Differently, when a resource is related to a plan, it is not necessarily a material thing since it may simply be a resource specification and its physical counterpart may not be even available in the factory at stake (e.g., because it still needs to be acquired). We will discuss in the presentation three approaches found in both the academic literature and engineering standards for manufacturing resource modeling. By discussing their advantages and shortcomings, we will address the need for an ontology that integrates the three perspectives within a unique modeling approach. We will report on ongoing research work based on Semantic Web languages and technologies.​

Keywords:​ Manufacturing resource, Planning, Systems design

The presentation is based on: Sanfilippo, E.M., Borgo, S., Terkaj, W. Resources in manufacturing. IN: Proceedings of the 10th International Workshop on Formal Ontologies meet Industry (FOMI), CEUR workshop proceedings vol. 2518, 2019. An extended version of the paper will be soon published with (the journal of) Applied Ontology.

Our presentation will describe how requirements management in capital industries can benefit from ontology-based methods. Our use case is the READI Joint Industry Project in digitalised requirements for the Norwegian Continental Shelf (offshore Oil and Gas). We propose a new kind of service, integrating industrial ontologies with the templates needed to use them correctly.

READI aims to improve the specification, implementation, and verification of requirements. A particular aim is to evolve the INCOSE guidelines for writing requirements, so that recent innovations in intelligent data can be exploited. READI uses ontologies, following W3C's OWL 2 standard in the intended way, where constraints are subject to precise Description Logic reasoning. This will support and partially automate work processes, improving development and use of requirements across design and operations.

To provide a common, shared language of industrial assets and processes in the form of OWL ontologies is crucial. This requires a broad-ranging collaborative effort between subject matter experts and ontology modellers; while challenging, the approach has already been proven successful in capital projects. We obtain a clear separation between a generic vocabulary (classes and relations), requirements expressed using the vocabulary (norms as rules), and industrial assets described with the vocabulary (individual instances).

Agreement on common terminology is however not enough. We also need to ensure that the vocabularies are applied in a uniform way. To this end, READI adopts the Reasonable Ontology Templates (OTTR) language and framework. Ontology patterns are developed to match the kinds of facts that need to be formalised, then captured in OTTR templates. With a library of OTTR templates, we can secure uniformity: as ontologies are built, as they are applied to integration of existing data sources, and in analysis and reporting.

To make the ontology-based approach practical for the industry, a new kind of repository service is needed, one that provides both ontologies and the templates for using them in projects. In our presentation, we will demonstrate how READI builds a platform for such a service, compliant with web best practices including Linked Data, and exploiting the template library facilities of the OTTR reference implementation Lutra.

I Think the semantic modeling approach of the Pallas Nuclear project in the Netherlands would be interesting to share in this community, we now really make progress in this to capture the results of the various design and engineering disciplines ( exports of the various design tools) into a Common Data Environment (CDE) were integration takes place based on a taxonomy of 15926 entities and semantic relations and a RDL ( a mix of ISO 15926-4, Posc Caesar RDL and the IFC4 taxonomy), all based on ISO 15926-11.

Handover to the client takes place by means of a turtle file containing all the rdf-graphs (in rdf:statements), when applicable referring to documents and IFC 3D model objects. Client imports this turtle file directly into their graph database to integrate the data with their PLM system (Dassault 3D experience).

However, at this moment I don’t see a possibility to write a paper on this, due to the pressure of deadlines we agreed with the client. I could give a presentation and possible a demonstration of the semantic tooling we are using for the CDE to show the model, RDL, results and output/handover to the client.

Attached a powerpoint with the main topics and characteristics of this real case.

Workshop on Applied Category Theory for industry
November 27th 2020

Réseaux sociaux

N'hésitez pas à commenter et discuter des présentations vidéos ci-dessus en utilisant le mot-dièse #semwebpro sur vos réseaux sociaux préférés.

Voici les comptes de SemWeb.Pro que vous pouvez suivre:


Pour toute demande d'information, envoyez un courrier électronique à contact@semweb.pro.

Dates importantes

Informations générales

Comité de programme

En 2020, le comité de programme est constitué de

Informations pratiques

SemWebPro novembre 2020

Contact: contact@semweb.pro / @semwebpro / #semwebpro