Wikipédia, Wikidata et les données culturelles. https://bzg.fr/wikipedia-wikidata-culture

index.org 13KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336
  1. #+TITLE: Wikipédia, wikidata et les données culturelles
  2. #+AUTHOR: Bastien Guerry
  3. #+email: bzg@bzg.fr
  4. #+OPTIONS: reveal_center:nil reveal_progress:t reveal_history:nil reveal_control:t
  5. #+OPTIONS: reveal_rolling_links:t reveal_keyboard:t reveal_overview:t num:nil
  6. #+OPTIONS: reveal_width:1200 reveal_height:800
  7. #+OPTIONS: toc:1
  8. #+REVEAL_MARGIN: 0.1
  9. #+REVEAL_MIN_SCALE: 0.5
  10. #+REVEAL_MAX_SCALE: 2.5
  11. #+REVEAL_TRANS: fade
  12. #+REVEAL_THEME: serif
  13. #+REVEAL_HLEVEL: 2
  14. # #+REVEAL_HEAD_PREAMBLE: <meta name="description" content="Org-Reveal Introduction.">
  15. # #+REVEAL_POSTAMBLE: <p> Created by yjwen. </p>
  16. # #+REVEAL_PLUGINS: (markdown notes)
  17. # #+REVEAL_EXTRA_CSS: ./local.css
  18. * Présentation de Wikipédia
  19. ** Les origines de Wikipédia
  20. # - GNU :: GNU’s not Unix
  21. - GNUpedia :: proposé en 1999 par Stallman et lancé en 2001.
  22. - Nupedia :: fondée par L. Sanger et J. Wales en 2000, fermée en 2003.
  23. - Wikipédia :: mis en place par L. Sanger en janvier 2001 intialement
  24. pour servir de sas d’entrée pour Nupédia.
  25. - Citizendium :: projet d’encyclopédie en ligne lancé en 2006 par
  26. L. Sanger.
  27. ** Le but de Wikipédia
  28. Une encyclopédie libre et collaborative pour *collecter* et *diffuser*
  29. l’ensemble des connaissances disponibles.
  30. Wikipédia n’est pas un espace de *production* de la connaissance, elle
  31. reste une source secondaire.
  32. ** Les principes fondateurs de Wikipédia
  33. - Wikipédia est une encyclopédie
  34. - Wikipédia recherche la neutralité de point de vue
  35. - Wikipédia est publiée sous licence libre
  36. - Wikipédia est un projet collaboratif qui suit des règles de savoir-vivre
  37. - Wikipédia n’a pas d’autres règles fixes : *be bold* !
  38. ** Fonctionnement basique de Wikipédia
  39. - La modération *a posteriori* (exemple).
  40. - Les administrateurs n’ont qu’un rôle *technique*, pas *éditorial*.
  41. ** Quelques chiffres sur la wikipédia francophone
  42. Chiffre à la date du 8 novembre 2017 :
  43. - Nombre de comptes : 2 930 291
  44. - Nombre de contributeurs actifs : 16720 avec 1 modif < 30 jours
  45. - Nombre de contributeurs actifs : 5000 avec 5 modif < 30 jours
  46. - Nombre de contributeurs actifs : 800 avec 100 modif < 30 jours
  47. - Nombre d’administrateurs : 163
  48. - Nombre d’articles : 1 926 396
  49. Wikipédia est le cinquième site le plus visité.
  50. Source : https://fr.wikipedia.org/wiki/Wikip%C3%A9dia:Statistiques
  51. ** Où sont hébergées les données ?
  52. Aux États-Unis, par la Wikimedia Foundation.
  53. ** Quelle est la différence entre Wikipédia et Wikimedia ?
  54. Wikipédia est l’un des projets Wikimédia.
  55. « Wikimedia » est le nom du mouvement réunissant les salariés de la
  56. fondation américaine et des « chapitres » régionaux.
  57. ** Quels sont les autres projets ?
  58. - Wikimedia Commons
  59. - Wikidata
  60. - Wiktionnaire
  61. - Wikisource
  62. - Wikispecies
  63. - Wikiquote
  64. - Wikivoyage
  65. - ...
  66. Voir la [[https://wikimediafoundation.org/wiki/Nos_projets][liste des projets]].
  67. ** Comment éditer Wikipédia ?
  68. [Démonstration]
  69. ** Quelques concepts
  70. - Les wikiprojets (ou projets) :: https://fr.wikipedia.org/wiki/Projet:Monuments_historiques
  71. - Les portails :: https://fr.wikipedia.org/wiki/Portail:Monuments_historiques
  72. - Les catégories :: [ [Catégorie:Base de données sur Internet]]
  73. - Les modèles :: {{Portail|informatique|monuments historiques}}
  74. - Les infobox :: les encarts avec des données structurées
  75. - Les liens interwikis :: un lien entre deux projets, par exemple
  76. entre le wiktionnaire et wikipédia. Voir [[https://fr.wikipedia.org/wiki/Aide:Lien_interwiki][la page de
  77. documentation]] sur wikipédia.
  78. - Les liens interlangues :: un lien d’un projet (ex: wikipédia) dans
  79. une langue vers le même projet (wikipédia) dans une autre langue.
  80. Voir [[https://fr.wikipedia.org/wiki/Aide:Lien_interlangue][la page de documentation]] sur wikipédia.
  81. ** Exemple de contenu littéral d’une infobox
  82. : {{Infobox Jeu de données
  83. : | nom =
  84. : | producteur =
  85. : | couverture géographique = France
  86. : | couverture temporelle =
  87. : | unité statistique =
  88. : | variables =
  89. : | licence = <!-- wikidata: Property:P275 -->
  90. : | url = <!-- wikidata: Property:P856 -->
  91. : }}
  92. * Les données culturelles sur Wikipédia
  93. Statistiques ?
  94. https://fr.wikipedia.org/wiki/Projet:Monuments_historiques
  95. * Présentation de Wikidata
  96. ** Le lien wikidata sur les pages de Wikipédia
  97. Voir dans la colonne de gauche : [[https://fr.wikipedia.org/w/index.php?title=Victor_Hugo][Victor Hugo]]
  98. ** Problèmes à résoudre
  99. - Problème #1 :: Comment tirer parti des connaissances
  100. semi-structurées de Wikipédia ?
  101. - Les infoboxes
  102. - Les liens interwikis
  103. - Les liens interlangue
  104. - ...
  105. - Problème #2 :: Comment interroger ces données ?
  106. ** Introduction au web sémantique
  107. - Langage naturel : Sujet / Verbe / Complément
  108. - Prédicat ? (voir la définition du [[http://www.cnrtl.fr/definition/pr%25C3%25A9dicat][cnrtl]])
  109. - Aristote : le prédicat est ce que l’on dit du sujet. Par
  110. exemple : Socrate *mange des pommes* ou Socrate *est un homme*.
  111. C’était la notion de grammaire en jeu dans le débat de 2017 sur
  112. l’évolution des programmes d’enseignement (voir ce [[https://twitter.com/MichelLussault/status/819269828611624960][tweet]]).
  113. - Philosophie scolastique : le prédicat désigne une *qualité* qui peut
  114. être attribué à un sujet via une *copule*, le verbe « être ». Par
  115. exemple : Socrate est *mortel*. Trois notions se confondent :
  116. prédicat, qualité et « attribut du sujet ».
  117. - Logique : après le calcul des propositions (si p et q sont vraies,
  118. alors "p et q" est vrai, etc.) apparaît le calcul des Prédicats :
  119. « Tout x est gentil » : \forall x gentil(x) et « Il existe un x tel que
  120. pour tout y, x est ami avec y » : \exists x \forall y amis(x,y)
  121. - "est gentil" = un prédicat unaire
  122. - "sont amis" = un prédicat binaire
  123. - En web sémantique, une affirmation est un *prédicat binaire* (voir
  124. cette [[https://www.u-picardie.fr/~furst/docs/1-Web_Semantique_RDF.pdf][présentation du RDF]])
  125. Par exemple : est_Construit_En(Q-ndp,Q-ndp2)
  126. On parle aussi de « triplet », et on retrouve l’écriture plus
  127. naturelle : L’église (Sujet) est construite en (Prédicat) 1912
  128. (Objet). Le prédicat associe le sujet et l’objet.
  129. - Wikidata utilise un vocabulaire différent : au lieu de =Sujet /
  130. Prédicat / Objet=, nous avons =Item (Q) / Property (P) / Value=.
  131. Par exemple, l’affirmation : {Einstein(Q), occupation(P),
  132. scientifique(V)} disant que l’occupation d’Einstein est d’être un
  133. scientifique.
  134. ** Exemple de code HTML
  135. #+begin_src
  136. <html>
  137. <head>
  138. ...
  139. </head>
  140. <body>
  141. ...
  142. <header1>The Trouble with Bob</h1>
  143. <paragraphe>Date: 2011-09-10</paragraphe>
  144. ...
  145. </body>
  146. #+end_src
  147. ** Exemple de code HTML « sémantisé »
  148. #+begin_export html
  149. <html>
  150. <head>
  151. ...
  152. </head>
  153. <body vocab="http://purl.org/dc/terms/">
  154. ...
  155. <h2 property="title">The Trouble with Bob</h2>
  156. <p>Date: <span property="created">2011-09-10</span></p>
  157. ...
  158. </body>
  159. #+end_export
  160. ** Wikidata est constituée de *déclarations* sur des *entités*
  161. Quelques définitions :
  162. - entité (item)
  163. - libellé (label)
  164. - propriété (properties)
  165. - affirmation (affirmation)
  166. - déclaration (declaration)
  167. - qualificatif (qualifier)
  168. Différence entre *affirmation* ("claim") et *déclaration* ("statement") :
  169. une déclaration contient aussi des références venant à l’appui de
  170. l’affirmation et des "rangs" (ranks) pour dire s’ils sont préférés,
  171. normaux ou dépréciés.
  172. Voir https://www.wikidata.org/wiki/Wikidata:Glossary/fr pour tout le
  173. glossaire des termes.
  174. ** COMMENT Quelle différence avec des données « plates » ?
  175. Exemple Palissy.
  176. ** L’évolution de Wikidata
  177. - Ajout d’entités
  178. - Ajout de propriétés
  179. - Histoire de l’évolution des propriétés
  180. ** L’accès aux données de Wikidata
  181. - Via l’API (https://www.wikidata.org/w/api.php)
  182. - Via le SparQL endpoint
  183. Exemples :
  184. - [[https://query.wikidata.org/#%2523Encore%2520plus%2520de%2520chats%252C%2520avec%2520des%2520images%250A%2523added%2520before%25202016-10%250A%250A%2523defaultView%253AImageGrid%250ASELECT%2520%253Fitem%2520%253FitemLabel%2520%253Fpic%250AWHERE%250A%257B%250A%2509%253Fitem%2520wdt%253AP31%2520wd%253AQ146%2520.%250A%2509OPTIONAL%2520%257B%250A%2509%2509%253Fitem%2520wdt%253AP18%2520%253Fpic%250A%2509%257D%250A%2509SERVICE%2520wikibase%253Alabel%2520%257B%2520bd%253AserviceParam%2520wikibase%253Alanguage%2520%2522%255BAUTO_LANGUAGE%255D%252Cen%2522%2520%257D%250A%257D][Chats avec photos]]
  185. - [[https://query.wikidata.org/#%2523Monuments%2520historiques%2520in%2520Loire-Atlantique%250A%2523added%2520before%25202016-10%250A%250ASELECT%2520DISTINCT%250A%2520%2520%253Fitem%250A%2520%2520%253FitemLabel%250A%2520%2520%253FcommuneLabel%250A%2520%2520%2528group_concat%2528distinct%2520%253Fmerimee%2520%253B%2520separator%2520%253D%2520%2522%252C%2520%2522%2529%2520as%2520%253Fmerimee%2529%250A%2520%2520%253Fcoords%250A%2520%2520%253Fimage%250AWHERE%250A%257B%250A%2520%2520%257B%250A%2520%2520%2520%2520SELECT%2520DISTINCT%2520%253Fitem%2520%253Fmerimee%2520WHERE%2520%257B%250A%2520%2520%2520%2520%2520%2520%253Fitem%2520wdt%253AP1435%252Fwdt%253AP279%252a%2520wd%253AQ916475%2520.%250A%2520%2520%2520%2520%2520%2520%253Fitem%2520p%253AP1435%2520%253Fheritage_statement%2520.%250A%2520%2520%2520%2520%2520%2520FILTER%2520NOT%2520EXISTS%2520%257B%2520%253Fheritage_statement%2520pq%253AP582%2520%253Fend%2520.%2520%257D%250A%2520%2520%2520%2520%2520%2520%253Fitem%2520wdt%253AP380%2520%253Fmerimee.%250A%2520%2520%2520%2520%257D%250A%2520%2520%2520%2520ORDER%2520BY%2520%253Fmerimee%250A%2520%2520%257D%250A%2520%2520%253Fitem%2520wdt%253AP131%252Fwdt%253AP131%252a%2520wd%253AQ3068%2520.%250A%2520%2520%253Fitem%2520wdt%253AP131%2520%253Fcommune%2520.%250A%2520%2520OPTIONAL%2520%257B%2520%253Fitem%2520wdt%253AP625%2520%253Fcoords%2520.%2520%257D%250A%2520%2520OPTIONAL%2520%257B%2520%253Fitem%2520wdt%253AP18%2520%253Fimage%2520.%2520%257D%250A%2520%2520SERVICE%2520wikibase%253Alabel%2520%257B%2520bd%253AserviceParam%2520wikibase%253Alanguage%2520%2522fr%2522%2520.%2520%257D%250A%257D%250AGROUP%2520BY%2520%253Fitem%2520%253FitemLabel%2520%253FcommuneLabel%2520%253Fcoords%2520%253Fimage%250AORDER%2520BY%2520%253FcommuneLabel%2520%253FitemLabel][Monuments historiques (Mérimée) de Loire-Atlantique]]
  186. Rechercher toutes les [[https://www.wikidata.org/w/index.php?search=date&title=Special:Search&profile=advanced&fulltext=1&ns120=1&searchToken=9jx7obv7sw164zt3lrup3ytpf][propriétés relatives aux dates]].
  187. Source : https://www.wikidata.org/wiki/Wikidata:Data_access/fr
  188. * Les données culturelles dans les projets Wikimedia
  189. ** http://www.zone47.com/crotos/
  190. ** Les données culturelles sur Wiki Loves Monuments
  191. https://wikilovesmonuments.fr
  192. Outil d’exploration et d’édition des monuments renseignés lors des
  193. concours WLM : https://tools.wmflabs.org/monumental/#/object/2981
  194. ** Les données culturelles sur Wikipédia
  195. Exemple : Le wikiprojet [[https://fr.wikipedia.org/wiki/Projet:Monuments_historiques][monument historique]].
  196. ** Les données culturelles sur Wikidata
  197. "80% des données" (cf. présentation Wikidatacon 2017)
  198. Exemple de mise en forme des données
  199. https://tools.wmflabs.org/reasonator/?q=Q1339
  200. Exemple de requête :
  201. : #Paintings made on places that are not a work location of Van Gogh
  202. : SELECT ?item ?inception ?location ?image
  203. : WHERE {?item wdt:P31 wd:Q3305213 .
  204. : ?item wdt:P170 wd:Q5582 .
  205. : ?item wdt:P571 ?inception .
  206. : OPTIONAL { ?item wdt:P18 ?image }
  207. : ?item wdt:P1071 ?location .
  208. : MINUS { wd:Q5582 wdt:P937 ?location } .
  209. : MINUS { wd:Q5582 wdt:P937 ?superlocation .
  210. : ?location wdt:P131 ?superlocation} .
  211. : }
  212. Exemple de réutilisation : http://histropedia.com/timeline
  213. Voir la [[https://query.wikidata.org/#SELECT%2520%253Fitem%2520%253FitemLabel%2520%253Fid%2520WHERE%2520%257B%250A%2509%253Fitem%2520wdt%253AP481%2520%253Fid%2520.%250A%2509SERVICE%2520wikibase%253Alabel%2520%257B%2520bd%253AserviceParam%2520wikibase%253Alanguage%2520%2522fr%2522%2520%257D%250A%257D][liste des données ayant un identifiant Palissy.]]
  214. https://www.wikidata.org/wiki/Wikidata:WikiProject_sum_of_all_paintings/Catalog
  215. : SELECT ?item ?catcode WHERE { ?item p:P528 [ pq:P972 wd:Q35556353 ; ps:P528 ?catcode]. } ORDER BY xsd:integer(?catcode)
  216. * Quel est l’intérêt de Wikidata pour le MC ?
  217. - Wikidata permet d’exposer les données du MC plus largement.
  218. - Wikidata permet de faire des recherches (de la recherche ?) :
  219. exemple, les peintres [[https://www.wikidata.org/wiki/Wikidata:WikiProject_sum_of_all_paintings/Top_creators_by_number_of_paintings%0A][les plus prolifiques]].
  220. - Wikidata peut être utilisé pour obtenir des traductions des
  221. labels existants.
  222. * Quel est l’intérêt des données du ministère de la culture pour Wikidata ?
  223. - Le ministère de la culture peut contribuer à l’ajout d’entités.
  224. - Le ministère de la culture peut contribuer à l’ajout de propriétés.
  225. - Le ministère de la culture peut enrichir les données existantes (ex: Palissy).
  226. * Ressources
  227. - https://fr.slideshare.net/_Emw/an-ambitious-wikidata-tutorial