Skip to content

Commit

Permalink
MàJ des dix choses
Browse files Browse the repository at this point in the history
  • Loading branch information
clementmandron committed Mar 12, 2024
1 parent d4e0094 commit 01e5b9e
Show file tree
Hide file tree
Showing 9 changed files with 156 additions and 30 deletions.
Binary file added img/annuaire.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Binary file added img/annuaire_datactivist.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Binary file added img/annuaire_sources.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Binary file added img/dvf_dgf1.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Binary file added img/dvf_dgf2.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Binary file added img/hugging.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Binary file added img/pappers.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
93 changes: 78 additions & 15 deletions index.Rmd
Original file line number Diff line number Diff line change
Expand Up @@ -109,7 +109,7 @@ class: inverse, center, middle

## beta.gouv.fr

.reduite[.center[[![beta.gouv.fr(./img/betagouv.png)]]](https://beta.gouv.fr/)
.center[.reduite[![](./img/betagouv.png)]]

???

Expand All @@ -131,7 +131,7 @@ pour la refonte du portail data.gouv.fr.
AU premier janvier 2024 :
- 36 investigations en cours
- 213 services en accompagnement ou pérénisés
- 24 service numérique à impact national
- 24 services numériques à impact national
- 17 incubateurs : diffusion dans les ministères


Expand Down Expand Up @@ -218,9 +218,9 @@ class: inverse, center, middle
[.center[![](./img/dvf.png)]](https://www.meilleursagents.com/prix-immobilier/dvf/)

---
## Une réutilisation rendue possible par l'ouverture de données publiques
## Une réutilisation de données publiques ouvertes

[.center[![](./img/dvf_dgf.png)]](https://www.data.gouv.fr/fr/reuses/explorateur-de-biens-vendus/)
[.reduite[.center[![](./img/dvf_dgf1.png)]]](https://www.data.gouv.fr/fr/reuses/explorateur-de-biens-vendus/)

---
class: inverse, center, middle
Expand All @@ -229,37 +229,91 @@ class: inverse, center, middle

---

.pull-left[
1. Le gouvernement annonce la réussite de l'expérimentation sur la limitation de vitesse à 80 km/h sur trois tronçons en France

> On peut aussi citer la contre-expertise effectuée par l’association 40 millions d’automobilistes sur l’expérimentation d’abaissement de la limitation de vitesse à 80 km/h sur trois tronçons de routes secondaires en France. L’association s’est appuyée sur les données d’accidentologie publiées sur data.gouv.fr par le Ministère de l’Intérieur dans la base Bulletin d’analyse des accidents corporels de la circulation (BAAC). À partir de ces données, elle a comparé l’accidentalité relevé pour la période de l’expérimentation pour laquelle on dispose de données aux années précédentes pour déterminer l’impact de la mesure d’abaissement sur l’accidentalité et la mortalité des tronçons routiers concernés. La contre-expertise a montré que « la limitation de vitesse n’a en rien permis de réduire la mortalité routière sur ces axes : 2 accidents mortels sont à déplorer sur les 86 kilomètres de l’expérimentation en 2016, soit 5 fois plus que la moyenne nationale qui s’élevait la même année à 0,4 tué pour 86 km de routes. » Ces chiffres ont été repris par la presse pour remettre en cause le rapport qui a fondé une partie de l’argumentaire du gouvernement en faveur de la généralisation de la mesure de la limitation de vitesse.
2. Contre-expertise de l’association 40 millions d’automobilistes à partir des données d’accidentologie publiées sur data.gouv.fr par le Ministère de l’Intérieur

Source : livre à paraître de Samuel Goëta
> « la limitation de vitesse n’a en rien permis de réduire la mortalité routière sur ces axes »
]

.pull-right[.reduite[[![](https://cfeditions.com/donnees-democratie/ressources/couv_donnees-democratie_grand.jpg)](https://cfeditions.com/donnees-democratie/)]

Source : Les données de la démocratie (2023), de Samuel Goëta

]

???

On peut aussi citer la contre-expertise effectuée par l’association 40 millions d’automobilistes sur l’expérimentation d’abaissement de la limitation de vitesse à 80 km/h sur trois tronçons de routes secondaires en France. L’association s’est appuyée sur les données d’accidentologie publiées sur data.gouv.fr par le Ministère de l’Intérieur dans la base Bulletin d’analyse des accidents corporels de la circulation (BAAC). À partir de ces données, elle a comparé l’accidentalité relevé pour la période de l’expérimentation pour laquelle on dispose de données aux années précédentes pour déterminer l’impact de la mesure d’abaissement sur l’accidentalité et la mortalité des tronçons routiers concernés. La contre-expertise a montré que « la limitation de vitesse n’a en rien permis de réduire la mortalité routière sur ces axes : 2 accidents mortels sont à déplorer sur les 86 kilomètres de l’expérimentation en 2016, soit 5 fois plus que la moyenne nationale qui s’élevait la même année à 0,4 tué pour 86 km de routes. » Ces chiffres ont été repris par la presse pour remettre en cause le rapport qui a fondé une partie de l’argumentaire du gouvernement en faveur de la généralisation de la mesure de la limitation de vitesse.

---
class: inverse, center, middle

# 8. Mapillary
# 8. L'Annuaire des Entreprises

---
## L'Annuaire des Entreprises

[![](./img/annuaire.png)](https://annuaire-entreprises.data.gouv.fr/)

---
## Mapillary

[![](./img/mapillary1.png)](https://www.mapillary.com/map/im/AB9hac4KYucSZOaWQyunvw)
### Derrière l'Annuaire, plusieurs sources de données ouvertes

.pull-left[.reduite[[![](./img/annuaire_sources.png)](https://annuaire-entreprises.data.gouv.fr/donnees/sources)]]

http://www.villes-internet.net/actions/5bbf52afbb3eab784351e5c5
.pull-right[[![](./img/annuaire_datactivist.png)](https://annuaire-entreprises.data.gouv.fr/entreprise/datactivist-823798871)]

---
## Mapillary

[![](./img/mapillary2.png)](https://www.mapillary.com/map/im/AB9hac4KYucSZOaWQyunvw)
### Utiliser l'Open Data pour vendre des services : l'exemple de Pappers

.center[[![](./img/pappers.png)](https://www.pappers.fr/)]

???

Pappers fournit les comptes déposés auprès des greffes des tribunaux de commerce et transmis à l’Institut National de la Propriété Intellectuelle (INPI). Ces données sont publiques et leur diffusion est librement consentie.

Pappers vend des services autour du produit d'appel basé sur de l'Open Data : création d'entreprises, API, enrichissement des données

---
class: inverse, center, middle

# 9. Une canne blanche connectée
# 9. ChatGPT

---
## ChatGPT

**(et d'autres assistants IA basés sur des LLM)**

![](./img/sandwich.png)

???

Sans CommonCrawl = les données d'entrainement dans les mains d'un nombre réduit de personnes

ChatGPT et les autres LLM sont entraînés sur des données ouvertes. Par exemple Wikipedia. Mais aussi CommonCrawl

CommonCrawl : biais, souvent des versions mal-filtrées sont utilisées

Popular Common Crawl versions is often limited to removing pornography and relies on simple keyword lists or AI classifiers trained on user generated content that can itself be problematic

En 2023, les données ouvertes de Common Crawl contiennent le texte de 240 millions de pages web sur 16 années

A partir de 2007

CA de commoncrawl, ImageNet ou encore MLCommons pleins de personnes influentes dans la silicon valley (ex Peter Norving représentant de Google). "Capture des communs par l'industrie de l'IA ? Kate Crawford)

Quid du projet LAION ?


---
## Une canne blanche connectée
### Derrière les modèles, des données

[![](./img/hugging.png)](https://huggingface.co/datasets)

[![](./img/sherpa.png)](https://handisco.com/)

---
class: inverse, center, middle
Expand All @@ -272,8 +326,17 @@ class: inverse, center, middle

<iframe style="width: 80vw; height: 50vh; border: none;" src="https://query.wikidata.org/embed.html#%23defaultView%3AImageGrid%0ASELECT%20%3Fcocktail%20%3FcocktailLabel%20(SAMPLE(%3Frecipe)%20AS%20%3Frecipe)%20(SAMPLE(%3Fimage)%20AS%20%3Fimage)%0AWHERE%0A%7B%0A%20%20%7B%0A%20%20%20%20SELECT%20%3Fcocktail%20%3FcocktailLabel%20(GROUP_CONCAT(DISTINCT%20%3Fingredient%3B%20separator%3D%22%2C%20%22)%20AS%20%3FingredientsList)%20(GROUP_CONCAT(DISTINCT%20%3FgarnishLabel%3B%20separator%3D%22%2C%20%22)%20AS%20%3FgarnishList)%20(COUNT(DISTINCT%20%3Fingredient)%20%2B%20COUNT(DISTINCT%20%3FgarnishLabel)%20AS%20%3Fcount)%0A%20%20%20%20WHERE%0A%20%20%20%20%7B%0A%20%20%20%20%20%20%3Fcocktail%20wdt%3AP31%2Fwdt%3AP279*%20wd%3AQ134768%3B%0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20p%3AP186%20%3FmaterialStat.%0A%20%20%20%20%20%20MINUS%20%7B%20%3FmaterialStat%20pq%3AP518%2Fwdt%3AP279*%20wd%3AQ2453629.%20%7D%0A%20%20%20%20%20%20MINUS%20%7B%20%3FmaterialStat%20ps%3AP186%20wd%3AQ488463%3B%20pq%3AP366%20wd%3AQ26876981.%20%7D%0A%20%20%20%20%20%20MINUS%20%7B%20%3FmaterialStat%20pq%3AP366%20wd%3AQ59541.%20%7D%0A%20%20%20%20%20%20%3FmaterialStat%20ps%3AP186%2Frdfs%3Alabel%20%3FmaterialLabel.%0A%20%20%20%20%20%20FILTER(LANG(%3FmaterialLabel)%20%3D%20%22en%22).%0A%20%20%20%20%20%20BIND(%3FmaterialLabel%20AS%20%3FingredientSolo).%0A%20%20%20%20%20%20OPTIONAL%20%7B%0A%20%20%20%20%20%20%20%20%3FmaterialStat%20ps%3AP186%2Frdfs%3Alabel%20%3FmaterialLabel%3B%0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20pq%3AP1114%20%3Fquantity.%0A%20%20%20%20%20%20%20%20FILTER(LANG(%3FmaterialLabel)%20%3D%20%22en%22).%0A%20%20%20%20%20%20%20%20BIND(CONCAT(STR(%3Fquantity)%2C%20%22%20%22%2C%20%3FmaterialLabel)%20AS%20%3FingredientWithQuantity).%0A%20%20%20%20%20%20%20%20OPTIONAL%20%7B%0A%20%20%20%20%20%20%20%20%20%20%3FmaterialStat%20pq%3AP1114%20%3Fquantity%3B%0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20ps%3AP186%2Frdfs%3Alabel%20%3FmaterialLabel%3B%0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20pqv%3AP1114%2Fwikibase%3AquantityUnit%20%3Funit.%0A%20%20%20%20%20%20%20%20%20%20FILTER(LANG(%3FmaterialLabel)%20%3D%20%22en%22).%0A%20%20%20%20%20%20%20%20%20%20FILTER(%3Funit%20!%3D%20wd%3AQ199).%0A%20%20%20%20%20%20%20%20%20%20%3Funit%20rdfs%3Alabel%20%3FunitLabel.%0A%20%20%20%20%20%20%20%20%20%20FILTER(LANG(%3FunitLabel)%20%3D%20%22en%22).%0A%20%20%20%20%20%20%20%20%20%20BIND(CONCAT(STR(%3Fquantity)%2C%20%22%20%22%2C%20IF(%3Fquantity%20%3D%201%2C%20%3FunitLabel%2C%20CONCAT(%3FunitLabel%2C%20IF(STRENDS(%3FunitLabel%2C%20%22sh%22)%2C%20%22es%22%2C%20%22s%22)))%2C%20%22%20%22%2C%20%3FmaterialLabel)%20AS%20%3FingredientWithUnit).%0A%20%20%20%20%20%20%20%20%7D%0A%20%20%20%20%20%20%7D%0A%20%20%20%20%20%20BIND(COALESCE(%3FingredientWithUnit%2C%20%3FingredientWithQuantity%2C%20%3FingredientSolo)%20AS%20%3Fingredient).%0A%20%20%20%20%20%20OPTIONAL%20%7B%0A%20%20%20%20%20%20%20%20%3Fcocktail%20p%3AP186%20%5B%20ps%3AP186%20%3Fgarnish%3B%20pq%3AP366%20wd%3AQ59541%20%5D.%0A%20%20%20%20%20%20%20%20%3Fgarnish%20rdfs%3Alabel%20%3FgarnishLabel.%0A%20%20%20%20%20%20%20%20FILTER(LANG(%3FgarnishLabel)%20%3D%20%22en%22).%0A%20%20%20%20%20%20%7D%0A%20%20%20%20%20%20%3Fcocktail%20rdfs%3Alabel%20%3FcocktailLabel.%0A%20%20%20%20%20%20FILTER(LANG(%3FcocktailLabel)%20%3D%20%22en%22).%0A%20%20%20%20%7D%0A%20%20%20%20GROUP%20BY%20%3Fcocktail%20%3FcocktailLabel%0A%20%20%7D%0A%20%20BIND(%0A%20%20%20%20IF(REGEX(%3FingredientsList%2C%20%22%2C%20.*%2C%22)%2C%0A%20%20%20%20%20%20%20REPLACE(%3FingredientsList%2C%20%22(.*)%2C%20(.*)%22%2C%20%22%241%2C%20and%20%242%22)%2C%0A%20%20%20%20%20%20%20REPLACE(%3FingredientsList%2C%20%22(.*)%2C%20(.*)%22%2C%20%22%241%20and%20%242%22))%0A%20%20%20%20AS%20%3Fingredients).%0A%20%20BIND(%0A%20%20%20%20IF(REGEX(%3FgarnishList%2C%20%22%2C%20.*%2C%22)%2C%0A%20%20%20%20%20%20%20REPLACE(%3FgarnishList%2C%20%22(.*)%2C%20(.*)%22%2C%20%22%241%2C%20and%20%242%22)%2C%0A%20%20%20%20%20%20%20REPLACE(%3FgarnishList%2C%20%22(.*)%2C%20(.*)%22%2C%20%22%241%20and%20%242%22))%0A%20%20%20%20AS%20%3Fgarnishes).%0A%20%20OPTIONAL%20%7B%0A%20%20%20%20%3Fcocktail%20p%3AP186%20%5B%20ps%3AP186%20%3Fglass%3B%20pq%3AP518%2Fwdt%3AP279*%20wd%3AQ2453629%20%5D.%0A%20%20%20%20%3Fglass%20rdfs%3Alabel%20%3FglassLabel.%0A%20%20%20%20FILTER(LANG(%3FglassLabel)%20%3D%20%22en%22).%0A%20%20%20%20BIND(IF(REGEX(%3FglassLabel%2C%20%22%5E%5BAEIOUaeiou%5D%22)%2C%20%22an%22%2C%20%22a%22)%20AS%20%3Farticle).%0A%20%20%20%20BIND(CONCAT(%22%20in%20%22%2C%20%3Farticle%2C%20%22%20%22%2C%20%3FglassLabel)%20AS%20%3Fcontainer).%0A%20%20%20%20BIND(%22%2C%20served%22%20AS%20%3Fserved).%0A%20%20%7D%0A%20%20OPTIONAL%20%7B%0A%20%20%20%20%3Fcocktail%20p%3AP186%20%5B%20ps%3AP186%20wd%3AQ488463%3B%20pq%3AP366%20wd%3AQ26876981%20%5D.%0A%20%20%20%20BIND(%22%20on%20the%20rocks%22%20AS%20%3FonTheRocks).%0A%20%20%20%20BIND(%22%2C%20served%22%20AS%20%3Fserved).%0A%20%20%7D%0A%20%20OPTIONAL%20%7B%0A%20%20%20%20FILTER(STRLEN(STR(%3Fgarnishes))%20%3E%201).%0A%20%20%20%20BIND(CONCAT(%22%20with%20%22%2C%20%3Fgarnishes)%20AS%20%3Fgarnish).%0A%20%20%20%20BIND(%22%2C%20served%22%20AS%20%3Fserved).%0A%20%20%7D%0A%20%20BIND(CONCAT(%0A%20%20%20%20%3Fingredients%2C%0A%20%20%20%20COALESCE(%3Fserved%2C%20%22%22)%2C%0A%20%20%20%20COALESCE(%3FonTheRocks%2C%20%22%22)%2C%0A%20%20%20%20COALESCE(%3Fgarnish%2C%20%22%22)%2C%0A%20%20%20%20COALESCE(%3Fcontainer%2C%20%22%22))%0A%20%20%20%20AS%20%3Frecipe).%0A%20%20OPTIONAL%20%7B%20%3Fcocktail%20wdt%3AP18%20%3Fimage.%20%7D%0A%7D%0AGROUP%20BY%20%3Fcocktail%20%3FcocktailLabel%0AORDER%20BY%20DESC(MAX(%3Fcount))" referrerpolicy="origin" sandbox="allow-scripts allow-same-origin allow-popups"></iframe>

???

Web des données, web sémantique basé sur les linked open data : open data liée grace à des ontologie RDF, possède des URI

Culture, sciences, etc...

Derrière l'image une requete en SPARQL

Wikidata est la plus grande base de données libre éditée de manière collaborative qui respecte les standards du Linked data. Elle est hébergée par la Wikimedia Foundation. Placée sous licence Creative Commons Zéro

DBpedia en un des exemples les plus connus et de grande taille, qui a adopté les normes du réseau linked open data12 et celles du Web sémantique, faisant qu'elle a rapidement été fortement interconnectée à d'autres dépôts du web de données tels que GeoNames, MusicBrainz, CIA World Factbook, le projet Gutenberg et Eurostat

---
class: inverse, center, middle
Expand Down
Loading

0 comments on commit 01e5b9e

Please sign in to comment.