Dans cette activité, nous allons découvrir comment manipuler un ensemble de données. Ces données sont structurées afin de les manipuler facilement à l'aide d'un logiciel ou programme informatique.
La manière la plus simple pour le grand public est d'utiliser un logiciel de type tableur pour manipuler ces données. Au cours de cette activité, nous utiliserons l'application en ligne « Google Sheets », un équivalent à Microsoft Excel ou LibreOffice.
Au cours de ce TP, vous allez utiliser un fichier csv
qui contient un grand nombre de données. Pour rappel, un fichier csv
est un fichier texte où :
Toutes les questions précédées par le symbole demandent une réponse à compléter sur votre feuille.
Question 1 - Télécharger le fichier liste_festivals.csv
en cliquant sur le bouton ci-dessous.
Ce fichier contient des données concernant les différents festivals de France. Il est issu de la plateforme d'Open Data du ministère de la Culture.
Question 2 - Enregistrer ce fichier dans votre dossier personnel : SNT > SEQUENCE_3 > TP1.
À partir de cette question, vous avez normalement tous les fichiers pour répondre correctement aux questions suivantes.
Dans cet exercice, on souhaite d'abord visualiser les données brutes.
Question 1 - Depuis votre dossier, effectuer la manipulation suivante sur le fichier : Clique-droit > Éditer avec Notepad++.
Question 2 - Donner tous les descripteurs de ce fichier.
Question 3 - Indiquer le séparateur utilisé pour séparer les données.
Question 4 - Fermer le logiciel Notepad++.
Pour la suite des exercices, nous allons utiliser l'application Google Sheets pour manipuler les données du fichier liste_festivals.csv
.
Question 1 - Rendez-vous sur le site suivant : https://docs.google.com/spreadsheets
Question 2 - Se connecter à l'aide de votre compte LPO Gustave Eiffel.
Question 3 - Sur la page d'accueil de l'application, cliquer sur Feuille de calcul vierge.
Vous devez arriver sur une page vierge.
Question 4 - Cliquer sur Ficher > Importer. Une nouvelle fenêtre s'ouvre. Dans l'onglet « Importer », cliquer sur Parcourir et aller chercher votre fichier liste_festivals.csv
.
Question 5 - Une nouvelle fenêtre s'ouvre pour indiquer le symbole séparateur.
Question 6 - Sélectionner le bon séparateur dans la liste déroulante puis cliquer sur Importer les données.
À cette étape, vous devez avoir toutes les données représenter sous la forme d'un tableau.
Question 7 - Pour obtenir une meilleure visibilité, vous pouvez agrandir les colonnes.
Avec Google Sheets, il est possible de filtrer une collection pour récupérer uniquement des données qui correspondent à certains critères.
Voici une vidéo qui montre comment mettre en place les filtres.
Des flèches sont apparues à côté de chaque descripteur. En cliquant dessus, il est possible de configurer les filtres en fonction de la recherche voulue.
Question 1 - À l'aide des filtres, trouver et donner le nombre de domaines différents que l'on peut associer à un festival.
Question 2 - Donner le nom des festivals se déroulant à Narbonne.
Question 3 - Donner le nom du festival dont la périodicité est irrégulière.
Question 4 - Donner le nombre de festivals se déroulant dans le Nord. Pour connaitre le nombre de lignes répondant aux critères, il suffit de regarder en bas à droite de la fenêtre.
Question 5 - Donner le nombre de festivals se déroulant à Lille durant le mois de mai et le mois juin.
Question 6 - Donner le nombre de festivals qui possèdent le mot « festival » dans leur nom. Vous devez utiliser un filtre par condition.
Question 7 - Donner les noms des festivals qui possèdent le mot « rock » dans leur nom et se déroulant dans le département du Lot-et-Garonne.
Question 8 - Donner le nombre de festivals qui ont eu lieu entre 12 et 15 fois.
Question 9 - Donner le nombre de festivals créé en 2015, uniquement pour les villes dont la première lettre est un « A ».
Question 10 - Donner le nom du festival dont l'identifiant est le
GD020
.
Avec Google Sheets, il est également possible de trier des données dans un certain ordre. Les opérations de tris sont disponibles au même endroit que les filtres.
Question 1 - Donner le nom du département où se trouve le festival le plus vieux (parmi ceux dont la date de création est présente).
Question 2 - Donner le nom des 2 premiers festivals triés par ordre alphabétique du nom et se déroulant à Lille.
Question 3 - Donner le nom des 2 premiers festivals triés par ordre alphabétique de la ville et se déroulant dans le Nord.
Question 4 - Donner le nom des 3 festivals de musiques actuelles, dont la date de création du festival est la plus récente, se situant dans le Pas-de-calais au mois de juillet.
Avec Google Sheets, il est possible de mettre en forme des données avec des diagrammes et des graphiques.
L'objectif de cet exercice est de créer des graphiques qui représentent la répartition des domaines des festivals.
Question 1 - Copier contenu de la colonne B et le coller dans la colonne N.
Question 2 - Supprimer le descripteur de la colonne N.
Question 2 - Il faut maintenant enlever les doublons de cette colonne. Pour cela, sélectionner la colonne N et supprimer les doublons de la colonne N en aller dans l'onglet Données > Nettoyage des données > Supprimer les doublons.
À cette étape, vous devez avoir 13 lignes à la colonne N.
Sur la colonne O, on souhaite avoir le nombre de festivals qui correspondent au domaine précisé sur la colonne N. Pour compléter automatiquement cette colonne, nous allons utiliser des formules.
Question 3 - Écrire la formule suivante dans la case O2 : =COUNTIF(B:B;N2)
. Dans cette formule, B:B
indique qu'il faut compter le nombre de fois où l'on trouve la valeur présente de N1, dans toute la colonne B.
En appuyant sur la touche entrée, vous obtenez le nombre de festivals.
Question 4 - Étendre la formule pour exécuter la commande sur l'ensemble des domaines.
Avec ce tableau composé de 2 colonnes, il est maintenant possible de créer :
Question 5 - Sélectionner les 2 colonnes de votre tableau. Cliquer sur Insertion > Graphique pour ajouter un diagramme circulaire et un histogramme. Voici le résultat que vous devez obtenir.
Question 6 - Selon le même principe, créer le sous-tableau et les graphiques permettant d'obtenir la répartition du nombre de festivals selon la région.
Question 7- Selon le même principe, créer le sous-tableau et la courbe représentant l'évolution du nombre de festivals par mois.