Archives de catégorie : NSI

Installation linux

Lire l’article sur Clubic.

https://www.clubic.com/telecharger/actus-logiciels/article-842846-1-10-distributions-gnu-linux-preferees-dire-adieu-windows-10.html

Choisir une version de linux,

par exemple MINT:

https://www.linuxmint.com/index.php

Suivre les instructions de téléchargement, d’installation.

Installer le disque dur sur le pc , faire une fiche de la composition de l’ordinateur, Mémoire, Disque dur, Processeur…..

Pensez à préciser la version de linux que vous avez installé, avec les différents nom d’utilisateur et mot de passe.

1- Les variables

Merci à David Roche pour son travail que vous pouvez retrouver sur son site.

Le langage que nous allons utiliser en NSI est Python, pour écrire nos programmes nous devons utiliser un éditeur (IDE , Integrated Development Environment).

Il en existe une multitude, nous utiliserons Thonny. Vous pouvez l’installer chez vous en suivant les indications sur le site thonny.org.

Prise en main de Thonny

Thonny lancé, à l’écran vous devriez avoir ceci:

Thonny possède plusieurs fenêtres. Pour les faire apparaitre ou disparaitre, cliquer dans le menu Affichage et cochez celles qui vous intéressent. Nous en utiliserons 3 en particulier, la fenêtre Éditeur (qui permet de saisir les lignes de programme), la fenêtre Console (interpréteur interactif qui permet l’interaction entre le programme et l’utilisateur) et la fenêtre Variables (qui affiche l’état des variables).

À faire vous-même 1

Dans la fenêtre « Éditeur« , saisir le programme suivant :

print("hello world !")

puis lancer votre programme (en appuyant sur F5 ou en cliquant sur la flèche blanche sur fond vert) (avant la première exécution on vous demandera d’enregistrer votre programme, faites attention ou vous stockez vos fichiers…)

le message hello world ! doit apparaître dans la console:

Notion de variable

Définition du mot ordinateur d’après « Le Petit Larousse » :

« Machine automatique de traitement de l’information, obéissant à des programmes formés par des suites d’opérations arithmétiques et logiques. »

Qui dit « traitement de l’information », dit donc données à manipuler. Un programme « passe » donc son temps à traiter des données. Pour pouvoir traiter ces données, l’ordinateur doit les ranger dans sa mémoire (RAM – Random Access Memory). La RAM se compose de cases dans lesquelles nous allons ranger ces données (une donnée dans une case). Chaque case a une adresse (ce qui permet au processeur de savoir où sont rangées les données).

Alors, qu’est-ce qu’une variable ?

Eh bien, c’est une petite information (une donnée) temporaire que l’on stocke dans une case de la RAM. On dit qu’elle est « variable », car c’est une valeur qui peut changer pendant le déroulement du programme.

Une variable est constituée de 2 choses :

  • Elle a une valeur : c’est la donnée qu’elle « stocke » (par exemple le nombre entier 5)
  • Elle a un nom : c’est une étiquette qui permet de la reconnaître. Nous n’aurons pas à retenir l’adresse de mémoire, nous allons juste indiquer des noms de variables à la place.
i = 12			

Grâce à cette ligne, nous avons défini une variable qui porte le nom i et qui « contient » le nombre entier 12. Plus précisément, nous dirons que la variable i référence le nombre entier 12.

À faire vous-même 2

Dans la partie « éditeur » de Thonny, saisir le code suivant :

point_de_vie = 15			

Après avoir exécuté le programme en cliquant sur Executer le script courant, il est possible de connaître la valeur référencée par une variable en utilisant la partie « console » de Thonny.

Dans le cas qui nous intéresse ici, taper point_de_vie dans la console

Après avoir appuyé sur la touche « Entrée« , vous devriez voir la valeur référencée par la variable point_de_vie s’afficher dans la console.

N.B. : Dans la suite, la procédure sera toujours la même :

  • Vous utiliserez la partie « éditeur » pour saisir votre programme
  • vous utiliserez la partie « console » pour afficher la valeur référencée par une variable

À faire vous-même 3

Écrire un programme dans lequel on attribue la valeur 12 à la variable point_de_force. La valeur référencée par la variable point_de_force devra ensuite être affichée dans la console.


Nous venons de voir qu’une variable peut référencer un nombre entier, mais elle peut aussi référencer un nombre à virgule :

i = 5.2			

Prenez bien garde, nous utilisons un point à la place d’une virgule (convention anglo-saxonne).

Une variable peut donc référencer plusieurs types d’entités (pour l’instant nous n’en avons vu que deux, mais nous en verrons d’autres plus loin) : les nombres entiers (« integer » en anglais, abrégé en « int« ) et les nombres à virgule (« float » en anglais). Il est possible de connaitre le type de l’entité référencé par une variable à l’aide de l’instruction « type« .

À faire vous-même 4

Tester le programme suivant :

a = 5.2
b = 12			

taper type(a) puis type(b) dans la console

Comme vous pouvez le constater, le type de la grandeur référencée par la variable a et le type de la grandeur référencée par la variable b s’affichent dans la console


Un peu de calculs

Un ordinateur est bien évidemment capable d’effectuer des opérations mathématiques (arithmétiques).

Les signes utilisés sont classiques : +, – , * (multiplication), / (division), // (division euclidienne) ou encore % (modulo : reste d’une division euclidienne).

Il est tout à fait possible d’effectuer des opérations directement avec des nombres, mais il est aussi possible d’utiliser des variables.

À faire vous-même 5

Essayer d’écrire un programme qui additionnera le contenu de 2 variables (nom des variables : nombre_1 et nombre_2). Le résultat de cette opération devra être référencé par une troisième variable nommée resultat (attention pas d’accent dans les noms de variable). Tester votre programme en utilisant la console pour vérifier la valeur référencée par la variable résultat.


À faire vous-même 6

D’après vous, que fait ce programme ?

nombre = 11
nombre = nombre + 1			

Vérifier votre réponse en exécutant le programme (utilisation dans console pour déterminer la valeur référencée par la variable nombre à la fin du programme)


Détaillons ce qui se passe dans le « À faire vous-même 6« :

  • nous créons une variable nombre qui référence l’entier 11
  • nous affichons à l’écran la valeur référencée par nombre (c’est-à-dire 11)

La suite est un peu plus complexe, mais très importante à comprendre. Il va falloir lire la ligne  » nombre = nombre + 1″ de droite à gauche, décortiquons cette ligne :

  •  » nombre + 1″ : nous prenons la valeur actuelle de nombre (c’est-à-dire 11) et nous ajoutons 1 à 11, à droite de l’égalité nous avons donc maintenant la valeur 12
  • nous attribuons la valeur qui vient d’être calculée à la variable nombre
  • nous affichons à l’écran la nouvelle valeur référencée par nombre

Ce raisonnement peut être généralisé pour éviter des erreurs parfois difficiles à corriger : dans une égalité, commencer toujours par évaluer l’expression se trouvant à droite du signe égal.

Exposant, racine carrée, fonctions trigonométriques

Il est aussi possible d’effectuer des calculs plus complexes en utilisant par exemple des exposants, des racines carrées, des fonctions trigonométriques…

Pour utiliser ces fonctions mathématiques plus avancées, il est nécessaire d’ajouter une ligne au début de votre programme :

import math			

Cette ligne permet d’importer (et donc d’utiliser) le module « math » (ce module contient toutes les fonctions mathématiques « classiques »).

Voici quelques exemples :

  • math.pow(x,a) permet de calculer x à la puissance a
  • math.cos(x) permet de calculer le cosinus de l’angle x (l’angle x doit être en radian) (nous avons la même chose pour le sinus ou la tangente)
  • math.sqrt(x) permet de calculer la racine carrée de x

Si vous avez besoin d’autres fonctions mathématiques, consulter la documentation de Python : https://docs.python.org/3/library/math.html

À faire vous-même 7

Quelles sont les valeurs référencées par les variables d, e, f, g, h et i après l’exécution du programme suivant :

import math
a = 5
b = 16
c = 3.14 / 2
d = b / a
e = b // a
f = b % a
g = math.pow(a,2)
h = math.sqrt(b)
i = math.sin(c)			

Vérifiez vos réponses à l’aide de la console


À noter qu’il est tout à fait possible de « mélanger » des nombres entiers et des nombres à virgules (« 3.14 / 2 ») dans une opération.

À faire vous-même 8

Écrire un programme permettant de répondre à la question suivante : « Quel est le type du résultat d’une addition d’un integer et d’un float ? »


Chaînes de caractères

Les variables peuvent aussi référencer des suites de caractères, que l’on appelle « chaîne de caractères ».

À faire vous-même 9

Tester le code suivant :

ma_chaine = "Bonjour le monde !"			

Vérifiez que la variable ma_chaine référence la chaîne de caractères « Bonjour le monde ! »


Le signe + et les chaînes de caractères

L’utilisation du signe + ne se limite pas à l’addition. Il est aussi utilisé pour la concaténation.

D’après Wikipédia :

« Le terme concaténation (substantif féminin), du latin cum («avec») et catena(«chaîne, liaison»), désigne l’action de mettre bout à bout au moins deux chaînes. »

Comme vous avez pu le deviner en lisant la définition ci-dessus, la concaténation va concerner les chaînes de caractères.

À faire vous-même 10

Quelle est la chaîne de caractère référencée par la variable mon_expression après l’exécution du programme ci-dessous ? Validez votre réponse en testant ce programme.

a = "Hello"
b = "World"
mon_expression = a + b			

Chaînes de caractères et variables

Il est aussi possible de concaténer une chaîne de caractères et une ou plusieurs variables :

À faire vous-même 11

Tester le code suivant :

ma_chaine_1 = "Bonjour "
ma_chaine_2 = "le "
res = ma_chaine_1 + ma_chaine_2 + "monde!"		

Les 2 variables ma_chaine_1 et ma_chaine_2 référencent 2 chaînes de caractères, nous avons donc bien ici une concaténation.

Mais que se passe-t-il si la variable référence un nombre (entier ou flottant) ?

À faire vous-même 12

Tester le code suivant :


mon_nombre = 5
res = "Nombre de personnes : " + mon_nombre

Comme vous pouvez le constater, nous avons droit à une erreur. En effet, il n’est pas possible de concaténer une chaîne de caractères et un nombre.

Python nous offre 2 solutions :

  • l’utilisation de la méthode « str »
  • l’utilisation des « fstring »

La méthode (nous verrons plus loin la notion de méthode) « str » permet de transformer un nombre en chaîne de caractères (si la transformation n’est pas possible, nous aurons une erreur)

À faire vous-même 13

Tester le code suivant :

mon_nombre = 5
mon_nombre = str(mon_nombre)		

Quel est le type de la valeur référencée par la variable mon_nombre après l’exécution du programme ci-dessus ?


À faire vous-même 14

Tester le code suivant :

mon_nombre = 5
res = "Nombre de personnes : "  + str(mon_nombre)

Tout fonctionne, car maintenant nous avons bien une concaténation entre 2 chaînes de caractères.


Les « fstring » (nouveauté de Python 3.5), permettent de résoudre ce problème de combinaison variable-chaîne de caractères.

À faire vous-même 15

Tester le code suivant :

mon_nombre = 5
res = f"Nombre de personnes : {mon_nombre}"	

Notez la présence du « f » juste avant le guillemet et des accolades qui encadrent le nom de la variable. Il est possible, dans une même chaîne de caractères d’avoir plusieurs noms de variable.

Suite : les expressions et les booléens

Projet : Chance de survivre au naufrage du Titanic ?


Présentation du projet :

Vous allez travailler sur le jeu de données suivant (à télécharger): 

Ce jeu de données contient des informations sur une partie des passagers (plus exactement sur 891 passagers) du Titanic. Pour un petit rappel historique, vous pouvez consulter la page Wikipédia consacrée à ce paquebot : ici

Ouvrez le fichier « titanic.csv » à l’aide d’un tableur.

Vous devriez obtenir quelque chose qui ressemble à ceci :

Trouvez la signification des différents descripteurs : « PassengerId », « Survived », « Pclass »… Aide : 

L’objectif de ce projet est d’utiliser l’algorithme des k plus proches voisins afin de déterminer si les passagers ci-dessous auraient survécus au naufrage du Titanic.

PclassNameSexAgeSibSpParchTicketFareEmbarked
2Mr. Bidochon Robertmale371424437721.075C
2Mrs. Bidochon Raymondefemale361424437920.2175C
2Mrs. Bidochon Gisèlefemale113224438215.045C
2Mr. Bidochon René.male83224438312.945C
2Mr. Bidochon Eugène.male43213738310.17C
2Mr. Bidochon Louis.male132373811.13C

PARTIE 1 : Analyse des données (Data scientist)

Un travail de préparation des données va être nécessaire , vous allez donc devoir passer par quelques étapes que voici :

– Pour ceux qui ne souhaitent pas poursuivre la spécialité N.S.I vous pouvez opérer les changements directement avec le tableur.

– Pour ceux qui souhaitent poursuivre la spécialité N.S.I vous devez opérer les changements directement avec python.
Le fichier python ci-dessous, vous aidera faire les manipulations nécessaires).

Analyser ce fichier, combien y a t’il de fonctions,que font elles?

Pour la suite du projet vous pouvez travailler soit avec la liste de dictionnaire créé avec le programme, soit avec le fichier csv.

Toutes les colonnes ne vont pas forcement être pertinentes, par exemple, d’après vous, lors du naufrage, le nom du passager a-t-il eu une quelconque importance sur le fait qu’il ait ou non survécu ? (nous ne tiendrons pas compte du fait que certaines personnes aient pu être privilégié au vu de leur nom de famille, sur les 891 passagers présents dans le fichier titanic.csv, ce phénomène est négligeable).

Solution 1 avec le tableur:

En analysant le contenu du fichier titanic.csv (par exemple à l’aide d’un tableur), choisissez les descripteurs ( c’est à dire les colonnes) qui vous paraissent les plus pertinents. Vous effacerez les colonnes qui vous semblent inutiles directement dans le tableur ou avec python pour obtenir soit une liste de dictionnaire (comme Data dans le fichier donné ci dessus), soit un nouveau fichier titanic_V2.csv

Solution 2, avec python :

Nettoyer la liste de dictionnaire, en ne gardant pour chaque dictionnaire que les clés que vous jugez nécessaire.
Enregistrer votre fichier python.

Pour certains passagers, il manque des données. Par exemple, l’âge de certains passagers n’est pas renseigné. Une solution est de supprimer du fichier les passagers ayant des données incomplètes.

Supprimer du fichier les passagers ayant des données incomplètes pour obtenir un nouveau fichier titanic_V3.csv ou une nouvelle liste de dictionnaire avec les données incomplètes supprimées.


L’utilisation de l’algorithme des k plus proches voisins nous oblige à proscrire les données non numériques.
Par exemple, la colonne « Sex » ne peut pas être utilisée telle quelle, l’algorithme n’est pas capable de traiter les « male » et « female ».

Proposer une alternative pour remplacer les chaines de caracteres « male » et « female ».
Modifier certaines colonnes directement dans le tableur ou avec un script python pour obtenir un nouveau fichier titanic_V4.csv ou une nouvelle liste de dictionnaire.


Avec l’algorithme des k plus proches voisins nous sommes amenés à calculer des distances.
Comparer l’amplitude des valeurs de la colonne Pclass avec l’amplitude des valeurs de la colonne Age.

Amplitude des valeurs de la colonne Pclass :
Amplitude des valeurs de la colonne Age :

Code python pour obtenir cette amplitude à partir de titanic_V4.csv ou avec la liste de dictionnaire :
Une des conséquence de l’observation précédente est que le calcul de la distance ne va pas traiter de facon égalitaire les colonnes.
Pour rétablir l’équité nous allons procéder ainsi :
Pour chaque colonne :

  1. On repère la valeur minimale (v_min) et la valeur maximale ( v_max)
  2. On va diviser chacune des valeurs de la colonne par la diffrence v_max-v_min
    Exemple : Si une colonne contient les valeurs [5,4,1,11,7]
    v_min=1 et v_max=11
    Alors on divise toutes les valeurs par 8 ce qui donne [0.5,0.4,0.1,1.1,0.7]

Remarque :
Toutes les valeurs de toutes les colonnes seront comprises entre 0 et 1.
Cela nous garantie un traitement équitable entre les colonnes.

Faire les modifications nécessaires au fichier titanic_V4.csv pour garantir un équitable entre les colonnes. On nommera titanic_V5.csv le nouveau fichier obtenu. Vous devriez avoir un fichier comme celui-ci:

Partie 2: Graphique 3D

A l’aide du TP sur les k plus proches voisins, construire le graphique 3D à partir du fichier titanicV5.csv

Les survivants devront être en vert et les disparus en rouge, les personnes que vous testerez seront en bleu.

voici quelques liens ou faire des recherches:

1 er lien Les fiches CPGE

2 éme lien Machine learnia

Partie 3: Utilisation de l’algorithme des K plus proche voisins

A l’aide du TP sur les k plus proches voisins, (avec k=5) prédire quel(s) membre(s) de la famille Bidochons aurait(ent) survécu(s) au naufrage du Titanic ?

En utilisant l’algorithme proposé par scikit-learn
des k plus proches voisins établir votre programme python et donnez la liste des survivants en faisant varier k de 3 à 19 ( valeur impaire).

( c’est la ligne : from sklearn.neighbors import KNeighborsClassifier qui charge l’algorithme)

Recherche

def recherche_mot_boyer(texte, mot):
    """Recherche un mot dans un texte avec l'algo de boyer-moore

    Arguments
    ---------
    texte: str
        le texte dans lequel on effectue la recherche
    mot: str
        le mot recherché

    Returns
    -------
    bool
        renvoie True si le mot est trouvé
    """
    N = len(texte)
    n = len(mot)
    
    # création de notre dictionnaire de décalages
    décalages = pre_traitement(mot)
    
    # on commence à la fin du mot
    i = n - 1
    while i < N:
        lettre = texte[i]
        if lettre == mot[-1]:
            # On vérifie que le mot est là avec un slice sur texte
            # On pourrait faire un while
            if texte[i-n+1:i+1] == mot:
                return True
        # on décale
        if lettre in décalages.keys():
            i += décalages[lettre]
        else:
            i += n
        
    return False

# Quelques tests
assert recherche_mot_boyer('abracadabra', 'dab')
assert recherche_mot_boyer('abracadabra', 'abra')
assert recherche_mot_boyer('abracadabra', 'obra') == False
assert recherche_mot_boyer('abracadabra', 'bara') == False
assert recherche_mot_boyer('maman est là', 'maman')
assert recherche_mot_boyer('bonjour maman', 'maman')
assert recherche_mot_boyer('bonjour maman', 'papa') == False

Pré-traitement

def pre_traitement(mot):
    """Renvoie un dictionnaire avec pour clé la lettre et pour valeur le décalage

    Arguments
    ---------
    mot: str
    
    Returns
    -------
    dict
    """
    n = len(mot)
    décalages = {}
    # Il n'est pas nécéssaire d'inclure la dernière lettre
    for i, letter in enumerate(mot[:-1]):
        décalages[letter] = n - i -1
    return décalages

# tests
assert pre_traitement("dab") == {'d': 2, 'a': 1}
assert pre_traitement("maman") == {'m': 2, 'a': 1}