<?xml version="1.0" encoding="UTF-8"?>

<upm-export>
	<title>Enseignement de l&#039;informatique et du numérique au lycée Boissy d&#039;Anglas</title>
	<link>https://icn-isn-boissy.yj.fr/wp</link>
	<description></description>
	<pubDate>Sat May 16 4:14:10 2026 / +0000  GMT</pubDate>
	<generator>Universal Post Manager 1.1.2 [ www.ProfProjects.com ] </generator>
	<language></language>
	
			<item>
			<title>Projet : Chance de survivre  au naufrage du Titanic ?</title>
			<link>https://icn-isn-boissy.yj.fr/wp/?p=3606</link>
			<pubDate>Sat May 16 4:14:10 2026 / +0000  GMT</pubDate>
			<guid isPermaLink="false">https://icn-isn-boissy.yj.fr/wp/?p=3606</guid>
			<content-encoded><![CDATA[<!-- wp:separator -->
<hr class="wp-block-separator"/>
<!-- /wp:separator -->

<!-- wp:heading {"level":1} -->
<h1>Présentation du projet :</h1>
<!-- /wp:heading -->

<!-- wp:paragraph -->
<p>Vous allez travailler sur le jeu de données suivant (à télécharger):&nbsp;</p>
<!-- /wp:paragraph -->

<!-- wp:file {"id":3607,"href":"https://icn-isn-boissy.yj.fr/wp/wp-content/uploads/2022/03/titanic.csv"} -->
<div class="wp-block-file"><a id="wp-block-file--media-50df7d67-9bf7-4c94-aaeb-40dc42e0d515" href="https://icn-isn-boissy.yj.fr/wp/wp-content/uploads/2022/03/titanic.csv">titanic.csv</a><a href="https://icn-isn-boissy.yj.fr/wp/wp-content/uploads/2022/03/titanic.csv" class="wp-block-file__button" download aria-describedby="wp-block-file--media-50df7d67-9bf7-4c94-aaeb-40dc42e0d515">Télécharger</a></div>
<!-- /wp:file -->

<!-- wp:paragraph -->
<p>Ce jeu de données contient des informations sur une partie des passagers (plus exactement sur 891 passagers) du Titanic. Pour un petit rappel historique, vous pouvez consulter la page Wikipédia consacrée à ce paquebot :&nbsp;<a href="https://fr.wikipedia.org/wiki/Titanic" target="_blank" rel="noreferrer noopener">ici</a></p>
<!-- /wp:paragraph -->

<!-- wp:paragraph -->
<p>Ouvrez le fichier "titanic.csv" à l'aide d'un tableur.</p>
<!-- /wp:paragraph -->

<!-- wp:paragraph -->
<p>Vous devriez obtenir quelque chose qui ressemble à ceci :<img src="http://bfourlegnie.com/nsi_2019/cours/CHAP9/titanic0.png"></p>
<!-- /wp:paragraph -->

<!-- wp:paragraph -->
<p>Trouvez la signification des différents descripteurs : "PassengerId", "Survived", "Pclass"...&nbsp;<em>Aide :&nbsp;</em></p>
<!-- /wp:paragraph -->

<!-- wp:file {"id":3608,"href":"https://icn-isn-boissy.yj.fr/wp/wp-content/uploads/2022/03/TitanicMETA.pdf","displayPreview":true} -->
<div class="wp-block-file"><a id="wp-block-file--media-d43f9429-6a90-4b35-a4b2-f9a7440a764c" href="https://icn-isn-boissy.yj.fr/wp/wp-content/uploads/2022/03/TitanicMETA.pdf">TitanicMETA</a><a href="https://icn-isn-boissy.yj.fr/wp/wp-content/uploads/2022/03/TitanicMETA.pdf" class="wp-block-file__button" download aria-describedby="wp-block-file--media-d43f9429-6a90-4b35-a4b2-f9a7440a764c">Télécharger</a></div>
<!-- /wp:file -->

<!-- wp:paragraph -->
<p><strong>L'objectif de ce projet est d'utiliser l'algorithme des k plus proches voisins afin de déterminer si les passagers ci-dessous auraient survécus au naufrage du Titanic.</strong></p>
<!-- /wp:paragraph -->

<!-- wp:table -->
<figure class="wp-block-table"><table><tbody><tr><th>Pclass</th><th>Name</th><th>Sex</th><th>Age</th><th>SibSp</th><th>Parch</th><th>Ticket</th><th>Fare</th><th>Embarked</th></tr><tr><td>2</td><td>Mr. Bidochon  Robert</td><td>male</td><td>37</td><td>1</td><td>4</td><td>244377</td><td>21.075</td><td>C</td></tr><tr><td>2</td><td>Mrs. Bidochon  Raymonde</td><td>female</td><td>36</td><td>1</td><td>4</td><td>244379</td><td>20.2175</td><td>C</td></tr><tr><td>2</td><td>Mrs. Bidochon  <strong>Gisèle</strong></td><td>female</td><td>11</td><td>3</td><td>2</td><td>244382</td><td>15.045</td><td>C</td></tr><tr><td>2</td><td>Mr. Bidochon René.</td><td>male</td><td>8</td><td>3</td><td>2</td><td>244383</td><td>12.945</td><td>C</td></tr><tr><td>2</td><td>Mr. Bidochon  Eugène.</td><td>male</td><td>4</td><td>3</td><td>2</td><td>137383</td><td>10.17</td><td>C</td></tr><tr><td>2</td><td>Mr. Bidochon  Louis.</td><td>male</td><td>1</td><td>3</td><td>2</td><td>3738</td><td>11.13</td><td>C</td></tr></tbody></table></figure>
<!-- /wp:table -->

<!-- wp:heading {"level":1} -->
<h1>PARTIE 1 : Analyse des données (Data scientist)</h1>
<!-- /wp:heading -->

<!-- wp:paragraph -->
<p>Un travail de préparation des données va être nécessaire , vous allez donc devoir passer par quelques étapes que voici :</p>
<!-- /wp:paragraph -->

<!-- wp:paragraph -->
<p>- Pour ceux qui ne souhaitent pas poursuivre la spécialité N.S.I vous pouvez opérer les changements directement avec le tableur.</p>
<!-- /wp:paragraph -->

<!-- wp:paragraph -->
<p>- Pour ceux qui souhaitent poursuivre la spécialité N.S.I vous devez opérer les changements directement avec python.<br>Le fichier python ci-dessous, vous aidera faire les manipulations nécessaires).</p>
<!-- /wp:paragraph -->

<!-- wp:file {"id":3609,"href":"https://icn-isn-boissy.yj.fr/wp/wp-content/uploads/2022/03/aide_depart.tar"} -->
<div class="wp-block-file"><a id="wp-block-file--media-efb33627-0e4d-4073-a7cd-b5cf63a94505" href="https://icn-isn-boissy.yj.fr/wp/wp-content/uploads/2022/03/aide_depart.tar">aide_depart   fichier à dézziper</a><a href="https://icn-isn-boissy.yj.fr/wp/wp-content/uploads/2022/03/aide_depart.tar" class="wp-block-file__button" download aria-describedby="wp-block-file--media-efb33627-0e4d-4073-a7cd-b5cf63a94505">Télécharger</a></div>
<!-- /wp:file -->

<!-- wp:paragraph -->
<p></p>
<!-- /wp:paragraph -->

<!-- wp:paragraph -->
<p>Analyser ce fichier, combien y a t'il de fonctions,que font elles?</p>
<!-- /wp:paragraph -->

<!-- wp:paragraph -->
<p>Pour la suite du projet vous pouvez travailler soit avec la liste de dictionnaire créé avec le programme, soit avec le fichier csv.</p>
<!-- /wp:paragraph -->

<!-- wp:paragraph -->
<p>Toutes les colonnes ne vont pas forcement être pertinentes, par exemple, d'après vous, lors du naufrage, le nom du passager a-t-il eu une quelconque importance sur le fait qu'il ait ou non survécu ? (nous ne tiendrons pas compte du fait que certaines personnes aient pu être privilégié au vu de leur nom de famille, sur les 891 passagers présents dans le fichier titanic.csv, ce phénomène est négligeable).</p>
<!-- /wp:paragraph -->

<!-- wp:paragraph -->
<p>Solution 1 avec le tableur:</p>
<!-- /wp:paragraph -->

<!-- wp:paragraph -->
<p>En analysant le contenu du fichier titanic.csv (par exemple à l'aide d'un tableur), choisissez les descripteurs ( c'est à dire les colonnes) qui vous paraissent les plus pertinents. Vous effacerez les colonnes qui vous semblent inutiles directement dans le tableur ou avec python pour obtenir soit une liste de dictionnaire (comme Data dans le fichier donné ci dessus), soit un nouveau fichier&nbsp;<strong>titanic_V2.csv</strong></p>
<!-- /wp:paragraph -->

<!-- wp:paragraph -->
<p>Solution 2, avec python :</p>
<!-- /wp:paragraph -->

<!-- wp:paragraph -->
<p>Nettoyer la liste de dictionnaire, en ne gardant pour chaque dictionnaire que les clés que vous jugez nécessaire. <br>Enregistrer votre fichier python.<br></p>
<!-- /wp:paragraph -->

<!-- wp:paragraph -->
<p>Pour certains passagers, il manque des données. Par exemple, l'âge de certains passagers n'est pas renseigné. Une solution est de supprimer du fichier les passagers ayant des données incomplètes.</p>
<!-- /wp:paragraph -->

<!-- wp:paragraph -->
<p>Supprimer du fichier les passagers ayant des données incomplètes pour obtenir un nouveau fichier&nbsp;<strong>titanic_V3.csv</strong> ou une nouvelle liste de dictionnaire avec les données incomplètes supprimées.</p>
<!-- /wp:paragraph -->

<!-- wp:paragraph -->
<p><br>L'utilisation de l'algorithme des k plus proches voisins nous oblige à proscrire les données non numériques.<br>Par exemple, la colonne "Sex" ne peut pas être utilisée telle quelle, l'algorithme n'est pas capable de traiter les "male" et "female".</p>
<!-- /wp:paragraph -->

<!-- wp:paragraph -->
<p>Proposer une alternative pour remplacer les chaines de caracteres "male" et "female".<br>Modifier certaines colonnes directement dans le tableur ou avec un script python pour obtenir un nouveau fichier&nbsp;<strong>titanic_V4.csv</strong> ou une nouvelle liste de dictionnaire.</p>
<!-- /wp:paragraph -->

<!-- wp:paragraph -->
<p><br>Avec l'algorithme des k plus proches voisins nous sommes amenés à calculer des distances.<br>Comparer l'amplitude des valeurs de la colonne&nbsp;<strong>Pclass</strong>&nbsp;avec l'amplitude des valeurs de la colonne&nbsp;<strong>Age</strong>.</p>
<!-- /wp:paragraph -->

<!-- wp:paragraph -->
<p>Amplitude des valeurs de la colonne&nbsp;<strong>Pclass</strong>&nbsp;:<br>Amplitude des valeurs de la colonne&nbsp;<strong>Age</strong>&nbsp;:</p>
<!-- /wp:paragraph -->

<!-- wp:paragraph -->
<p>Code python pour obtenir cette amplitude à partir de&nbsp;<strong>titanic_V4.csv</strong> ou avec la liste de dictionnaire&nbsp;:<br>Une des conséquence de l'observation précédente est que le calcul de la distance ne va pas traiter de facon égalitaire les colonnes.<br>Pour rétablir l'équité nous allons procéder ainsi :<br>Pour chaque colonne :</p>
<!-- /wp:paragraph -->

<!-- wp:list {"ordered":true} -->
<ol><li>On repère la valeur minimale (<strong>v_min</strong>) et la valeur maximale (<strong>&nbsp;v_max</strong>)</li><li>On va diviser chacune des valeurs de la colonne par la diffrence&nbsp;<strong>v_max-v_min</strong><br>Exemple : Si une colonne contient les valeurs [5,4,1,11,7]<br>v_min=1 et v_max=11<br>Alors on divise toutes les valeurs par 8 ce qui donne [0.5,0.4,0.1,1.1,0.7]</li></ol>
<!-- /wp:list -->

<!-- wp:paragraph -->
<p>Remarque :<br>Toutes les valeurs de toutes les colonnes seront comprises entre 0 et 1.<br>Cela nous garantie un traitement équitable entre les colonnes.</p>
<!-- /wp:paragraph -->

<!-- wp:paragraph -->
<p>Faire les modifications nécessaires au fichier&nbsp;<strong>titanic_V4.csv</strong>&nbsp;pour garantir un équitable entre les colonnes. On nommera&nbsp;<strong>titanic_V5.csv</strong>&nbsp;le nouveau fichier obtenu. Vous devriez avoir un fichier comme celui-ci:</p>
<!-- /wp:paragraph -->

<!-- wp:file {"id":3610,"href":"https://icn-isn-boissy.yj.fr/wp/wp-content/uploads/2022/03/titanicV5.csv"} -->
<div class="wp-block-file"><a id="wp-block-file--media-ac49cf79-0e5f-456f-8a9d-0ea003b3c36f" href="https://icn-isn-boissy.yj.fr/wp/wp-content/uploads/2022/03/titanicV5.csv">titanicV5</a><a href="https://icn-isn-boissy.yj.fr/wp/wp-content/uploads/2022/03/titanicV5.csv" class="wp-block-file__button" download aria-describedby="wp-block-file--media-ac49cf79-0e5f-456f-8a9d-0ea003b3c36f">Télécharger</a></div>
<!-- /wp:file -->

<!-- wp:heading -->
<h2>Partie 2: Graphique 3D</h2>
<!-- /wp:heading -->

<!-- wp:paragraph -->
<p>A l'aide du TP sur les k plus proches voisins, construire le graphique 3D à partir du fichier titanicV5.csv</p>
<!-- /wp:paragraph -->

<!-- wp:image {"id":3611,"sizeSlug":"full","linkDestination":"media"} -->
<figure class="wp-block-image size-full"><a href="https://icn-isn-boissy.yj.fr/wp/wp-content/uploads/2022/03/Figure_1.png"><img src="https://icn-isn-boissy.yj.fr/wp/wp-content/uploads/2022/03/Figure_1.png" alt="" class="wp-image-3611"/></a></figure>
<!-- /wp:image -->

<!-- wp:paragraph -->
<p>Les survivants devront être en vert et les disparus en rouge, les personnes que vous testerez seront en bleu.</p>
<!-- /wp:paragraph -->

<!-- wp:paragraph -->
<p>voici quelques liens ou faire des recherches:</p>
<!-- /wp:paragraph -->

<!-- wp:paragraph -->
<p>1 er lien <a href="https://cpge.frama.io/fiches-cpge/Python/Graphiques/5-3D/">Les fiches CPGE</a></p>
<!-- /wp:paragraph -->

<!-- wp:paragraph -->
<p>2 éme lien<a href="https://machinelearnia.com/data-science-5-graphiques-a-connaitre-avec-matplotlib/"> Machine learnia</a></p>
<!-- /wp:paragraph -->

<!-- wp:heading -->
<h2>Partie 3: Utilisation de l'algorithme des K plus proche voisins</h2>
<!-- /wp:heading -->

<!-- wp:paragraph -->
<p>A l'aide du TP sur les k plus proches voisins, (avec k=5) prédire quel(s) membre(s) de la famille Bidochons aurait(ent) survécu(s) au naufrage du Titanic ?</p>
<!-- /wp:paragraph -->

<!-- wp:paragraph -->
<p>En utilisant  l'algorithme proposé par scikit-learn <br>des k plus proches voisins établir votre programme python et donnez la liste des survivants en faisant varier k de 3 à 19 ( valeur impaire).</p>
<!-- /wp:paragraph -->

<!-- wp:paragraph -->
<p>( c'est la ligne : from sklearn.neighbors import KNeighborsClassifier qui charge l'algorithme)</p>
<!-- /wp:paragraph -->]]></content-encoded>
			<excerpt-encoded><![CDATA[]]></excerpt-encoded>
			<wp-post_id>3606</wp-post_id>
			<wp-post_date>2022-03-07 18:42:55</wp-post_date>
			<wp-post_date_gmt>2022-03-07 17:42:55</wp-post_date_gmt>
				</item>
</upm-export>
