informatique: أبريل 2014

الأربعاء، 30 أبريل 2014

Strategie-tarifaire-un-vecteur-de-croissance-rentable-Chaire-ESSEC-Vente-et-Strategie-Marketing.pdf

الثلاثاء، 29 أبريل 2014

Les caractères accentués: le problème de la tour de Babel

La tour de Babel: Pieter Bruegel l'Ancien

À une époque très ancienne, tous les humains parlaient la même langue. Ils entreprirent la construction d'une tour qui devait leur permettre d'atteindre leciel: la tour de Babel.

Jugeant leur entreprise trop orgueilleuse, Dieu décida de multiplier les langues utilisées par les humains, afin qu'ils ne se comprennent plus. Ainsi échoua la construction de la tour.

L'informatique d'aujourd'hui doit pouvoir tenir compte de la multiplicité des langages.

Ouais, ouais. Vous êtes gentil avec votre affaire de tour de Babel, mais pour moi, le seul problème de langage que j'ai avec Python, c'est quand il m'envoie des injures parce que j'utilise des caractères accentués.

Précisément, c'est la question que nous abordons. Et vous verrez qu'il y a bien un rapport avec la Tour de Babel.

Si tu n'as jamais observé de problème lié aux caractères accentués, tente l'expérience suivante:

Dans un éditeur de textes, reproduis le texte suivant:

#! /usr/bin/python

print "évitons les problèmes"

Enregistre le document sous le nom accent.py
Lance le programme correspondant

$ ./accent.py

Observe le résultat:

toto@info20:~$ ./accent.py

File "accent.py", line 2

SyntaxError: Non-ASCII character '\xc3' in file accent.py on line 2, but no encoding declared; see http://www.python.org/peps/pep-0263.html for details

Et bien voilà. Vous trouvez agréable ce genre de discours?

Il faut convenir que ce n'est pas un langage de gentleman. Mais il y a une explication. Et nous devrons retourner à la Tour de Babel.

Le codage des caractères: version ASCII

La mémoire de l'ordinateur ne peut contenir que des 0 et des 1, des bits.

Pour que la machine soit, malgré tout, capable de traiter également des caractères alphabétiques, des signes de ponctuation,... on utilise des groupes de 8 bits auxquels on attribue une signification arbitraire.

Par exemple, dans la norme ASCII (American Standard Code for Information Interchange) inventée dans les années 1980, on a décidé d'attribuer un code numérique à chaque caractère de l'alphabet et à quelques signes supplémentaires.

http://fr.wikipedia.org/wiki/American_Standard_Code_for_Information_Interchange

Ce codage utilise en fait seulement 7 bits et permet de coder 127 caractères dont 96 sont imprimables.

Les caractères accentués existant dans de nombreuses langues ne sont pas pris en compte.

Ah, je comprends pourquoi il m'insulte avec SyntaxError: Non-ASCII character

Effectivement, les caractères accentués ne figurent pas dans cette norme. Voyons la solution.

Le codage des caractères: version ISO

Un organisme international (l'ISO: International Organization for Standardization) a établi une norme permettant de coder les caractères accentués dans différentes langues. C'est la norme ISO-8859 qui utilise les 8 bits.

La norme ASCII est toujours en vigueur, mais on peut employer les codes non utilisés entre 128 et 255 pour les caractères accentués.

Pour des raisons pratiques que nous n'envisagerons pas ici, la norme ISO n'utilise que les codes compris entre 161 et 255 pour des caractères imprimables: soit 95 codes.

Exemples: "à" -> code 224 ; "é" -> code 233; ...

95 codes pour les caractères accentués "éèâîôù..."? Il n'en faut pas tant. A l'aise, donc.

Les choses ne sont pas si simples. D'autres langues utilisent d'autres caractères accentués. Et l'on a même prévu de traiter la langue thai qui contient un assez grand nombre de caractères particuliers.

C'est la malédiction de Babel?

Il y a de cela, parce que cela complique les choses.

Il existe des variantes dans la norme ISO-8859.

La norme ISO-8859-1 correspond le mieux à l'alphabet accentué des langues européennes.

D'autres normes (ISO-8859-2, ISO-8859-3, ISO-8859-4, ....) utilisent les mêmes codes pour représenter éventuellement d'autres caractères.

Pour les curieux, voir les différentes normes.

Ouvre ou crée le fichier accent.py décrit plus haut sur cette page.
Sur la deuxième ligne, ajoute la mention de l'encodage utilisé

#! usr/bin/python

# -*- coding: ISO-8859-1 -*-

print "évitons les problèmes"

Relance la commande

~$ ./accent.py

Observe le résultat.

toto@info20:~$ ./accent.py

évitons les problèmes

Ah, effectivement, plus de problème maintenant. Mais c'est dommage que Python soit si compliqué. Franchement, je suis déçu.

Ce n'est pas Python qui est compliqué: ce sont les langages humains qui sont complexes.

Tous ces problèmes d'encodage sont également présents dans les pages web, par exemple.

Pour changer le type d'encodage de la page en cours, dans Firefox, procède comme indiqué dans l'illustration ci-dessous:
> Affichage > Encodage des caractères > Plus d'encodages > Européen de l'Est > Cyrilliique (ISO-8859-5)

Observe le contenu de la page
Essaie éventuellement d'autres encodages.

مزيد من المعلومات »

Mais où est donc Python?

Pour lancer un programme écrit en Python, nous avons pris l'habitude de frapper une commande du type

~$ python programme.py

Mais les programmes, même écrits en Python, se lancent généralement plus simplement: on indique simplement le nom du fichier qui contient le programme:

~$ programme.py

ou même plus simplement

~$ programme

Comment cela est-il possible?

Ouvre l'un des programmes Python écrits précédemment; prenons input.py.
Ouvre la première ligne et indiques-y la notation suivante:

#! /usr/bin/env python

Le programme devient donc:

#! /usr/bin/env python
longueur = input ("Quelle est la longueur? ")
largeur = input ("Quelle est la largeur? ")
.....

Très joli. Vous avez emprunté ça au catalogue d'insultes du capitaine Haddock ?

Il est vrai que la notation peut paraître curieuse. Cela demande quelques explications.

Sous Linux, la commande qui lance l'interpréteur Python se trouve dans le répertoire /usr/bin .

La directive contient, en fait, le chemin vers l'interpréteur.

Dans une console Linux, frappe la commande

~$ /usr/bin/env python

L'interpréteur Python démarre.

Les signes #! placés en tête de la ligne

#! /usr/bin/env python

indiquent qu'il s'agit d'une directive qu'il faut traiter séparément des instructions. Ce n'est pas du code Python.

Lorsque la directive figure en tête d'un programme, l'interpréteur de commandes est averti qu'il doit démarrer l'interpréteur Python pour pouvoir exécuter les instructions qui suivent.

Vérifie que la directive #! /usr/bin/env python figure en première ligne du programme.
Enregistre le texte du programme et quitte l'éditeur de textes.
Dans la console, frappe la commande:

~$ input.py

Observe le résultat

toto@info17:~$ input.py
bash: input.py : commande introuvable

Ouaah, ça marche du tonnerre votre truc. Je crois qu'un peu de repos vous fera du bien.

Bah non, tout était prévu. Tirons les conclusions.

Lorsqu'un programme est lancé dans une console, l'interpréteur de commande cherche cette commande dans un certain nombre de répertoires.
S'il ne trouve pas la commande dans ces répertoires, il annonce qu'elle est introuvable.

Quels sont les répertoires visités? Ceux qui figurent dans une variable système nommée $PATH

Dans une console, frappe la commande suivante, en respectant les majuscules et les minuscules

~$ echo $PATH

Observe le résultat. Tu devrais obtenir quelque chose de semblable à:

~$ /home/toto/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games

qui indique les répertoires par défaut, séparés par un signe " : ".
/home/toto/bin (si tu t'appelles "toto")
/usr/local/sbin
/usr/local/bin
...

Ton répertoire personnel (sans doute /home/toto si tu t'appelles "toto") ne figure pas dans la liste.

Dans la console, frappe la commande:

~$ ./input.py

où la notation " ./ " désigne le répertoire actuellement actif. Là où se trouve le programme input.py

Observe le résultat

toto@info17:~$ ./input.py
bash: ./input.py: Permission non accordée

Caramba! Encore raté!! Vous n'en avez pas encore assez d'être ridicule?

Tout est toujours sous contrôle. En fait, personne n'a encore reçu l'autorisation d'exécuter ce programme. Mais nous progressons.

Dans une console, frappe la commande

~$ ls -l

Parmi les résultas, observe une ligne de type suivant (le nom "toto" est remplacé par le tien) et les couleurs n'apparaissent pas comme ci-dessous:

-rw-r--r-- 1 toto root 141 2008-06-05 15:59 input.py

le propriétaire du fichier peut le lire et l'écrire (rw - read, write)
les membres de son groupe peuvent le lire (r - read)
toute autre personne peut le lire (r - read)

Nous allons rendre le programme exécutable par le propriétaire, c'est-à-dire l'utilisateur, c'est-à-dire toi-même.

Frappe la commande

~$ chmod u+x input.py

afin de rendre l'utilisateur (u) capable d'exécuter (+x) le programme.

~$ ls -l

-rwxr--r-- 1 toto root 141 2008-06-05 15:59 input.py

Le programme est exécutable, mais seulement par son propriétaire: toi-même.

~$ ./input.py

Hé mais, ça marche!!

Bien sûr. Et plus fort encore: cela fonctionne aussi si l'on supprime l'extension .py du fichier. On peut alors lancer la commande sans même savoir qu'il s'agit d'un programme écrit en Python.

Modifie et exécute tes autres programmes déjà écrits.
Renomme temporairement l'un ou l'autre d'entre-eux en supprimant l'extension .py du nom du fichier. Vérifie qu'il est toujours exécuté.

L'extension .py devrait être laissée afin de caractériser le programme aux yeux des humains. Mais l'interpréteur de commandes n'en a plus besoin.

La fonction input()

Tout à fait entre nous, je ne trouve quand même pas terrible l'idée de devoir modifier le texte d'un programme quand je dois modifier les données.

Voilà qui justifie parfaitement l'introduction de cette petite fonction simple mais bien utile: input ().

Recopie le texte du programme suivant dans l'éditeur de textes:

longueur = input ("Quelle est la longueur? ")
largeur = input ("Quelle est la largeur? ")

surface = longueur * largeur
perimetre = 2 * (longueur + largeur)

print "SURFACE = ", surface
print "PERIMETRE = ", perimetre

Enregistre le document sous le nom input.py.
Exécute le programme.

La fonction input() demande un argument (qui peut être vide) qui est de type chaîne de caractère.

Elle attend que l'utilisateur frappe quelque chose au clavier.

Elle renvoie une valeur de type correspondant à ce qui a été frappé au clavier.

En utilisant la fonction input(), revois chacun des programmes précédents (parallelepipede.py,disque.py, TVA.py et MRU.py) afin de le rendre interactif.

Résous chacun des exercices suivants:

1. Une entreprise européenne réalise des affaires avec des partenaires anglais et américains. Afin de convertir ses prix en dollars et en livres sterling, elle souhaite disposer d'un programme convertisseur. Etablis ce programme. Cherche le cours du dollar et de la livre.

Enregistre le programme dans un fichier nommé conversion.py

2. Un programme interactif avec l'utilisateur doit calculer l'altitude et la vitesse d'un objet lâché en chute libre.
L'utlisateur sera invité à fournir successivement l'altitude initiale et le temps de chute après lequel il faut calculer altitude et vitesse.
Dans une deuxième version du programme, ajoute une vitesse initiale verticale fournie par l'utilisateur.
Le programme est enregistré sous le nom chuteLibre.py.

3. L'organisateur d'une course automobile sur circuit fermé d'une longueur de 4,6 km souhaite tenir les spectateurs régulièrement informés des performances réalisées par les différents concurrents. A cet effet, il pose le problème suivant : Étant donné le temps mis par un concurrent pour effectuer un tour du circuit (temps détaillé en minutes, secondes et centièmes de secondes), il souhaite connaître instantanément la vitesse (exprimée en km/h) à laquelle le concurrent a parcouru un tour du circuit.

Enregistre le programme dans un fichier nommé automobile.py