Cryptanalyse du chiffrement mono-alphabétique

Comment analyser ça ?
Comment décrypter ça ?

Le chiffrement mono-alphabétique est utilisé durant plusieurs siècles et est considéré par plusieurs états et nations comme plutôt sûr. Nous avons vu que les premiers à décrypter efficacement sont les Arabes dès 800.

L’exercice que nous allons faire sera de décrypter un texte chiffré par une clé de César avec décalage de l’alphabet – mais ne dites rien. C’est à dire un mono-alphabet construit avec une phrase clé sans doublon de lettre puis un décalage de l’alphabet de quelques lettres.

Le message chiffré

OLHJ KYL XZYYL HPJKIJPZY OI HOGPXL 
WIPH AZKH HIALR WZP QL YL OGZPH DIH FKPV E IPJ BL XZYYLH ZK BL WIKAIPHLH HPJKIJPZYH WZP HP QL BLAIPH GLHKWLG WI APL IKQZKGBCKP IALO AZKH QL BPGIPH FKL OLHJ BIXZGB BLH GLYOZYJGLH BLH NLYH FKP WZYJ JLYBK VI WIPY DLKJLJGL I KY WZWLYJ ZK QL YL DZKAIPH DIH ZK QLJIPH HLKV OCLR WZP LJ OLHJ IHHLR OKGPLKT BL HL BPGL FKL VLH CIHIGBH VLH GLYOZYJGLH MZGNLYJ KYL BLHJPYLL DIGOL FKL FKIYB ZY I VL NZKJ BL VI OCZHL FKIYB ZY I VL NZKJ BL VI OCZHL XPLY MIPJL VL XLIK NLHJL DIGMZPH ZY YL JGZKAL DIH VPYJLGVZOKJLKG LY MIOL QL BPGIPH VL WPGZPG FKP AZKH IPBL I IAIYOLG 
IVZGH OL YLHJ DIH WZY OIH OZWWL QL BPHIPH VI DKPHFKL WZP IK OZYJGIPGL QIP DK LJ QL BPH WLGOP I VI APL QL VKP BPH WLGOP QL OCIYJL VI APL QL BIYHL VI APL QL YL HKPH FKIWZKG LJ MPYIVLWLYJ FKIYB XLIKOZKD BL NLYH IKQZKGBCKP WL BPHLYJ WIPH OZWWLYJ MIPHJK DZKG IAZPG OLJJL CKWIYPJL LC XPLY QL VLKG GLDZYBH JGLH HPWDVLWLYJ QL VLKG BPH   OLHJ OL NZKJ BL VIWZKG  OL NZKJ BZYO FKP WI DZKHHL IKQZKGBCKP I LYJGLDGLYBGL KYL OZYHJGKOJPZY WLOIYPFKL WIPH BLWIPY FKP HIPJ DLKJLJGL HPWDVLWLYJ I WL WLJJGL IK HLGAPOL BL VI OZWWKYIKJL I MIPGL VL BZY VL BZY BL HZP

Note : Pour plus de facilité, nous avons conservé les espaces. Néanmoins, les ponctuations ont été retirées.

La méthodologie du décryptage

Pour décrypter le message, il va nous falloir analyser la fréquence d’apparition des lettres, des digrammes et des trigrammes. Ensuite, tout est affaire de substitution et de tâtonnement pour les cas difficiles.

Remarque : Pour mieux visualiser la cryptanalyse et les propositions, les lettres chiffrées seront en majuscules et les lettres du message d’origine seront en minuscules.

Première analyse

La fréquence des lettres

Pour rappel, l’analyse des fréquences donne une répartition comme suit :

Lettres usuelles triées par ordre décroissant de fréquence

Après analyse de fréquence des lettres chiffrées, voici la correspondance que nous pouvons voir apparaître :

Correspondance entre la fréquence chiffrée et usuelle

La première évidence qui en ressort est l’utilisation du L chiffré correspondant probablement à e.

On remarque aussi que les I, H, P et K chiffrent, les lettres s, a, i ou t.
De la même manière Y, Z, J et G chiffrant en n, r, u ou l.
Puis B, W, O, V chiffrant o, d, c ou p.
A noter que ces paquets de lettres ne sont pas respectives mais sont des lots à associer.

Et c’est à nous d’en déterminer l’ordre. Pour cela, l’aide des fréquences des digrammes et trigrammes peuvent nous aider.

La fréquence des digrammes

Pour ce qui est de la fréquence des digrammes, aucun digramme n’émerge avec la correspondance L = e. Le couple de digrammes les plus proche, prenant L = e pour acquis, serait an et ai. Ceci associe Z = a. Malheureusement, ce couple n’étant pas haut dans les digrammes usuelles, il est fortement probable que Z ne soit pas la lettre a chiffrée.

Correspondance des fréquences des digrammes

Si l’on s’attarde sur les digrammes ZK et ZY, on pourrait les associer aux digrammes usuels es et en, sans tenir compte de L = e. De plus, si l’on étudie cette liste de digrammes, on ne voit clairement pas émerger d’associations de lettres.

Analyse fréquentielle des lettres des premiers digrammes

Ce n’est donc pas les digrammes qui nous permettrons d’avancer.

La fréquence des trigrammes

Correspondance des fréquences des trigrammes
On peut identifier :
- le premier trigramme IPH comme étant le trigramme ait ou ais et penser que le texte est à imparfait - d'où la forte quantité de IPH. Ceci associe I = a et P = i
- le deuxième et troisième trigrammes LYJ et LHJ comme étant les trigrammes ent et est, validant la correspondance entre le L et le e. 
Remarque : Ceci associe J = t et par extension le H de IPH à s

Le choix L = e semble un bon point de départ pour déterminer la suite. Mettons cependant une alerte sur cette hypothèse, car si l’égalité est fausse, il faudra revenir à ce point de départ pour tout recommencer.

Identification des premières lettres

Pour une première identification de lettre, nous avons comme possibilité L = e ; I = a ; P = i ; J = t ; H = s et Y = n. Sur la même lancée, on peut continuer à identifier, grâce à JGL = tGe, la lettre chiffrée G = r pour que la première correspondance possible t_e fonctionne.

Voici l'alphabet chiffrée obtenu pour cette première identification
abcdefghijklmnopqrstuvwxyz
I---L---P----Y---GHJ------

Le message modifié en conséquence donne :
Oest Kne XZnne sitKatiZn Oa sOriXe 
Wais AZKs saAeR WZi Qe ne OrZis Das FKiV E ait Be XZnnes ZK Be WaKAaises sitKatiZns WZi si Qe BeAais resKWer Wa Aie aKQZKrBCKi aAeO AZKs Qe Birais FKe Oest BaXZrB Bes renOZntres Bes Nens FKi WZnt tenBK Va Wain DeKtetre a Kn WZWent ZK Qe ne DZKAais Das ZK Qetais seKV OCeR WZi et Oest asseR OKrieKT Be se Bire FKe Ves CasarBs Ves renOZntres MZrNent Kne Bestinee DarOe FKe FKanB Zn a Ve NZKt Be Va OCZse FKanB Zn a Ve NZKt Be Va OCZse Xien Maite Ve XeaK Neste DarMZis Zn ne trZKAe Das VinterVZOKteKr en MaOe Qe Birais Ve WirZir FKi AZKs aiBe a aAanOer 
aVZrs Oe nest Das WZn Oas OZWWe Qe Bisais Va DKisFKe WZi aK OZntraire Qai DK et Qe Bis WerOi a Va Aie Qe VKi Bis WerOi Qe OCante Va Aie Qe Banse Va Aie Qe ne sKis FKaWZKr et MinaVeWent FKanB XeaKOZKD Be Nens aKQZKrBCKi We Bisent   Wais OZWWent MaistK DZKr aAZir Oette CKWanite   eC Xien Qe VeKr reDZnBs tres siWDVeWent Qe VeKr Bis   Oest Oe NZKt Be VaWZKr  Oe NZKt BZnO FKi Wa DZKsse aKQZKrBCKi a entreDrenBre Kne OZnstrKOtiZn WeOaniFKe Wais BeWain FKi sait  DeKtetre siWDVeWent a We Wettre aK serAiOe Be Va OZWWKnaKte a Maire Ve BZn Ve BZn Be sZi

Deuxième étape

On remarque à présent que certains mots commencent à être identifiables.

sitKatiZn pour situation ce qui donne K = u et Z = o
XZnne en Xonne pour bonne, conne, donne
sOriXe pourrait être :
- sOribe soit scribe, seul mot possible
- sOrice ne donnant rien
- sOride ne donnant rien
Ainsi X = b et O = c

Avec 4 lettres de plus, nous obtenons :

abcdefghijklmnopqrstuvwxyz
IXO-L---P----YZ--GHJK-----

Le message donne :
cest une bonne situation ca scribe 
Wais Aous saAeR Woi Qe ne crois Das FuiV E ait Be bonnes ou Be WauAaises situations Woi si Qe BeAais resuWer Wa Aie auQourBCui aAec Aous Qe Birais Fue cest BaborB Bes rencontres Bes Nens Fui Wont tenBu Va Wain Deutetre a un WoWent ou Qe ne DouAais Das ou Qetais seuV cCeR Woi et cest asseR curieuT Be se Bire Fue Ves CasarBs Ves rencontres MorNent une Bestinee Darce Fue FuanB on a Ve Nout Be Va cCose FuanB on a Ve Nout Be Va cCose bien Maite Ve beau Neste DarMois on ne trouAe Das VinterVocuteur en Mace Qe Birais Ve Wiroir Fui Aous aiBe a aAancer 
aVors ce nest Das Won cas coWWe Qe Bisais Va DuisFue Woi au contraire Qai Du et Qe Bis Werci a Va Aie Qe Vui Bis Werci Qe cCante Va Aie Qe Banse Va Aie Qe ne suis FuaWour et MinaVeWent FuanB beaucouD Be Nens auQourBCui We Bisent   Wais coWWent Maistu Dour aAoir cette CuWanite   eC bien Qe Veur reDonBs tres siWDVeWent Qe Veur Bis   cest ce Nout Be VaWour  ce Nout Bonc Fui Wa Dousse auQourBCui a entreDrenBre une construction WecaniFue Wais BeWain Fui sait  Deutetre siWDVeWent a We Wettre au serAice Be Va coWWunaute a Maire Ve Bon Ve Bon Be soi

Troisième étape

A partir de maintenant, nous voyons bien que les premiers choix sont correctes. Un texte sans ponctuation apparaît. En continuant sur notre lancée – en supposant que nous ne connaissons pas le contenu intégrale du message, nous avons :

Be bonnes ou Be WauAaises situations devrait être de bonnes ou de mauvaise situations ajoutant B = d ; W = m et A = v

auQourBCui aAec Aous Qe Birais Fue cest BaborB transformé avec les choix précédents :
auQourdCui avec vous Qe dirais Fue cest dabord donnerais aujourd'hui avec vous je dirais que c'est d'abord avec Q = j ; C = h et F = q

abcdefghijklmnopqrstuvwxyz
IXOBL--CPQ--WYZ-FGHJKA----

Le message modifié donne :
cest une bonne situation ca scribe 
mais vous saveR moi je ne crois Das quiV E ait de bonnes ou de mauvaises situations moi si je devais resumer ma vie aujourdhui avec vous je dirais que cest dabord des rencontres des Nens qui mont tendu Va main Deutetre a un moment ou je ne Douvais Das ou jetais seuV cheR moi et cest asseR curieuT de se dire que Ves hasards Ves rencontres MorNent une destinee Darce que quand on a Ve Nout de Va chose quand on a Ve Nout de Va chose bien Maite Ve beau Neste DarMois on ne trouve Das VinterVocuteur en Mace je dirais Ve miroir qui vous aide a avancer 
aVors ce nest Das mon cas comme je disais Va Duisque moi au contraire jai Du et je dis merci a Va vie je Vui dis merci je chante Va vie je danse Va vie je ne suis quamour et MinaVement quand beaucouD de Nens aujourdhui me disent   mais comment Maistu Dour avoir cette humanite   eh bien je Veur reDonds tres simDVement je Veur dis   cest ce Nout de Vamour  ce Nout donc qui ma Dousse aujourdhui a entreDrendre une construction mecanique mais demain qui sait  Deutetre simDVement a me mettre au service de Va communaute a Maire Ve don Ve don de soi

Solution & Conclusion

Très vite, nous obtenons l’alphabet chiffré IXOBLMNCPQUVWYZDFGHJKASTER. La suite de lettre UVWYZ correspond au complément d’une phrase clé et DFGHJK le complément du début d’alphabet. Ainsi ASTERIXOBLMNC doit être la phrase clé. C’est donc sur un décalage de 5 du Chiffre de César ASTERIXOBLMNCPQUVWYZDFGHJK, avec la phrase clé Astérix et Obélix : Mission Cléopâtre, qui nous permet de chiffrer et de déchiffrer le message.

Trouvé

– C’est une bonne situation, ça, scribe ?
– Mais vous savez, moi je ne crois pas qu’il y ait de bonnes ou de mauvaises situations. Moi, si je devais résumer ma vie, aujourd’hui avec vous, je dirais que c’est d´abord des rencontres, des gens qui m’ont tendu la main peut-être à un moment où je ne pouvais pas, où j’étais seul chez moi. Et c’est assez curieux de se dire que les hasards, les rencontres forgent une destinée. Parce que quand on a le goût de la chose, quand on a le goût de la chose bien faite, le beau geste, parfois on ne trouve pas l’interlocuteur en face, je dirais le miroir qui vous aide à avancer.
Alors ce n’est pas mon cas, comme je disais là, puisque moi au contraire j’ai pu, et je dis merci à la vie, je lui dis merci, je chante la vie, je danse la vie, je ne suis qu’amour. Et finalement quand beaucoup de gens aujourd’hui me disent : « Mais comment fais-tu pour avoir cette humanité ? » eh bien je leur réponds très simplement, je leur dis : « C’est ce goût de l’amour », ce goût donc, qui m’a poussé aujourd’hui à entreprendre une construction mécanique, mais demain qui sait ? Peut-être simplement à me mettre au service de la communauté, à faire le don, le don de soi.

Discussion entre Panoramix et Otis – Astérix et Obélix : Mission Cléopâtre d’Alain CHABAT (2002)

Pour le décryptage d’un texte comme celui-ci, être linguiste est un plus. C’est d’ailleurs pour cela que jusqu’au début de la Seconde Guerre Mondiale, les bureaux du Chiffre possèdent un grand nombre de linguistes polyglottes.

Annexe – Le texte sans espace

Dans cet exemple, j’ai délibérément choisis de conservé les espaces. Cela entraîne une incohérence sur les digrammes. Voici l’analyse des digrammes lorsque l’on enlève les espaces.

Correspondances des digrammes avec le texte sans espace
Analyse fréquentielle des lettres des premiers digrammes

Il apparaît maintenant clairement que L = e est le meilleur choix de départ pour la cryptanalyse.

Laisse moi un commentaire !

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *