Différents parfums d'infinis

Section 1.2 Différents parfums d'infinis

Avant d'unifier les probabilités finies, discrètes et continues, essayons de comprendre ce qui nous avait donné l'impression, au départ, qu'elles étaient différentes.

La différence tient à l'ensemble des possibles qu'on considère: est-ce qu'il y a un nombre fini de possibilités, comme aux dés, ou infini, comme pour le numéro du premier succès ou l'heure d'arrivée ?

On pourrait croire que c'est là la distinction principale: fini ou infini, mais en fait, on utilise les mêmes techniques pour les probabilités finies et discrètes ¹, d'une part, et d'autre part les probabilités "continues" ².

\(\leadsto\) Comment rendre compte proprement de ce qui sépare les deux ?

Qu'est-ce que l'infini ?³

Subsection 1.2.1 Ensembles finis, dénombrables, et non dénombrables

Tous les ensembles non finis sont infinis, mais certains sont plus infinis que d'autres
―George Cantorwell, La Ferme des Cardinaux

Supposons que je vous donne deux grands sacs de pâtes et que je vous demande de vérifier que le sac de gauche contient autant de strozzapreti que celui de droite contien de fusilli⁴.

Une façon de s'y prendre serait de compter combien il y a de pâtes dans le premier sac, combien il y en a dans le deuxième, et de vérifier qu'on tombe sur le même nombre. Mais dans ce cas, vous serez envahi d'un doute: et si vous vous étiez trompé en comptant le premier ?

Pour échapper aux affres du doute, une autre solution est de sortir un strozzapreti ⁵ du premier sac, un fusilli ⁶ du deuxième en même temps, et de continuer jusqu'à ce qu'un des sacs soit vide. Si les deux sacs sont vides au même moment, ils ont le même nombre de pâtes.

Autrement dit, si à chaque strozzapreti, on peut faire correspondre un, et un seul, fusilli, sans qu'il reste de fusilli célibataire.

Autrement autrement dit, si on trouve une bijection entre le sac de fusillis et le sac de strazzopreti.

\(\leadsto\) C'est en partant de cette idée qu'on va pouvoir comparer des tailles d'ensembles.

Définition 1.2.2. Cardinal, ensemble fini, ensemble infini.

On dit que deux ensembles \(X\) et \(Y\) ont le même cardinal (ou le même nombre d'éléments) s'il existe une bijection \(f:X\rightarrow Y\text{.}\)
On dit qu'un ensemble \(X\) est fini de cardinal \(n\), \(n\in\N^*\text{,}\) s'il existe une bijection \(f:X\rightarrow \{1,2,\ldots,n\}\text{.}\) ⁷

Dans ce cas, un seul entier \(n\) convient: on l'appelle cardinal de \(X\), noté \(\Card(X)\text{.}\)
On dit que \(X\) est fini s'il existe \(n\in\N\) tel que \(X\) est fini de cardinal \(n\text{.}\)
On dit que \(X\) est infini si...il n'est pas fini. Oui.

Remarque 1.2.3.

Plus généralement, s'il existe une application injective

\begin{equation*} \varphi: Y\rightarrow X \end{equation*}

alors on dira que \(\Card(Y)\leq \Card(X)\text{.}\)

Le théorème de Cantor-Bernstein ⁸ affirme que

S'il existe une application injective \(X\rightarrow Y\) et une application injective \(Y\rightarrow X\text{,}\) alors il existe une bijection entre \(X\) et \(Y\)

Donc

\begin{equation*} (\Card(X)\leq \Card(Y) \text{ et } \Card(Y)\leq \Card(X) ) \Rightarrow \Card(X)= \Card(Y) \end{equation*}

ce qui semble raisonnable.

Une autre conséquence raisonnable: si \(Y\subset X\text{,}\) alors l'inclusion

\begin{equation*} \iota:y\in Y\mapsto y \in X \end{equation*}

est injective, et donc on a

\begin{equation*} \Card(Y)\leq \Card(X). \end{equation*}

Passons maintenant aux conséquences déraisonnables.

On peut avoir l'impression que les ensembles infinis sont simplement des ensembles finis qui continuent jusqu'à l'horizon, et dont l'accolade fermante se perd simplement dans une brume de "...".

Mais ces trois innocents petits points cachent en fait des comportements étranges: par exemple, les ensembles infinis sont caractérisés par leur capacité à contenir un sous-ensemble de même taille que le total.

Proposition 1.2.4.

Un ensemble \(X\) est infini si et seulement s'il existe \(Y\in X\text{,}\) \(Y\neq X\text{,}\) tel que \(Y\) et \(X\) sont en bijection.

Exercice 1.2.1. Exemples.

Georg Cantor ⁹ fut l'un des pionniers de la théorie des ensembles et étudia avec particulièrement d'attention les ensembles infinis.

C'est à lui qu'on doit l'idée de la bijection pour comparer les tailles d'ensembles, ainsi que la formalisation des notions de fini et d'infini, et la caractérisation de ces derniers par la bijection avec un sous-ensemble.

Ce résultat avait déjà été noté par Bernhard Bolzano dans ses "Paradoxes de l'infini", publié à titre posthume en 1851, et (bien) avant cela, par Thâbit bin Qurrâ al-Harrânî ¹⁰.

Il fut toutefois l'un des premiers à ne pas se décourager devant cette bizarrerie, bien qu'i soit tombé sur un exemple particulièrement contre-intuitif: il parvint à trouver une bijection entre un carré et un de ses côtés, résultat qui lui sembla si invraisemblable qu'il appella à l'aide son ami et collègue Richard Dedekind en juin 1877:

Ce que je crois avoir démontré est pour moi si inattendu, si nouveau, que je ne pourrais pas arriver à une certaine tranquillité d'esprit, avant que je n'ai reçu, très honoré ami, votre jugement sur son exactitude. Tant que vous ne l'aurez pas approuvé, je ne pourrais que dire:

"Je le vois, mais je ne le crois pas"

(a)

Trouver une bijection entre \(\N\) et \(\N^*\text{.}\)

Et une bijection entre \(\R\) et \(\R^*_+\text{.}\)

Spoiler.

(b)

Trouver une bijection entre \(\N\) et l'ensemble des entiers pairs \(2\N\text{.}\)

Et une bijection entre \(\rbb 0, 1\lbb\) et \(\rbb 0, 2\lbb\text{.}\)

Spoiler.

(c)

Trouver une bijection entre \(\left[\ -\dfrac{\pi}{2}, \dfrac{\pi}{2} \,\right]\,\) et \(\Rb=\R\cup\{\pm\infty\}\text{.}\)

D'autres bizarreries de l'infini:

Les ensembles finis, au contraire, ont un rapport tout à fait sain avec leurs sous-ensembles:

si \(X\) est fini, alors pour tout \(Y\in\P(X)\setminus\{X\}\text{,}\) il n'existe pas de bijection \(\phi : X \rightarrow Y\text{.}\)

Exercice 1.2.2. Preuve.

(a)

Montrer par récurrence que pour tout \(n\in\N^*\text{,}\) quel que soit \(A\subset E_n=\{1,2,...,n\}\) tel que \(A\neq E_n\text{,}\) il n'existe pas de bijection \(\phi : E_n \rightarrow A\text{.}\)

Indice 1.

Comme souvent avec les preuves de non-existence, on peut le faire par l'absurde: on suppose qu'il existe bien \(A\subset E_{n+1}\) tel que \(A\neq E_{n+1}\text{,}\) et une bijection \(\phi:E_{n+1}\rightarrow A\text{,}\) et on en déduit une bijection entre \(E_n\) et un sous-ensemble \(A'\) strictement inclus dans \(E_n\text{,}\) ce qui contredira l'hypothèse de réccurence.

Indice 2.

Dans le raisonnement par l'absurde, il peut être pratique de séparer les cas où \(A\subset E_n\) et \(n+1 \in A\text{.}\)

Spoiler.

(b)

En déduire la démonstration de la proposition dans le cas générak d'un ensemble fini.

Indice.

Pour le cas général: la définition des ensembles finis aide à se ramener au cas précédent.

Spoiler.

Corollaire 1.2.5.

Si \(X\subset E\) et \(X\) est infini, alors \(E\) est infini.

Petit Exercice 1.2.6.

Spoiler.

Et un dernier critère d'infinitude pour la route :

Proposition 1.2.7.

Un ensemble \(E\) est infini ssi il existe une application injective \(\N\rightarrow E\text{.}\)

Petit Exercice 1.2.8.

Indice.

\(\boxed{\Rightarrow}\) Si \(E\) est infini, et qu'on pioche des éléments dans \(E\text{,}\) on ne devrait jamais tomber à cours de strozzapreti.

\(\boxed{\Rightarrow}\text{:}\) Montrer que dans ce cas, \(f(\N)\) est forcément infini et utiliser le Corollaire 1.2.5.

Spoiler.

Les ensembles infinis appartiennent donc à une espèce complètement différentes des ensembles finis. Et la notation \(\Card(X)\) donne envie d'attribuer, à tous les ensembles infinis, le cardinal

\begin{equation*} \Card(X)=+\infty \end{equation*}

et donc, on a l'impression que tous les ensembles infinis ont le même cardinal.

Mais pas au sens de la Définition 1.2.2 !

Exercice 1.2.3. Argument diagonal de Cantor.

Montrons que, bien qu'ils soient tous les deux infinis, les ensembles \(\R\) et \(\N\) ne sont pas ne bijection, et donc n'ont pas le même cardinal (au sens de la Définition 1.2.2).

Ce raisonnement est l'un des héritages les plus connus de Cantor: non seulement parce qu'il est lumineux, mais aussi parce que cette idée permet de démontrer l'existence de contre-exemples sans avoir à les expliciter. Et c'est pour cela que c'est la pierre angulaire de toutes sortes de résultats de logique abstraite du XXème siècle: le paradoxe de Russell ¹¹, les théorèmes d’incomplétude de Gödel ¹², la construction d’ensembles indécidables par Turing, et les théorèmes de hiérarchie en théorie de la complexité.

Il avait déjà démontré, en 1873, que l'ensemble des réels n'était pas en bijection avec \(\N\text{,}\) via un raisonnement un peu plus compliqué, faisant intervenir la convergence des suites de Cauchy dans \(\R\text{:}\) voir ici ¹³ pour les détails de ce raisonnement, de la main de George himself.

(a)

Montrer que \(\R\) et \(\N\) sont infinis.

Spoiler.

(b)

Supposons, par l'absurde, qu'il existe une application bijective

\begin{equation*} \varphi: \N \rightarrow \R \end{equation*}

On note \(x_n=\varphi(n)\) pour tout \(i\in \N\text{,}\) et, pour tout \(i\in \N^*\text{,}\) pour tout \(n\in\N\text{,}\) on note \(a_{i,n}\in\{0,1,...9\}\) la \(i\)-ème décimale de \(x_n\text{:}\)

\begin{equation*} x_n=E(x_n)+\sum_{i=1}^{+\infty}\frac{a_{i,n}}{10^i} \end{equation*}

Construire ledéveloppement décimal d'un réel \(x\) tel que, pour tout \(n\in\N\text{,}\) \(x\neq x_n\text{.}\)

Indice 1.

\begin{equation*} \begin{array}{ccccccc} x_1\amp=\amp N_1,\amp\boxed{a_{1,1}}\amp a_{1,2}\amp...\amp...\\ x_2\amp=\amp N_2,\amp a_{2,1}\amp\boxed{a_{2,2}}\amp a_{2,3}\amp...\\ \amp\vdots\amp\\ x_k\amp=\amp N_k,\amp...\amp a_{k,k-1}\amp\boxed{a_{k,k}}\amp... \end{array} \end{equation*}

Ce raisonnement s'appelle l'argument diagonal de Cantor.

Indice 2.

Noter que, pour chaque \(n\text{,}\) il y a des éléments de \(\{0,1,...9\}\) qui ne sont pas \(a_{n,n}\text{.}\)

Spoiler.

(c)

En déduire que \(\varphi\) n'est pas surjective, et dénoncer la contradiction.

Spoiler.

(d)

Conclure que \(\N\) et \(\R\) n'ont pas le même cardinal.

Spoiler.

Il y a donc au moins deux tailles d'infini: celle de \(\N\) et celle de \(\R\text{.}\) Puisque \(\N\subset \R\text{,}\) on a donc

\begin{equation*} \Card(N)\leq \Card(\R) \end{equation*}

et cette inégalité n'est pas une égalité¹⁴

De là, on a l'impression que l'ensemble des entiers pairs, celui des entiers relatifs, et \(\{x\in\R,\sin(x)=1\}\) sont tous dsans le même sac que \(\N\text{,}\) et d'un autre côté, l'intervalle \(\rbb 67, 819.37 \lbb\text{,}\) le cercle unité dans \(\R^2\) et la droite \(\vect((8,\sqrt{47},-\pi^2))\subset \R^3\) sont dans le même sac que \(\R\)

Ce qui nous amène à leur donner des noms à ces sacs:

Définition 1.2.9. Ensemble dénombrable..

On dit qu'un ensemble \(X\) est dénombrable s'il existe une bijection

\begin{equation*} \varphi: \N\rightarrow X \end{equation*}
On dit qu'un ensemble \(X\) est au plus dénombrable s'il est soit fini, soit dénombrable.
Sinon, on dit qu'un ensemble est...non-dénombrable. Oui.

Remarque 1.2.10.

Soit \(X\) un ensemble dénombrable, on a donc une bijection

\begin{equation*} \varphi:\N\rightarrow X \end{equation*}

Notons, pour chaque \(i\in\N\text{,}\) \(x_i:=\varphi(i)\in X\text{.}\) Alors, comme \(\varphi\) est surjective,

\begin{equation*} X=\varphi(\N)=\{\varphi(1),\varphi(2),\ldots\}=\{x_1,x_2,...\} \end{equation*}

On notera donc souvent directement les ensembles dénombrables sous la forme

\begin{equation*} X=\{x_i, i\in\N\} \end{equation*}

La proposition suivante nous donne un détecteur d'ensembles dénombrables parfois plus reposant que la définition:

Proposition 1.2.11.

Un ensemble \(X\) est dénombrable si et seulement si il est infini et il existe une application surjective \(\N\rightarrow X\text{.}\)
Un ensemble \(X\) est au plus dénombrable si et seulement si il existe une application surjective \(\N\rightarrow X\text{.}\)

Exercice 1.2.4. Preuve.

On doit donc montrer l'équivalence entre

Il existe une bijection \(\N\rightarrow X\)
\(X\) est infini et il existe une surjection \(\N\rightarrow X\text{.}\)

On va procéder, prudemment, par double implication.

(a)

\(\boxed{(i)\Rightarrow(ii)}\text{:}\) On suppose que \((i)\) est vérifiée.

Montrer que s'il existe une bijection \(\varphi:A\rightarrow X\) avec \(A\) un ensemble infini, alors \(E\) est infini.

Indice.

Se rappeler de la Proposition 1.2.4: en l'appliquant à A, utiliser \(\varphi\) pour construire une application \(X\rightarrow X\) injective, mais pas surjective, et en déduire un sous-ensemble \(Y\) de \(X\) avec lequel \(X\) est en bijection.

Spoiler.

(b)

En déduire \((ii)\text{.}\)

Spoiler.

(c)

\(\boxed{(ii)\Rightarrow(i)}\text{:}\) On suppose que \((ii)\) est vérifiée. Soit donc

\begin{equation*} \varphi: \N\rightarrow X \end{equation*}

une application surjective. On note, pour chaque \(n\in\N\)

\begin{equation*} A_n=\{m\in\N, \varphi(m)=\varphi(n)\} \end{equation*}

¹⁵

Montrer que les \(A_n,n\in\N\text{,}\) forment une partition de \(\N\text{.}\)

Spoiler.

(d)

On définit une suite d'entiers \(n_k,k\in\N\) par

\begin{align*} n_0\amp=0 \\ n_1\amp=\min\{n\in\N, n\notin A_{n_0}\}\\ n_2\amp=\min\{n\in\N, n\notin A_{n_0}\cup A_{n_1}\}\\ \amp\vdots\\ n_{k+1}\amp=\min\{n\in\N, n\notin A_{n_0}\cup A_{n_1}\cup...\cup A_{n_{k+1}}\} \end{align*}

Vérifier que \(n_k\) existe pour tout \(k\) et que l'application

\begin{equation*} \psi:k\in\N\mapsto n_k\in\N \end{equation*}

est injective.

Spoiler.

(e)

Montrer que, pour tout \(m\in\N\text{,}\) il existe \(k_m\in\N\) tel que

\begin{equation*} m \in A_{n_{k_m}} \end{equation*}

Spoiler.

(f)

En déduire que l'application

\begin{equation*} k\in\N\mapsto \varphi(n_k) \end{equation*}

est bijective, et conclure.

Spoiler.

(g)

Montrer que si \(X\) est fini, alors il existe une surjection \(\N\rightarrow X\)¹⁶.

En déduire que \(X\) est au plus dénombrable ssi il existe une surjection \(\N\rightarrow X\text{.}\)

Spoiler.

Exercice 1.2.5. Quelques applications générales.

(a)

Soient \(X,Y\) deux ensembles et \(f:X\rightarrow Y\) un application.

Montrer que si \(X\) est au plus dénombrable, alors \(f(X)\) est au plus dénombrable, et trouver un exemple tel que \(f(X)\) est fini.

Et si \(f\) est injective ?

Spoiler.

(b)

Montrer que si \(X\) est dénombrable et \(Y\subset X\text{,}\) alors \(Y\) est au plus dénombrable.

Indice.

Trouver une application \(X\rightarrow Y\) surjective.

Spoiler.

(c)

Montrer qu'un ensemble est infini ssi il contient un sous-ensemble dénombrable.

\(\leadsto\) dans ce sens, les ensembles dénombrables sont les "plus petits" ensembles infinis: un ensemble infini peut être dénombrable, ou plus gros.

Indice.

Se rappeler de la Proposition 1.2.7

Spoiler.

D'après la Proposition 1.2.7, un ensemble est infini ssi il existe une application injective

\begin{equation*} f:\N\mapsto E \end{equation*}

Mais dans ce cas: \(f:\N\rightarrow f(\N)\) est une bijection, donc \(f(\N)\) est dénombrable.

Donc, un ensemble est infini ssi il contient un sous-ensemble dénombrable.

(d)

Unions finies de dénombrables

Soient \(X_1,X_2\) deux ensembles au plus dénombrables. Montrer que \(X_1 \cup X_2\) est au plus dénombrable.

En déduire que si \(X_1,...,X_m\) sont \(m\) ensembles au plus dénombrables, alors \(X_1\,\cup\,...\,\cup\, X_m\) est au plus dénombrable.

Spoiler.

(e)

Produit d'un ensemble dénombrable et d'un ensemble fini.

Soient \(X_1,X_2\) deux ensembles tels que \(X_1\) est fini et \(X_2\) est au plus dénombrables.

Montrer que \(X_1 \times X_2\) est au plus dénombrable.

Spoiler.

Intuitivement, le point commun des ensembles dénombrables, c'est qu'on peut...les dénombrer, c'est à dire les prendre un par un, à la suite.

C'est assez intuitif qu'on peut faire ça avec les entiers, et c'est assez intuitif que ça va être difficile avec l'ensemble \(\rbb 0, 1\lbb\text{:}\) mettons qu'on commence par 0 ...qu'est-ce qu'on prend après ?

Notons qu'on peut aussi bien commencer par 1, ou par \(\frac13\text{,}\) ou par \(\frac{3\pi}{17}\text{:}\) dans notre écriture \(X=\{x_i, i\in\N\}\text{,}\) rien ne dit que les \(x_i\) soient par ordre croissant...et d'ailleurs, rien ne dit qu'il y ait un ordre sur les \(x_i\text{,}\) par exemple si ce sont des points de \(\R^4\text{.}\)

Bon, mais même comme ça, on n'a pas l'impression de pouvoir prendre un par un les éléments de \([0,1].\text{.}\)

Et pour \(\Z\) ? \(\Q\) ? \(\N \times [0,1]\) ?

Exercice 1.2.6. Quelques exemples et applications générales:.

(a)

Montrer que \(\Z\) est dénombrable.

Indice.

En yréfléchissant bien, \(\Z\) ne serait il pas une union de deux dénombrables ?

Spoiler.

(b)

Dénombrabilité de \(\N\times \N\) pour les amateurs d'arithmétique

Montrer que l'application

\begin{equation*} (n,s)\in\N\times \N \mapsto 2^n(2s+1)-1 \end{equation*}

est bijective.

En déduire que \(\N\times \N\) est dénombrable.

Spoiler.

(c)

Dénombrabilité de \(\N\times \N\) pour les amateurs d'itinéraires touristiques

On propose la balade suivante dans \(\N\times \N\text{:}\)

Etape 0: On part de \((0,0)\)
Etape 1: On va un cran vers l'Est en \((1,0)\text{;}\)
Etape 2: On va un cran au Nord-Ouest en \((0,1)\text{;}\)
Etape 3: On redescend en deltaplane jusqu'à \((2,0)\text{;}\)
Etape 4: On va repart au Nord-Ouest en \((1,1)\text{;}\)
Etape 5: et encore un cran au Nord-Ouest en \((0,2)\text{;}\)
Etape 6: On redescend en deltaplane jusqu'à \((3,0)\text{;}\)
et ainsi de suite.

Pour chaque \(i\in \N\text{,}\) on note \(\Phi(i)\in\N\times\N\) les coordonnées de la \(i\)-ème étape.

Déterminer \(\Phi(10)\) et trouver \(i,j\in\N\) tels que \(\Phi(i)=(5,0)\) et \(\Phi(j)=(4,1)\text{.}\)

Donner une formule générale pour \(\Phi(i)\text{.}\)

Spoiler.

(d)

Montrer que \(\Phi:\N \rightarrow \N\times \N\) est surjective, et en déduire que \(\N\times\N\) est dénombrable.

Spoiler.

(e)

Union dénombrable de dénombrables

Soient \(X_1,X_2,....\) une famille dénombrable d'ensembles au plus dénombrables.

Construire une application

\begin{equation*} \N\times \N \rightarrow \bigcup_{n\in\N}X_n \end{equation*}

et en déduire que \(\bigcup_{n\in\N}X_n\) est au plus dénombrable.

Indice.

Pour chaque \(n\in\N\text{,}\) on a donc une bijection \(\phi_n:\N\rightarrow X_n\text{.}\) Considérer

\begin{equation*} (n,k)\mapsto \varphi_n(k) \end{equation*}

Spoiler.

(f)

En déduire que \(\Q\) est dénombrable.

Indice.

On peut trier les rationnels en fonction de leur dénominateur:

\begin{equation*} \Q=\left\{\frac{p}{q},p\in\Z,q\in \N^*\right\}=\bigcup_{n\in\N^*}\left\{\frac{p}{q},p\in\Z\right\} \end{equation*}

Spoiler.

(g)

Supposons que \(X_1,X_2\) soient deux ensembles dénombrables. Construire une application surjective

\begin{equation*} \psi:\N\times \N \rightarrow X_1\times X_2 \end{equation*}

En déduire que \(X_1\times X_2\) est dénombrable.

Indice.

Rappelons qu'on dispose de deux bijections \(\N\rightarrow X_1\text{,}\) \(\N\rightarrow X_2\) et de la Proposition 1.2.11.

Spoiler.

(h)

Produit fini de dénombrables

Soient \(X_1,...,X_m\) \(m\) ensembles au plus dénombrables. Montrer que le produit \(X_1\times...\times X_m\) est au plus dénombrable.

Spoiler.

(i)

En redéduire que \(\Q\) est dénombrable.

Indice.

Trouver une surjection

\begin{equation*} \N^* \times \Z\rightarrow \Q \end{equation*}

Bonus: Est-ce une bijection ?

Spoiler.

Exercice 1.2.7. Nombres transcendants.

C'est encore à Cantor qu'on doit ce raisonnement: après l'avoir fait relire à son ami et mentor Dedekind, il le publia sous le titre "Sur une propriété de la collection des nombres algébriques" dans le prestigieux Journal de Crelle en 1873.

C'est aussi dans cet article que Cantor démontre pour la première fois que \(\R\) n'est pas dénombrable. Ce résultat est sans aucun doute le plus novateur de l'article publié, cependant, le titre met l'accent sur un résultat bien moins marquant, la dénombrabilité des nombres algébriques.

Ce choix vise peut-être à ne pas trop énerver Leopold Kronecker, un critique virulent des études sur l'infini de Cantor, qu'il accusait carrément de "charlatanisme" et de "corrompre la jeunesse". L'ennui, c'est que Kronecker qui occupait alors une place influente au Journal de Crelle et au comité de recrutement du département de mathématiques de Berlin, dont il bloquait l'accès à ce pauvre George.

Ce rejet violent ne fut pas la seule cause du déclin de la production mathématiques de Cantor, mais ça n'aida pas: il traversa par la suite de fréquents épisodes dépressifs, et son oeuvre se tourna vers les implications théologiques de ses travaux (il pensa identifier à Dieu la classe infinie de tous les cardinaux), et vers la littérature (il écrivit deux articles visant à démontrer que les pièces de Shakespeare ont en fait été écrites par Francis Bacon).

On dit qu'un nombre réel est algébrique s'il est la solution d'une équation polynômiale à coefficients entiers. Si un nombre réel n'est pas algébrique, on dit qu'il est transcendant.

On va montrer que l'ensemble de tous les nombres algébriques est dénombrable.

(a)

On note

\begin{equation*} \mathcal A=\{x\in\R, \exists\, P\in\Z[X] \text{ t.q. } P(x)=0\} \end{equation*}

l'ensemble des nombres réels algébriques. Montrer que \(\Q\subset\mathcal A\text{.}\)

Montrer que, quoi qu'en disent tout un tas de documentaires, le nombre d'or n'est finalement pas si transcendant. Trouver un autre irrationnel \(x\in\R\) tel que \(x\in \mathcal A\text{.}\)

Prendre une minute pour se demander s'il existe des réels qui ne sont pas dans \(\mathcal A\text{,}\) et réfléchir à comment on pourrait bien démontrer une chose pareille.

Spoiler.

(b)

On note, pour chaque \(n\in\N\text{,}\)

\begin{align*} A_n=\{x\in\R \,|\, \amp \exists d\leq n,\exists a_0,\ldots,a_d\in\{-n,...,0,...,n\} \\ \amp\text{ t.q. } a_0+a_1x+...+a_dx^d =0\} \end{align*}

Exprimer \(\mathcal A\) en fonction des \(A_n,n\in\N\text{.}\)

Spoiler.

(c)

Montrer que, pour tout \(n\in\N\text{,}\) \(A_n\) est fini.

En déduire que \(\mathcal A\) est dénombrable.

Spoiler.

(d)

Montrer qu'il existe des nombres transcendants.

Spoiler.

(e)

La preuve de Cantor ne nous dit cependant pas où trouver ces nombres. Et c'est en fait assez technique de le faire sur un exemple particulier:

Exercice 1.2.8. Discontinuités des fonctions croissantes.

Soit \(f: \R\rightarrow \R\) une fonction croissante. Alors \(f\) peut être discontinue (c'est le cas par exemple de la fonction partie entière), mais pas trop: on va montrer que l'ensemble des points où \(f\) est discontinue est au plus dénombrable.

(a)

Montrer que l'application "saut"

\begin{equation*} S_f:a\in\R\mapsto \lim_{\substack{x\rightarrow a\\ x \gt a}}f(x) - \lim_{\substack{x\rightarrow a\\ x \lt a}}f(x) \end{equation*}

est définie sur \(\R\) et positive.

On notera

\begin{equation*} f(a^+)=\lim_{\substack{x\rightarrow a\\ x \gt a}}f(x), f(a^-)=\lim_{\substack{x\rightarrow a\\ x \lt a}}f(x) \end{equation*}

Quel est le rapport avec notre problème ?

Indice.

il s'agit de montrer que les limites à gauche et à droite de \(f\) existent en tout point. Plus précisément, on a

\begin{equation*} \lim_{\substack{x\rightarrow a\\ x \gt a}}f(x) = \inf\{f(x),x\gt a\} \end{equation*}

\begin{equation*} \lim_{\substack{x\rightarrow a\\ x \lt a}}f(x) = \sup\{f(x),x\lt a\} \end{equation*}

Par rapport au titre de l'exercice: en quels point a-t-on \(S_f(a)\neq 0\) ?

Spoiler.

(b)

Pour tout \(n\in\N^*\text{,}\) on note

\begin{equation*} D_n=\{t\in\rbb -n,n\lbb,\ S_f(t) \geq \frac1n\} \end{equation*}

Montrer que si \(x_1\lt...\lt x_k\) sont des élément de \(D_n\text{,}\) alors

\begin{equation*} f(n)-f(-n)\geq \sum_{i=0}^k S_f(x_i) \geq \frac{k}{n} \end{equation*}

et en déduire que \(D_n\) est un ensemble fini.

Indice.

Remarquer que dans ce cas,

\begin{equation*} f(x_k^-)-f(x_{k-1}^+) \geq 0 \end{equation*}

Spoiler.

(c)

Décrire l'ensemble des points de discontinuité de \(f\) en fonction des \(A_n,n\in\N\) et conclure.

Spoiler.

On finirait par croire que tout assemblage dénombrable d'ensembles dénombrables est dénombrable; mais en fait, ce n'est pas le cas:

Exercice 1.2.9. Attention aux produits dénombrables : ce sont des traîtres.

On va montrer qu'un produit dénombrable d'ensembles au plus dénombrables n'est pas forcément dénombrable.

Et c'est vite arrivé: on va voir plus précisément que, dès lors qu'on a une famille dénombrables \(E_n,n\in\N\) d'ensembles qui ont chacun au moins deux éléments, alors le produit \(E_1\times E_2\times...\) est non-dénombrable.

Remarque: Les \(E_i\) ne sont pas forcément tous différents.

(a)

Soit donc \(E_1,E_2,...\) une famille dénombrable d'ensembles tels que \(\Card E_i\geq 2\) pour chaque \(i \in \N\text{.}\) On note \(E=E_1\times E_2\times...\) le produit de tous ces ensembles.

Les éléments de \(E\) sont donc des suites \(x=(x_0,x_1,x_2,...)=(x_i)_{i\in\N}\) telles que, pour chaque \(i\text{,}\) \(x_i\in E_i\text{.}\)

Pour chaque \(i\in\N\text{,}\) prenons \(a_i,b_i\in E_i\) deux éléments distincts de \(E_i\text{:}\) \(a_i\neq b_i\text{.}\)

On considère l'application \(\Phi: x=(x_i)_{i\in\N}:E\rightarrow \P(\N)\) défini par:

S'il existe \(i\in\N\) tel que \(x_i\neq a_i,b_i\) alors \(\Phi(x)=\emptyset\text{.}\)
Sinon, si pour tout \(i\in\N\text{,}\) \(x_i\) est égal soit à \(a_i\) soit à \(b_i\text{,}\) on pose

\begin{equation*} \Phi(x)=\{n\in\N,x_n=a_n\} \end{equation*}

Montrer que \(\Phi\) est surjective.

Spoiler.

(b)

En déduire que, si \(E\) était dénombrable, on aurait une application surjective \(\N\rightarrow \P(\N)\text{.}\)

Plus qu'à voir pourquoi c'est un problème.

Spoiler.

(c)

Et ce n'est pas un problème que pour \(\N\text{:}\) quel que soit l'ensemble \(E\text{,}\) il n'existe pas d'application surjective \(E\rightarrow \P(E)\)¹⁸

Supposons par l'absurde qu'il en existe une, et appelons-la \(S\text{.}\)

On note

\begin{equation*} A=\{x\in E,x\notin S(x)\} \end{equation*}

¹⁹

Justifier qu'il existe \(x_A\in X\) tel que \(S(x_A)=A\text{.}\)

Spoiler.

(d)

Est-ce que \(x_A\in A\) ?

En déduire qu'on a effectivement un problème, et que \(S\) n'existe pas.

Spoiler.

(e)

Conclure que \(E_1\times E_2\times...\) n'est pas dénombrable.

Spoiler.

(f)

Application: \(\rbb 0, 1\rbb\) n'est pas dénombrable

On considère l'ensemble \(E=\{0,1,2,...,9\}^\N\setminus\{(9,9,9....\}\) des suites d'entiers entre 0 et 9, excluant la suite constante égale à 9. Justifier que \(E\) n'est pas dénombrable.

Spoiler.

(g)

Montrer que l'application

\begin{equation*} \Psi:x=(x_i)_{i\in\N}\in E \mapsto \sum_{i=0}^{+\infty} \frac{x_i}{10^{i+1}} \end{equation*}

est une application surjective \(E \rightarrow \rbb 0,1\rbb\text{.}\)

Indice.

Pour \(x\in \rbb 0,1\rbb\text{,}\) considérer le développement décimal de \(x\text{.}\)

Au fait, pourquoi exclure la suite constante égale à 9 ?

Spoiler.

(h)

Montrer que \(x\in \rbb 0,1\rbb\) est un nombre décimal ssi \(x=\Psi((x_i)_i)\) avec une suite \((x_i)_i\) telle que

\begin{gather*} \exists n_0\in\N,\forall i\geq n_0, x_i=0 \text{ ou }\\ \exists n_0\in\N,\forall i\geq n_0, x_i=9 \end{gather*}

On note \(D\) l'ensemble des des nombres décimaux de \(\rbb 0,1\rbb\) \(E_D\) l'ensemble des suites de \(E\) qui sont stationnaires, soit en 9, soit en 0.

Spoiler.

(i)

Montrer que

Si \(x\in \rbb 0,1\lbb \cap D\text{,}\) alors \(x\) a exactement deux antédédents \((x_n)_n,(y_n)_n\in E_D\text{;}\)
Si \(x\in \rbb 0,1\lbb \setminus D\text{,}\) alors \(x\) a un unique antédédent \((x_n)_n\in E\setminus E_D\text{;}\)

Spoiler.

(j)

Montrer que \(E_D\) est dénombrable, et en déduire que \(E\setminus E_D\) ne l'est pas.

Spoiler.

(k)

Montrer que

\begin{equation*} \Psi:E\setminus E_D \rightarrow \rbb 0,1\rbb\setminus D \end{equation*}

est bijective. En déduire que \(\rbb 0,1\rbb\setminus D\) n'est pas dénombrable.

Spoiler.

(l)

Conclure que \(\rbb 0,1\rbb\) n'est pas dénombrable.

Spoiler.

Une agréable récapitulation:

Subsection 1.2.2 Différentes types de variables aléatoires

Ces deux types d'infinis correspondent aux deux façons de faire des probabilités que vous avez déjà croisées:

Les probabilités et variables aléatoires discrètes font intervenir des ensembles au plus dénombrables,
Les probabilités continues et les variables aléatoires à densité font appel à des intervalles, et on a vu que c'étaient des ensembles non-dénombrables.

Revenons un moment sur cette distinction, et sur des situations où on pourrait vouloir la dépasser.

Variables aléatoires discrètes

Considérons donc une v.a. réelle

\begin{equation*} X:\Omega\rightarrow\R \end{equation*}

telle que \(X(\Omega)\) est au plus dénombrable. \(X\) peut donc prendre seulement un nombre fini ou dénombrable de valeurs différentes: c'est le cas, par exemple, si \(X\) modélise, je ne sais pas, disons, le lancer d'un dé.

On note

\begin{equation*} X(\Omega)=\{x_k,k\in\N\},\text{ et pour tout }k\in \N, p_k=\P(\{X=x_k\}) \end{equation*}

Alors pour tout sous-ensemble raisonnable \(A\subset \R\text{,}\)

\begin{align*} \{X\in A\}\amp= \{\omega\in\Omega,X(\omega)\in A\}\\ \amp= \{\omega\in\Omega,X(\omega)\in A\cap X(\Omega)\}\\ \amp=\{\omega\in\Omega,\exists k\in\N,X(\omega)=x_k,x_k\in A\}\\ \amp=\bigsqcup_{k|x_k\in A} \{X=x_k\} \end{align*}

donc, par \(\sigma\)-additivité de \(\P\text{,}\)

\begin{equation*} \P(\{X\in A\}) = \sum_{k|x_k\in A} \P(\{X=x_k\})= \sum_{k|x_k\in A} p_k \end{equation*}

Mais du coup, la loi de \(X\) est la probabilité sur \((\R,\B(\R))\) donnée par

\begin{equation*} P_X(A)=\sum_{k|x_k\in A} p_k=\sum_{k\in \N} p_k 1_A(x_k) \end{equation*}

Supposons de plus, quitte à les réarranger que la suite \((x_k)_k\) est croissante. Alors pour tout \(\alpha\in \R\text{,}\)

\begin{equation*} F_X(\alpha) = \P\{X\leq \alpha\} = \sum_{k|x_k\leq \alpha} p_k \end{equation*}

donc \(F_X\) ressemble à une fonction "en escaliers" (prenant éventuellement un nombre infini, mais dénombrable, de valeurs), croissante, avec des "sauts" de taille \(p_k\) à chaque \(x_k\text{.}\) Autrement dit, \(F_X(x_k)-F_X(x_k^-)=p_k=\P(\{x_k\})\text{.}\)

Variables aléatoires à densité

Dans le cas de variables aléatoires tels que \(X(\Omega)\) n'est pas dénombrable²¹, on va rarement s'intéresser à la probabilité \(\P(\{X=a\})\) que \(X\) prenne une valeur spécifique: en général, cette probabilité sera 0.

A la place, on va s'intéresser à la probabilité que \(X\) soit très proche de \(a\text{,}\) mettons dans un intervalle \(\rbb a,a+\delta\rbb\text{.}\)

A priori, plus \(\delta\) est petit, plus cette probabilité va être faible, et inversement. Il ne serait donc pas déraisonnable (en tout cas tant qu'on reste proche de \(a\)) qu'elle soit proportionnelle à \(\delta\text{:}\)

\begin{equation*} \P(\{X\in \rbb a, a+\delta \rbb\}) \simeq f_X(a)\cdot \delta \end{equation*}

avec un facteur de proportionnalité \(f(a)\) qui, pour autant qu'on sache, dépend de \(a\text{.}\)

Mais dans ce cas, en utilisant la définition de la fonction de répartition \(F_X\text{,}\) la fonction \(f\) ainsi définie vérifierait

\begin{equation*} f_X(a)=\lim_{\delta\rightarrow 0}\frac{\P(\{X\in \rbb a, a+\delta \rbb\})}{\delta}=\lim_{\delta\rightarrow 0}\frac{F_X(a+\delta)-F_X(a)}{\delta} \end{equation*}

En particulier, si \(F_X\) était dérivable en \(a\text{,}\) alors \(f_X(a)=F_X'(a)\text{,}\) et on aurait du coup, pour tous \(a,b\in\R\text{,}\)

\begin{equation*} P_X(\rbb a,b \lbb ) \P(\{X\in \rbb a,b \lbb\}))=F_X(b)-F_X(a)=\int_a^b f_X(t)dt, \end{equation*}

\begin{equation*} F_X(x)=\P(\rbb -\infty,x\rbb)=\int_{-\infty}^x f_X(t)dt \end{equation*}

et, à grands coups de théorèmes de théorie de la mesure, on en déduira que pour tout sous-ensemble raisonnable de \(\R\) \(A\in\B(\R)\)

\begin{equation*} P_X(A)=\P(\{X\in A\})=\int_A f_X(t)\,d\lambda_1(t) \end{equation*}

où le sens de "\(d\lambda_1(t)\)" sera expliqué quand on introduira la toute nouvelle intégrale de Lebesgue.

\(\leadsto\) Ce cas où \(F_X\) est une sympathique fonction (presque partout) dérivable et \(f_X=F_X'\) est (presque partout) continue donne le cadre de la plupart des lois continues usuelles: loi uniforme, exponentielle, de Cauchy, Gamma, bref tout le zoo.

Mais les lois à densité sont en fait plus générales:

On dit qu'une variable aléatoire réelle \(X:\Omega\rightarrow\R\) est à densité (ou absolument continue) s'il existe une fonction sympathique \(f:\R\rightarrow\R^+\) telle que, pour tout \(A\in\B(\R)\text{,}\)

\begin{equation*} P_X(A)=\int_A f_X(t)d\lambda_1(t) \end{equation*}
La fonction \(f_X\) est alors appelée densité de \(X\). Elle vérifie

\begin{equation*} \int_\R f_X\, d\lambda_1 =\P(X\in\R)=1. \end{equation*}

Remarque 1.2.12.

Dans ce cas, on a, pour tout \(a\in\R\text{,}\)

\begin{equation*} \P(\{X=a\}=P_X(\{a\})=\int_{[a,a]} f_X(t)\,d\lambda_1(t)=\int_aâ f_X(t)\,dt=0 \end{equation*}

\(\leadsto\) Une variable aléatoire réelle à densité a une probabilité nulle de prendre une valeur particulière: c'est un peu l'opposé des variable aléatoires discrètes.

Subsection 1.2.3 Exemples de variables aléatoires "mixtes"

Cela dit, l'avantage de notre nouveau point de vue, c'est de permettre d'étudier des variables aléatoires qui ne sont pas discrètes ou continues, mais un peu des deux, avec à la fois des singletons de probabilité non nulle et des intervalles où \(F_X\) est continue (et éventuellement dérivable). Voyons quelques exemples.

Exemple 1: Le temps d'attente à un feu rouge

L'idée d'un feu rouge, c'est d'alterner entre une phase où il est au vert (de durée disons \(v\)) et une phase où il est au rouge (de durée, au hasard, \(r\))²² avec des unités choisies pour que \(r+v=1\) (ce qui va nous simplifier les calculs).

\(\leadsto\) On définit une variable aléatoire \(X:\Omega\rightarrow\R\) qui représente le temps d'attente d'une voiture au feu, en supposant que l'arrivée de la voiture tombe avec la même probabilité à n'importe quel moment du cycle: autrement dit, l'instant d'arrivée au feu suit une loi uniforme sur \([0,1]\text{.}\)

Quelques observations:

On ne peut pas attendre un temps négatif:

\begin{equation*} \forall t\lt 0,\ \P(\{X \leq t\})=0 \text{ donc } \forall t\lt 0,\ F_X(t)=0. \end{equation*}

On en déduit en particulier que \(F_X(0^-)=0\text{.}\)
Le temps d'attente est au maximum \(r\text{:}\)

\begin{equation*} \forall t\geq r,\ \P(\{X \leq t\})=1 \text{ donc } \forall t\geq r,\ F_X(t)=1. \end{equation*}
La probabilité de ne pas attendre du tout est égale à la probabilité d'arriver pendant la phase où le feu est vert:

\begin{align*} \P(\{X=0\}) = v \amp \leadsto F_X(0)-F_X(0^-) =v \\ \amp \leadsto F_X(0)= v \end{align*}
Enfin, pour la probabilité d'attendre un temps inférieur ou égal à \(x\text{,}\) pour \(x\in \lbb0,r\rbb\text{,}\) notons \(V\) l'évènement "le feu est vert à l'instant d'arrivée" et \(R\) l'évènement "le feu est rouge à l'instant d'arrivée". Alors \(V=R^c\) et, à coups de probabilités totales,

\begin{align*} F_X(x)\amp =\P(\{X\leq x\}) \\ \amp = \P(X \leq x |R)\P(R) + \P(X \leq x |V)\P(V)\\ \amp = \frac{x}{r}\cdot r+ 1\cdot v =x+v \end{align*}

Ce qui nous donne une fonction de répartition ni discrète ni continue.

Exemple 2

Plus généralement, on tombe facilement sur de telles variables aléatoires en tronquant une variable aléatoire continue \(X\text{:}\) par exemple, on peut définit \(Y=\min(X,m)\) pour une certaine valeur prédéfinie \(m\text{,}\) ou encore \(Z=X1_{|X|\leq m}\text{.}\) Ce qui nous donne:

Il serait plus agréable de disposer d'un cadre qui englobe à la fois les probabilités discrètes, continues, et mixtes. Ce nouveau cadre existe: il a été mis au point au début du XXème siècle par Borel et Lebesgue, entre autres, et puisqu'il va s'agir de mesurer des ensembles, on l'appelle théorie de la mesure.

Pour lesquells on peut "compter avec les doigts", quitte à le faire très longtemps

celles qui pours lesquelles nos doigts ne nous aident pas, même si on ajoute les orteils.

Non, vraiment

Oui, ça peut tomber à l'examen.

un strozzapreto ?

Par convention, on dira que \(\emptyset\) est fini de cardinal 0.

fr.wikipedia.org/wiki/Th%C3%A9or%C3%A8me_de_Cantor-Bernstein

fr.wikipedia.org/wiki/Georg_Cantor#Hostilit%C3%A9s_entre_Cantor_et_Kronecker

fr.wikipedia.org/wiki/Th%C4%81bit_ibn_Qurra

youtu.be/xauCQpnbNAM

carolinevernier.website/incompletude.html

journals.openedition.org/bibnum/890#tocto2n3

Ce qui, en fait, n'est pas si délirant...sauf si on l'écrit \(\infty \lt \infty\text{.}\)

Les \(A_n\) décrivent donc le manque d'injectivité de \(\varphi\text{:}\) ils réunissent les entiers qui ont la même image.

mais dans ce cas, on ne peut pas la bidouiller pour la rendre injective.

carolinevernier.website/constructive.html

A ce sujet:

Ceux d'entre vous qui se sont subitement mis à penser à un barbier en train de ne pas se raser lui-même ²⁰ n'ont pas tort.

www.bibmath.net/dico/index.php?action=affiche&quoi=./r/russell.html

On dit que \(X(\Omega)\) a la puissance du continu, ce qui en jette

Nous sommes à Paris, le feu orange n'existe pas vraiment