Section 1.2 Différents parfums d'infinis
Avant d'unifier les probabilités finies, discrètes et continues, essayons de comprendre ce qui nous avait donné l'impression, au départ, qu'elles étaient différentes.
La différence tient à l'ensemble des possibles qu'on considère: est-ce qu'il y a un nombre fini de possibilités, comme aux dés, ou infini, comme pour le numéro du premier succès ou l'heure d'arrivée ?
On pourrait croire que c'est là la distinction principale: fini ou infini, mais en fait, on utilise les mêmes techniques pour les probabilités finies et discrètes 1 , d'une part, et d'autre part les probabilités "continues" 2 .
\(\leadsto\) Comment rendre compte proprement de ce qui sépare les deux ?
Qu'est-ce que l'infini ? 3
Subsection 1.2.1 Ensembles finis, dénombrables, et non dénombrables
Tous les ensembles non finis sont infinis, mais certains sont plus infinis que d'autres
―George Cantorwell, La Ferme des Cardinaux
Supposons que je vous donne deux grands sacs de pâtes et que je vous demande de vérifier que le sac de gauche contient autant de strozzapreti que celui de droite contien de fusilli 4 .
Une façon de s'y prendre serait de compter combien il y a de pâtes dans le premier sac, combien il y en a dans le deuxième, et de vérifier qu'on tombe sur le même nombre. Mais dans ce cas, vous serez envahi d'un doute: et si vous vous étiez trompé en comptant le premier ?
Pour échapper aux affres du doute, une autre solution est de sortir un strozzapreti 5 du premier sac, un fusilli 6 du deuxième en même temps, et de continuer jusqu'à ce qu'un des sacs soit vide. Si les deux sacs sont vides au même moment, ils ont le même nombre de pâtes.
Autrement dit, si à chaque strozzapreti, on peut faire correspondre un, et un seul, fusilli, sans qu'il reste de fusilli célibataire.
Autrement autrement dit, si on trouve une bijection entre le sac de fusillis et le sac de strazzopreti.
\(\leadsto\) C'est en partant de cette idée qu'on va pouvoir comparer des tailles d'ensembles.
Définition 1.2.2. Cardinal, ensemble fini, ensemble infini.
On dit que deux ensembles \(X\) et \(Y\) ont le même cardinal (ou le même nombre d'éléments) s'il existe une bijection \(f:X\rightarrow Y\text{.}\)
-
On dit qu'un ensemble \(X\) est fini de cardinal \(n\), \(n\in\N^*\text{,}\) s'il existe une bijection \(f:X\rightarrow \{1,2,\ldots,n\}\text{.}\) 7
Dans ce cas, un seul entier \(n\) convient: on l'appelle cardinal de \(X\), noté \(\Card(X)\text{.}\)
On dit que \(X\) est fini s'il existe \(n\in\N\) tel que \(X\) est fini de cardinal \(n\text{.}\)
On dit que \(X\) est infini si...il n'est pas fini. Oui.
Remarque 1.2.3.
Plus généralement, s'il existe une application injective
alors on dira que \(\Card(Y)\leq \Card(X)\text{.}\)
Le théorème de Cantor-Bernstein 8 affirme que
S'il existe une application injective \(X\rightarrow Y\) et une application injective \(Y\rightarrow X\text{,}\) alors il existe une bijection entre \(X\) et \(Y\)
Donc
ce qui semble raisonnable.
Une autre conséquence raisonnable: si \(Y\subset X\text{,}\) alors l'inclusion
est injective, et donc on a
Passons maintenant aux conséquences déraisonnables.
On peut avoir l'impression que les ensembles infinis sont simplement des ensembles finis qui continuent jusqu'à l'horizon, et dont l'accolade fermante se perd simplement dans une brume de "...".
Mais ces trois innocents petits points cachent en fait des comportements étranges: par exemple, les ensembles infinis sont caractérisés par leur capacité à contenir un sous-ensemble de même taille que le total.
Proposition 1.2.4.
Un ensemble \(X\) est infini si et seulement s'il existe \(Y\in X\text{,}\) \(Y\neq X\text{,}\) tel que \(Y\) et \(X\) sont en bijection.
Exercice 1.2.1. Exemples.
(a)
Trouver une bijection entre \(\N\) et \(\N^*\text{.}\)
Et une bijection entre \(\R\) et \(\R^*_+\text{.}\)
(b)
Trouver une bijection entre \(\N\) et l'ensemble des entiers pairs \(2\N\text{.}\)
Et une bijection entre \(\rbb 0, 1\lbb\) et \(\rbb 0, 2\lbb\text{.}\)
(c)
Trouver une bijection entre \(\left[\ -\dfrac{\pi}{2}, \dfrac{\pi}{2} \,\right]\,\) et \(\Rb=\R\cup\{\pm\infty\}\text{.}\)
D'autres bizarreries de l'infini:
Les ensembles finis, au contraire, ont un rapport tout à fait sain avec leurs sous-ensembles:
si \(X\) est fini, alors pour tout \(Y\in\P(X)\setminus\{X\}\text{,}\) il n'existe pas de bijection \(\phi : X \rightarrow Y\text{.}\)
Exercice 1.2.2. Preuve.
(a)
Montrer par récurrence que pour tout \(n\in\N^*\text{,}\) quel que soit \(A\subset E_n=\{1,2,...,n\}\) tel que \(A\neq E_n\text{,}\) il n'existe pas de bijection \(\phi : E_n \rightarrow A\text{.}\)
Comme souvent avec les preuves de non-existence, on peut le faire par l'absurde: on suppose qu'il existe bien \(A\subset E_{n+1}\) tel que \(A\neq E_{n+1}\text{,}\) et une bijection \(\phi:E_{n+1}\rightarrow A\text{,}\) et on en déduit une bijection entre \(E_n\) et un sous-ensemble \(A'\) strictement inclus dans \(E_n\text{,}\) ce qui contredira l'hypothèse de réccurence.
Dans le raisonnement par l'absurde, il peut être pratique de séparer les cas où \(A\subset E_n\) et \(n+1 \in A\text{.}\)
(b)
En déduire la démonstration de la proposition dans le cas générak d'un ensemble fini.
Pour le cas général: la définition des ensembles finis aide à se ramener au cas précédent.
Corollaire 1.2.5.
Si \(X\subset E\) et \(X\) est infini, alors \(E\) est infini.
Petit Exercice 1.2.6.
Et un dernier critère d'infinitude pour la route :
Proposition 1.2.7.
Un ensemble \(E\) est infini ssi il existe une application injective \(\N\rightarrow E\text{.}\)
Petit Exercice 1.2.8.
\(\boxed{\Rightarrow}\) Si \(E\) est infini, et qu'on pioche des éléments dans \(E\text{,}\) on ne devrait jamais tomber à cours de strozzapreti.
\(\boxed{\Rightarrow}\text{:}\) Montrer que dans ce cas, \(f(\N)\) est forcément infini et utiliser le Corollaire 1.2.5.
Les ensembles infinis appartiennent donc à une espèce complètement différentes des ensembles finis. Et la notation \(\Card(X)\) donne envie d'attribuer, à tous les ensembles infinis, le cardinal
et donc, on a l'impression que tous les ensembles infinis ont le même cardinal.
Mais pas au sens de la Définition 1.2.2 !
Exercice 1.2.3. Argument diagonal de Cantor.
Montrons que, bien qu'ils soient tous les deux infinis, les ensembles \(\R\) et \(\N\) ne sont pas ne bijection, et donc n'ont pas le même cardinal (au sens de la Définition 1.2.2).
(a)
Montrer que \(\R\) et \(\N\) sont infinis.
(b)
Supposons, par l'absurde, qu'il existe une application bijective
On note \(x_n=\varphi(n)\) pour tout \(i\in \N\text{,}\) et, pour tout \(i\in \N^*\text{,}\) pour tout \(n\in\N\text{,}\) on note \(a_{i,n}\in\{0,1,...9\}\) la \(i\)-ème décimale de \(x_n\text{:}\)
Construire ledéveloppement décimal d'un réel \(x\) tel que, pour tout \(n\in\N\text{,}\) \(x\neq x_n\text{.}\)
Ce raisonnement s'appelle l'argument diagonal de Cantor.
Noter que, pour chaque \(n\text{,}\) il y a des éléments de \(\{0,1,...9\}\) qui ne sont pas \(a_{n,n}\text{.}\)
(c)
En déduire que \(\varphi\) n'est pas surjective, et dénoncer la contradiction.
(d)
Conclure que \(\N\) et \(\R\) n'ont pas le même cardinal.
Il y a donc au moins deux tailles d'infini: celle de \(\N\) et celle de \(\R\text{.}\) Puisque \(\N\subset \R\text{,}\) on a donc
et cette inégalité n'est pas une égalité 14
De là, on a l'impression que l'ensemble des entiers pairs, celui des entiers relatifs, et \(\{x\in\R,\sin(x)=1\}\) sont tous dsans le même sac que \(\N\text{,}\) et d'un autre côté, l'intervalle \(\rbb 67, 819.37 \lbb\text{,}\) le cercle unité dans \(\R^2\) et la droite \(\vect((8,\sqrt{47},-\pi^2))\subset \R^3\) sont dans le même sac que \(\R\)
Ce qui nous amène à leur donner des noms à ces sacs:
Définition 1.2.9. Ensemble dénombrable..
-
On dit qu'un ensemble \(X\) est dénombrable s'il existe une bijection
\begin{equation*} \varphi: \N\rightarrow X \end{equation*} On dit qu'un ensemble \(X\) est au plus dénombrable s'il est soit fini, soit dénombrable.
Sinon, on dit qu'un ensemble est...non-dénombrable. Oui.
Remarque 1.2.10.
Soit \(X\) un ensemble dénombrable, on a donc une bijection
Notons, pour chaque \(i\in\N\text{,}\) \(x_i:=\varphi(i)\in X\text{.}\) Alors, comme \(\varphi\) est surjective,
On notera donc souvent directement les ensembles dénombrables sous la forme
La proposition suivante nous donne un détecteur d'ensembles dénombrables parfois plus reposant que la définition:
Proposition 1.2.11.
Un ensemble \(X\) est dénombrable si et seulement si il est infini et il existe une application surjective \(\N\rightarrow X\text{.}\)
Un ensemble \(X\) est au plus dénombrable si et seulement si il existe une application surjective \(\N\rightarrow X\text{.}\)
Exercice 1.2.4. Preuve.
On doit donc montrer l'équivalence entre
Il existe une bijection \(\N\rightarrow X\)
\(X\) est infini et il existe une surjection \(\N\rightarrow X\text{.}\)
On va procéder, prudemment, par double implication.
(a)
\(\boxed{(i)\Rightarrow(ii)}\text{:}\) On suppose que \((i)\) est vérifiée.
Montrer que s'il existe une bijection \(\varphi:A\rightarrow X\) avec \(A\) un ensemble infini, alors \(E\) est infini.
Se rappeler de la Proposition 1.2.4: en l'appliquant à A, utiliser \(\varphi\) pour construire une application \(X\rightarrow X\) injective, mais pas surjective, et en déduire un sous-ensemble \(Y\) de \(X\) avec lequel \(X\) est en bijection.
(b)
En déduire \((ii)\text{.}\)
(c)
\(\boxed{(ii)\Rightarrow(i)}\text{:}\) On suppose que \((ii)\) est vérifiée. Soit donc
une application surjective. On note, pour chaque \(n\in\N\)
Montrer que les \(A_n,n\in\N\text{,}\) forment une partition de \(\N\text{.}\)
(d)
On définit une suite d'entiers \(n_k,k\in\N\) par
Vérifier que \(n_k\) existe pour tout \(k\) et que l'application
est injective.
(e)
Montrer que, pour tout \(m\in\N\text{,}\) il existe \(k_m\in\N\) tel que
(f)
En déduire que l'application
est bijective, et conclure.
(g)
Montrer que si \(X\) est fini, alors il existe une surjection \(\N\rightarrow X\) 16 .
En déduire que \(X\) est au plus dénombrable ssi il existe une surjection \(\N\rightarrow X\text{.}\)
Exercice 1.2.5. Quelques applications générales.
(a)
Soient \(X,Y\) deux ensembles et \(f:X\rightarrow Y\) un application.
Montrer que si \(X\) est au plus dénombrable, alors \(f(X)\) est au plus dénombrable, et trouver un exemple tel que \(f(X)\) est fini.
Et si \(f\) est injective ?
(b)
Montrer que si \(X\) est dénombrable et \(Y\subset X\text{,}\) alors \(Y\) est au plus dénombrable.
(c)
Montrer qu'un ensemble est infini ssi il contient un sous-ensemble dénombrable.
\(\leadsto\) dans ce sens, les ensembles dénombrables sont les "plus petits" ensembles infinis: un ensemble infini peut être dénombrable, ou plus gros.
Se rappeler de la Proposition 1.2.7
D'après la Proposition 1.2.7, un ensemble est infini ssi il existe une application injective
Mais dans ce cas: \(f:\N\rightarrow f(\N)\) est une bijection, donc \(f(\N)\) est dénombrable.
Donc, un ensemble est infini ssi il contient un sous-ensemble dénombrable.
(d)
Unions finies de dénombrables
Soient \(X_1,X_2\) deux ensembles au plus dénombrables. Montrer que \(X_1 \cup X_2\) est au plus dénombrable.
En déduire que si \(X_1,...,X_m\) sont \(m\) ensembles au plus dénombrables, alors \(X_1\,\cup\,...\,\cup\, X_m\) est au plus dénombrable.
(e)
Produit d'un ensemble dénombrable et d'un ensemble fini.
Soient \(X_1,X_2\) deux ensembles tels que \(X_1\) est fini et \(X_2\) est au plus dénombrables.
Montrer que \(X_1 \times X_2\) est au plus dénombrable.
Intuitivement, le point commun des ensembles dénombrables, c'est qu'on peut...les dénombrer, c'est à dire les prendre un par un, à la suite.
C'est assez intuitif qu'on peut faire ça avec les entiers, et c'est assez intuitif que ça va être difficile avec l'ensemble \(\rbb 0, 1\lbb\text{:}\) mettons qu'on commence par 0 ...qu'est-ce qu'on prend après ?
Notons qu'on peut aussi bien commencer par 1, ou par \(\frac13\text{,}\) ou par \(\frac{3\pi}{17}\text{:}\) dans notre écriture \(X=\{x_i, i\in\N\}\text{,}\) rien ne dit que les \(x_i\) soient par ordre croissant...et d'ailleurs, rien ne dit qu'il y ait un ordre sur les \(x_i\text{,}\) par exemple si ce sont des points de \(\R^4\text{.}\)
Bon, mais même comme ça, on n'a pas l'impression de pouvoir prendre un par un les éléments de \([0,1].\text{.}\)
Et pour \(\Z\) ? \(\Q\) ? \(\N \times [0,1]\) ?
Exercice 1.2.6. Quelques exemples et applications générales:.
(a)
Montrer que \(\Z\) est dénombrable.
(b)
Dénombrabilité de \(\N\times \N\) pour les amateurs d'arithmétique
Montrer que l'application
est bijective.
En déduire que \(\N\times \N\) est dénombrable.
(c)
Dénombrabilité de \(\N\times \N\) pour les amateurs d'itinéraires touristiques
On propose la balade suivante dans \(\N\times \N\text{:}\)
Etape 0: On part de \((0,0)\)
Etape 1: On va un cran vers l'Est en \((1,0)\text{;}\)
Etape 2: On va un cran au Nord-Ouest en \((0,1)\text{;}\)
Etape 3: On redescend en deltaplane jusqu'à \((2,0)\text{;}\)
Etape 4: On va repart au Nord-Ouest en \((1,1)\text{;}\)
Etape 5: et encore un cran au Nord-Ouest en \((0,2)\text{;}\)
Etape 6: On redescend en deltaplane jusqu'à \((3,0)\text{;}\)
et ainsi de suite.
Pour chaque \(i\in \N\text{,}\) on note \(\Phi(i)\in\N\times\N\) les coordonnées de la \(i\)-ème étape.
Déterminer \(\Phi(10)\) et trouver \(i,j\in\N\) tels que \(\Phi(i)=(5,0)\) et \(\Phi(j)=(4,1)\text{.}\)
Donner une formule générale pour \(\Phi(i)\text{.}\)
(d)
Montrer que \(\Phi:\N \rightarrow \N\times \N\) est surjective, et en déduire que \(\N\times\N\) est dénombrable.
(e)
Union dénombrable de dénombrables
Soient \(X_1,X_2,....\) une famille dénombrable d'ensembles au plus dénombrables.
Construire une application
et en déduire que \(\bigcup_{n\in\N}X_n\) est au plus dénombrable.
(f)
En déduire que \(\Q\) est dénombrable.
(g)
Supposons que \(X_1,X_2\) soient deux ensembles dénombrables. Construire une application surjective
En déduire que \(X_1\times X_2\) est dénombrable.
Rappelons qu'on dispose de deux bijections \(\N\rightarrow X_1\text{,}\) \(\N\rightarrow X_2\) et de la Proposition 1.2.11.
(h)
Produit fini de dénombrables
Soient \(X_1,...,X_m\) \(m\) ensembles au plus dénombrables. Montrer que le produit \(X_1\times...\times X_m\) est au plus dénombrable.
(i)
En redéduire que \(\Q\) est dénombrable.
Exercice 1.2.7. Nombres transcendants.
On dit qu'un nombre réel est algébrique s'il est la solution d'une équation polynômiale à coefficients entiers. Si un nombre réel n'est pas algébrique, on dit qu'il est transcendant.
On va montrer que l'ensemble de tous les nombres algébriques est dénombrable.
(a)
On note
l'ensemble des nombres réels algébriques. Montrer que \(\Q\subset\mathcal A\text{.}\)
Montrer que, quoi qu'en disent tout un tas de documentaires, le nombre d'or n'est finalement pas si transcendant. Trouver un autre irrationnel \(x\in\R\) tel que \(x\in \mathcal A\text{.}\)
Prendre une minute pour se demander s'il existe des réels qui ne sont pas dans \(\mathcal A\text{,}\) et réfléchir à comment on pourrait bien démontrer une chose pareille.
(b)
On note, pour chaque \(n\in\N\text{,}\)
Exprimer \(\mathcal A\) en fonction des \(A_n,n\in\N\text{.}\)
(c)
Montrer que, pour tout \(n\in\N\text{,}\) \(A_n\) est fini.
En déduire que \(\mathcal A\) est dénombrable.
(d)
Montrer qu'il existe des nombres transcendants.
(e)
La preuve de Cantor ne nous dit cependant pas où trouver ces nombres. Et c'est en fait assez technique de le faire sur un exemple particulier:
Exercice 1.2.8. Discontinuités des fonctions croissantes.
Soit \(f: \R\rightarrow \R\) une fonction croissante. Alors \(f\) peut être discontinue (c'est le cas par exemple de la fonction partie entière), mais pas trop: on va montrer que l'ensemble des points où \(f\) est discontinue est au plus dénombrable.
(a)
Montrer que l'application "saut"
est définie sur \(\R\) et positive.
On notera
Quel est le rapport avec notre problème ?
il s'agit de montrer que les limites à gauche et à droite de \(f\) existent en tout point. Plus précisément, on a
Par rapport au titre de l'exercice: en quels point a-t-on \(S_f(a)\neq 0\) ?
(b)
Pour tout \(n\in\N^*\text{,}\) on note
Montrer que si \(x_1\lt...\lt x_k\) sont des élément de \(D_n\text{,}\) alors
et en déduire que \(D_n\) est un ensemble fini.
(c)
Décrire l'ensemble des points de discontinuité de \(f\) en fonction des \(A_n,n\in\N\) et conclure.
On finirait par croire que tout assemblage dénombrable d'ensembles dénombrables est dénombrable; mais en fait, ce n'est pas le cas:
Exercice 1.2.9. Attention aux produits dénombrables : ce sont des traîtres.
On va montrer qu'un produit dénombrable d'ensembles au plus dénombrables n'est pas forcément dénombrable.
Et c'est vite arrivé: on va voir plus précisément que, dès lors qu'on a une famille dénombrables \(E_n,n\in\N\) d'ensembles qui ont chacun au moins deux éléments, alors le produit \(E_1\times E_2\times...\) est non-dénombrable.
Remarque: Les \(E_i\) ne sont pas forcément tous différents.
(a)
Soit donc \(E_1,E_2,...\) une famille dénombrable d'ensembles tels que \(\Card E_i\geq 2\) pour chaque \(i \in \N\text{.}\) On note \(E=E_1\times E_2\times...\) le produit de tous ces ensembles.
Les éléments de \(E\) sont donc des suites \(x=(x_0,x_1,x_2,...)=(x_i)_{i\in\N}\) telles que, pour chaque \(i\text{,}\) \(x_i\in E_i\text{.}\)
Pour chaque \(i\in\N\text{,}\) prenons \(a_i,b_i\in E_i\) deux éléments distincts de \(E_i\text{:}\) \(a_i\neq b_i\text{.}\)
On considère l'application \(\Phi: x=(x_i)_{i\in\N}:E\rightarrow \P(\N)\) défini par:
S'il existe \(i\in\N\) tel que \(x_i\neq a_i,b_i\) alors \(\Phi(x)=\emptyset\text{.}\)
-
Sinon, si pour tout \(i\in\N\text{,}\) \(x_i\) est égal soit à \(a_i\) soit à \(b_i\text{,}\) on pose
\begin{equation*} \Phi(x)=\{n\in\N,x_n=a_n\} \end{equation*}
Montrer que \(\Phi\) est surjective.
(b)
En déduire que, si \(E\) était dénombrable, on aurait une application surjective \(\N\rightarrow \P(\N)\text{.}\)
Plus qu'à voir pourquoi c'est un problème.
(c)
Et ce n'est pas un problème que pour \(\N\text{:}\) quel que soit l'ensemble \(E\text{,}\) il n'existe pas d'application surjective \(E\rightarrow \P(E)\) 18
Supposons par l'absurde qu'il en existe une, et appelons-la \(S\text{.}\)
On note
Justifier qu'il existe \(x_A\in X\) tel que \(S(x_A)=A\text{.}\)
(d)
Est-ce que \(x_A\in A\) ?
En déduire qu'on a effectivement un problème, et que \(S\) n'existe pas.
(e)
Conclure que \(E_1\times E_2\times...\) n'est pas dénombrable.
(f)
Application: \(\rbb 0, 1\rbb\) n'est pas dénombrable
On considère l'ensemble \(E=\{0,1,2,...,9\}^\N\setminus\{(9,9,9....\}\) des suites d'entiers entre 0 et 9, excluant la suite constante égale à 9. Justifier que \(E\) n'est pas dénombrable.
(g)
Montrer que l'application
est une application surjective \(E \rightarrow \rbb 0,1\rbb\text{.}\)
(h)
Montrer que \(x\in \rbb 0,1\rbb\) est un nombre décimal ssi \(x=\Psi((x_i)_i)\) avec une suite \((x_i)_i\) telle que
On note \(D\) l'ensemble des des nombres décimaux de \(\rbb 0,1\rbb\) \(E_D\) l'ensemble des suites de \(E\) qui sont stationnaires, soit en 9, soit en 0.
(i)
Montrer que
Si \(x\in \rbb 0,1\lbb \cap D\text{,}\) alors \(x\) a exactement deux antédédents \((x_n)_n,(y_n)_n\in E_D\text{;}\)
Si \(x\in \rbb 0,1\lbb \setminus D\text{,}\) alors \(x\) a un unique antédédent \((x_n)_n\in E\setminus E_D\text{;}\)
(j)
Montrer que \(E_D\) est dénombrable, et en déduire que \(E\setminus E_D\) ne l'est pas.
(k)
Montrer que
est bijective. En déduire que \(\rbb 0,1\rbb\setminus D\) n'est pas dénombrable.
(l)
Conclure que \(\rbb 0,1\rbb\) n'est pas dénombrable.
Une agréable récapitulation:
Subsection 1.2.2 Différentes types de variables aléatoires
Ces deux types d'infinis correspondent aux deux façons de faire des probabilités que vous avez déjà croisées:
Les probabilités et variables aléatoires discrètes font intervenir des ensembles au plus dénombrables,
Les probabilités continues et les variables aléatoires à densité font appel à des intervalles, et on a vu que c'étaient des ensembles non-dénombrables.
Revenons un moment sur cette distinction, et sur des situations où on pourrait vouloir la dépasser.
Variables aléatoires discrètes
Considérons donc une v.a. réelle
telle que \(X(\Omega)\) est au plus dénombrable. \(X\) peut donc prendre seulement un nombre fini ou dénombrable de valeurs différentes: c'est le cas, par exemple, si \(X\) modélise, je ne sais pas, disons, le lancer d'un dé.
On note
Alors pour tout sous-ensemble raisonnable \(A\subset \R\text{,}\)
donc, par \(\sigma\)-additivité de \(\P\text{,}\)
Mais du coup, la loi de \(X\) est la probabilité sur \((\R,\B(\R))\) donnée par
Supposons de plus, quitte à les réarranger que la suite \((x_k)_k\) est croissante. Alors pour tout \(\alpha\in \R\text{,}\)
donc \(F_X\) ressemble à une fonction "en escaliers" (prenant éventuellement un nombre infini, mais dénombrable, de valeurs), croissante, avec des "sauts" de taille \(p_k\) à chaque \(x_k\text{.}\) Autrement dit, \(F_X(x_k)-F_X(x_k^-)=p_k=\P(\{x_k\})\text{.}\)
Variables aléatoires à densité
Dans le cas de variables aléatoires tels que \(X(\Omega)\) n'est pas dénombrable 21 , on va rarement s'intéresser à la probabilité \(\P(\{X=a\})\) que \(X\) prenne une valeur spécifique: en général, cette probabilité sera 0.
A la place, on va s'intéresser à la probabilité que \(X\) soit très proche de \(a\text{,}\) mettons dans un intervalle \(\rbb a,a+\delta\rbb\text{.}\)
A priori, plus \(\delta\) est petit, plus cette probabilité va être faible, et inversement. Il ne serait donc pas déraisonnable (en tout cas tant qu'on reste proche de \(a\)) qu'elle soit proportionnelle à \(\delta\text{:}\)
avec un facteur de proportionnalité \(f(a)\) qui, pour autant qu'on sache, dépend de \(a\text{.}\)
Mais dans ce cas, en utilisant la définition de la fonction de répartition \(F_X\text{,}\) la fonction \(f\) ainsi définie vérifierait
En particulier, si \(F_X\) était dérivable en \(a\text{,}\) alors \(f_X(a)=F_X'(a)\text{,}\) et on aurait du coup, pour tous \(a,b\in\R\text{,}\)
et
et, à grands coups de théorèmes de théorie de la mesure, on en déduira que pour tout sous-ensemble raisonnable de \(\R\) \(A\in\B(\R)\)
où le sens de "\(d\lambda_1(t)\)" sera expliqué quand on introduira la toute nouvelle intégrale de Lebesgue.
\(\leadsto\) Ce cas où \(F_X\) est une sympathique fonction (presque partout) dérivable et \(f_X=F_X'\) est (presque partout) continue donne le cadre de la plupart des lois continues usuelles: loi uniforme, exponentielle, de Cauchy, Gamma, bref tout le zoo.
Mais les lois à densité sont en fait plus générales:
-
On dit qu'une variable aléatoire réelle \(X:\Omega\rightarrow\R\) est à densité (ou absolument continue) s'il existe une fonction sympathique \(f:\R\rightarrow\R^+\) telle que, pour tout \(A\in\B(\R)\text{,}\)
\begin{equation*} P_X(A)=\int_A f_X(t)d\lambda_1(t) \end{equation*} -
La fonction \(f_X\) est alors appelée densité de \(X\). Elle vérifie
\begin{equation*} \int_\R f_X\, d\lambda_1 =\P(X\in\R)=1. \end{equation*}
Remarque 1.2.12.
Dans ce cas, on a, pour tout \(a\in\R\text{,}\)
\(\leadsto\) Une variable aléatoire réelle à densité a une probabilité nulle de prendre une valeur particulière: c'est un peu l'opposé des variable aléatoires discrètes.
Subsection 1.2.3 Exemples de variables aléatoires "mixtes"
Cela dit, l'avantage de notre nouveau point de vue, c'est de permettre d'étudier des variables aléatoires qui ne sont pas discrètes ou continues, mais un peu des deux, avec à la fois des singletons de probabilité non nulle et des intervalles où \(F_X\) est continue (et éventuellement dérivable). Voyons quelques exemples.
Exemple 1: Le temps d'attente à un feu rouge
L'idée d'un feu rouge, c'est d'alterner entre une phase où il est au vert (de durée disons \(v\)) et une phase où il est au rouge (de durée, au hasard, \(r\)) 22 avec des unités choisies pour que \(r+v=1\) (ce qui va nous simplifier les calculs).
\(\leadsto\) On définit une variable aléatoire \(X:\Omega\rightarrow\R\) qui représente le temps d'attente d'une voiture au feu, en supposant que l'arrivée de la voiture tombe avec la même probabilité à n'importe quel moment du cycle: autrement dit, l'instant d'arrivée au feu suit une loi uniforme sur \([0,1]\text{.}\)
Quelques observations:
-
On ne peut pas attendre un temps négatif:
\begin{equation*} \forall t\lt 0,\ \P(\{X \leq t\})=0 \text{ donc } \forall t\lt 0,\ F_X(t)=0. \end{equation*}On en déduit en particulier que \(F_X(0^-)=0\text{.}\)
-
Le temps d'attente est au maximum \(r\text{:}\)
\begin{equation*} \forall t\geq r,\ \P(\{X \leq t\})=1 \text{ donc } \forall t\geq r,\ F_X(t)=1. \end{equation*} -
La probabilité de ne pas attendre du tout est égale à la probabilité d'arriver pendant la phase où le feu est vert:
\begin{align*} \P(\{X=0\}) = v \amp \leadsto F_X(0)-F_X(0^-) =v \\ \amp \leadsto F_X(0)= v \end{align*} -
Enfin, pour la probabilité d'attendre un temps inférieur ou égal à \(x\text{,}\) pour \(x\in \lbb0,r\rbb\text{,}\) notons \(V\) l'évènement "le feu est vert à l'instant d'arrivée" et \(R\) l'évènement "le feu est rouge à l'instant d'arrivée". Alors \(V=R^c\) et, à coups de probabilités totales,
\begin{align*} F_X(x)\amp =\P(\{X\leq x\}) \\ \amp = \P(X \leq x |R)\P(R) + \P(X \leq x |V)\P(V)\\ \amp = \frac{x}{r}\cdot r+ 1\cdot v =x+v \end{align*}
Ce qui nous donne une fonction de répartition ni discrète ni continue.
Exemple 2
Plus généralement, on tombe facilement sur de telles variables aléatoires en tronquant une variable aléatoire continue \(X\text{:}\) par exemple, on peut définit \(Y=\min(X,m)\) pour une certaine valeur prédéfinie \(m\text{,}\) ou encore \(Z=X1_{|X|\leq m}\text{.}\) Ce qui nous donne:
Il serait plus agréable de disposer d'un cadre qui englobe à la fois les probabilités discrètes, continues, et mixtes. Ce nouveau cadre existe: il a été mis au point au début du XXème siècle par Borel et Lebesgue, entre autres, et puisqu'il va s'agir de mesurer des ensembles, on l'appelle théorie de la mesure.
fr.wikipedia.org/wiki/Th%C3%A9or%C3%A8me_de_Cantor-Bernstein
fr.wikipedia.org/wiki/Georg_Cantor#Hostilit%C3%A9s_entre_Cantor_et_Kronecker
fr.wikipedia.org/wiki/Th%C4%81bit_ibn_Qurra
youtu.be/xauCQpnbNAM
carolinevernier.website/incompletude.html
journals.openedition.org/bibnum/890#tocto2n3
carolinevernier.website/constructive.html
www.bibmath.net/dico/index.php?action=affiche&quoi=./r/russell.html