Section 6 L'ensemble de Cantor
Au vu des exemples croisés jusqu'ici, on peut se demander s'il existe dans \(\mathbb R\) des ensembles \(\mu_1\)-négligeables qui ne soient pas dénombrables.
On va voir que c'est le cas: on va construire un ensemble de mesure nulle et non dénombrable dans \(\mathbb R\text{;}\) puis on s'en servira pour construire des exemples de sous-ensembles \(\mu_1\)-négligeables mais pas boréliens.
On part de l'intervalle \([0,1]\) et on itère l'opération "enlever le tiers du milieu":
- A l'étape 1, on enlève à \(A_0=[0,1]\) l'intervalle \(\left]\frac13, \frac 23\right[\text{.}\) Il nous reste \(A_1=\left[0,\frac13\right]\cup\left[\frac23, 1\right]\text{.}\)
- On enlève le tiers du milieu de chacun de ces sous-intervalles: on enlève \(\left]\frac 19, \frac 29\right[\) à \(\left[0,\frac13\right]\) et \(\left]\frac 79, \frac 89\right[\) à \(\left[\frac23,1\right]\text{.}\) Il nous reste \(A_2=\left[0,\frac19\right]\cup\left[\frac29,\frac13\right]\cup\left[\frac23, \frac79\right]\cup\left[\frac89, 1\right]\)
-
On itère ce procédé: pour \(n\in\mathbb N\)
\begin{equation*} A_{n+1}= \frac{A_n}3 \cup \frac{2+A_n}3. \end{equation*}Ainsi, pour tout \(n\text{,}\) \(A_n\) est l'union de \(2^n\) intervalles fermés, deux à deux disjoints, chacun de longueur \(3^{-n}\text{.}\) Les extrémités de ces intervalles sont les \(2^{n+1}\) points de la forme
\begin{equation*} \frac{\varepsilon_n}{3^n}+\sum_{k=1}^n\frac{t_k}{3^k} \text{ avec } \varepsilon_n\in\{0,1\},\ t_k\in\{0,2\} \end{equation*}les points avec \(\varepsilon_n=0\) donnent les extrémités gauches, et ceux avec \(\varepsilon_n=1\) donnent les extrémités droites.
Remarquons que ces points demeurent des extrémités d'intervalles à chaque étape ultérieure: on a à la fois
\begin{equation*} A_{n+1}\subset A_n \text{ et } \partial A_n \subset \partial A_{n+1}. \end{equation*}
L'ensemble de Cantor est l'intersection décroissante des \(A_n\text{:}\) \(\mathcal C = \bigcap_n A_n\text{.}\) C'est "ce qui reste" après une infinité d'étapes.
Remarquons que \(\mathcal C\) est un fermé (comme intersection des fermés \(A_n\)), et de mesure de Borel nulle puisque \(\mu_1(A_0)=1\lt\infty\text{,}\) donc, par continuité monotone séquentielle,
Une autre façon de décrire à \(\mathcal C\) utilise l'écriture en base 3 des éléments de \([0,1]\text{.}\) On est plus habitué à les écrire en base 10: c'est ce qu'on appelle le développement décimal 1 de \(x \in [0,1]\text{,}\)
où les décimales \(d_k\) sont des entiers entre 0 et 9.
Mais il existe d'autres façons d'écrire les nombres : en base 2, par exemple, on aura \(x =\sum_{k\geq1}\frac{b_k}{2^k}\) avec \(b_k\in \{0,1\}\text{.}\) C'est ce que l'on appelle l'écriture binaire de \(x\text{,}\) particulièrement utile en informatique.
Ici, donc, on va utiliser l'écriture en base 3. Pour \(x\in [0,1]\text{,}\) il existe des entiers \(t_k\in\{0,1,2\}\) tels que
Par exemple, l'écriture en base 3 de 1 correspond à \(t_k=2\) pour tout \(k\text{,}\) puisque
et l'écriture de \(\frac13\) est donnée soit par \(t_1=1, t_k =0 \, \forall k\geq 2\text{,}\) soit par \(t_1=0, t_k=2 \, \forall k\geq 2\text{.}\)
Avec ces notations, l'ensemble de Cantor peut être décrit comme l'ensemble des éléments de \([0,1]\) dont une des écritures en base 3 ne comporte que des 0 et des 2.
En effet, à la première étape, on enlève tous les éléments entre \(\frac 13\) et \(\frac23\text{:}\) ce sont ceux la première "décimale" en base 3 vaut \(t_1=1\text{.}\) A l'étape 2, on enlève tous ceux qui vérifient \(t_2=1\text{.}\) Et ainsi de suite: à l'infini, il ne reste que les nombres dont l'écriture en base 3 ne comporte que des 0 et des 2.
Plus rigoureusement, on a, pour tous \(n,p\text{:}\)
donc \(\partial A_n \subset \mathcal C=\bigcap_{p\geq 0}A_{n+p}\text{.}\) Puisque \(\mathcal C\) est fermé, on en déduit que
Or, l'ensemble de gauche est exactement celui des éléments de \([0,1]\) dont l'écriture en base 3 ne comporte pas de 1.
Réciproquement, si \(x\in \mathcal C\text{,}\) alors pour tout \(n\geq 1\text{,}\) \(x\in A_n\text{,}\) donc \(x\) est dans l'un des intervalles qui constituent \(A_n\text{.}\) En particulier, \(x\) est à distance au plus \(3^{-n}\) de l'extrémité gauche de cet intervalle, qui est de la forme
Montrons que pour un \(k\) donné, la suite \((t^{(n)}_k)_{n\geq k}\) est constante. Cela signifie que le développement en base 3 de \(x^{(n+1)}\) est obtenu en ajoutant une \((n+1)\)-ième "tricimale" à celui de \(x^{(n)}\) (sans changer les précédentes).
Puisque \(x^{(n)}\) est à distance au plus \(3^{-n}\) de \(x\) et \(x^{(n+1)}\) est à distance au plus \(3^{-(n+1)}\text{,}\) on a:
d'où \(| x^{(n+1)}-x^{(n)}|\leq \frac 1{3^n}\text{.}\)
D'un autre côté, si l'une des \(n\) premières ``tricimales'' de \(x^{(n+1)}\) était différentes de celles de \(x^{(n)}\text{,}\) on aurait \(k_0:=\min\{k\ |\ t^{(n)}_k\neq t^{(n+1)}_k\}\leq n\text{,}\) et alors
ce qui est contradictoire. La suite \((t^{(n)}_k)_{n\geq k}\) est donc constante, disons égale à \(t_k\text{.}\) On a donc pour tout \(n\text{,}\)
Subsection 6.1 Cardinal de \(\mathcal C\)
On va utiliser cette écriture pour montrer que Card\((\mathcal C)\)=Card\((\mathbb R)\text{,}\) ce qui montrera que l'ensemble de Cantor n'est pas dénombrable. On a obtenu
On définit une bijection entre \(\mathcal C\) et l'ensemble des parties de \(\mathbb N\text{,}\) \(\mathcal P(\mathbb N)\) par
\(\triangleright\) Le réel \(f(A)\) est bien un élément de \(\mathcal C\) puisque son écriture en base 3 ne comporte que des 0 et des 2.
\(\triangleright\) \(f\) est injective: si \(f(A) = f(B)\text{,}\) alors pour tout \(i\in\mathbb N\text{,}\) \(\mathbb{1}_A(i) = \mathbb{1}_B(i)\text{,}\) donc
autrement dit, \(A=B\text{.}\)
\(\triangleright\) \(f\) est surjective: pour tout \(x = \sum_{k\geq1}\frac{t_k}{3^k} \in \mathcal C\text{,}\) \(x=f(A)\) où \(A =\{k\in \mathbb N, t_{k+1}=2\}\text{.}\)
Or, un résultat classique de théorie des ensembles assure qu'il n'y a pas de bijection entre \(\mathbb N\) et \(\mathcal P(\mathbb N)\) et plus généralement, entre \(A\) et \(\mathcal P(A)\text{,}\) quel que soit l'ensemble \(A\text{,}\) comme expliqué à 5:15 dans cette excellente vidéo:
donc il n'y a pas de bijection entre \(\mathbb N\) et \(\mathcal C\text{.}\) Donc \(\mathcal C\) n'est pas dénombrable.
De plus, Card(\(\mathcal P(\mathbb N)\))=Card(\(\{0,1\}^\mathbb N\)), via la bijection \(A\mapsto \mathbb{1}_A\text{,}\) et par ailleurs, on peut définir une bijection entre \([0,1[\) et \(\{0,1\}^\mathbb N\) par
donc, \(g(x)\) est le développement de \(x\) en base 2 et on a \(x=\sum_{k\geq 0}\frac {x_k}{2^{n+1}}\text{.}\) On a donc bien Card\((\mathbb R)\)= 2 Card\(([0,1[)\)=Card\((\{0,1\}^{\mathbb N})\)=Card\((\mathcal P(\mathbb N))\)=Card\((\mathcal C)\text{.}\)
L'ensemble de Cantor est donc un sous-ensemble borélien de \(\mathbb R\) qui a autant d'éléments que \(\mathbb R\text{,}\) et qui est de mesure de Borel nulle. Tous les sous-ensembles de \(\mathcal C\) sont donc des éléments de la tribu complétée \(\mathscr L(\mathbb R)\text{,}\) et il y en a \(\text{Card}(\mathcal P(\mathbb R))\text{,}\) ce qui est strictement supérieur à Card\((\mathbb R)=\)Card\((\mathscr B(\mathbb R))\text{.}\)
Un résumé de tout ceci:
Subsection 6.2 Un ensemble Lebesgue-mesurable non borélien
Pour mieux comprendre à quoi peut ressembler un tel animal, on va utiliser l'ensemble de Cantor pour construire un exemple concret d'élément de \(\mathscr L(\mathbb R)\setminus\mathscr B(\mathbb R)\text{.}\)
La fonction de Cantor
On définit une fonction \(f:[0,1]\rightarrow [0,1]\) comme suit.
Soit \(x\in [0,1]\text{,}\) d'écriture en base 3
On pose \(N(x) = \min\{k \in \mathbb N, t_k =1\}\) si \(x\) admet des 1 dans son écriture décimale, et \(N(x)=\infty\) sinon.
On pose alors, pour \(n\leq N(x):\)
Alors, pour tout \(n\leq N(x)\text{,}\) \(b_n \in \{0,1\}\) puisque, pour tout \(n\lt N(x)\text{,}\) \(t_n \in \{0,2\}\text{.}\)
On peut donc utiliser les \(b_n\) pour former le développement en base 2 d'un élément de \([0,1]\text{,}\) et on définit ainsi \(f\) par
Remarquons que si l'écriture en base 3 de \(x\) comporte un premier 1 en position \(N\text{,}\) alors on "coupe" le développement binaire de \(f(x)\) à \(N\text{.}\) Donc tous les \(x\) dont la \(N\)-ième "tricimale" \(t_N\) est égale à 1 sont envoyés sur le même réel par \(f\text{.}\)
Par exemple, si \(x\in ]\frac 13, \frac 23[\) alors le développement en base 3 de \(x\) est \(0,1t_2t_3\dots_3\text{,}\) donc \(N=1\) et \(f(x) = \frac 12\text{.}\) Donc \(f\) est constante égale à \(\frac 12\) sur \(]\frac 13, \frac 23[\text{.}\)
On obtient en fait que \(f\) est constante sur chaque intervalle qu'on a enlevé à \([0,1]\) pour construire \(\mathcal C\text{,}\) d'où la forme de la fonction de Cantor, et d'où son surnom: "l'escalier du Diable".
Proposition 6.3.
La fonction \(f\) est continue, croissante sur \([0,1]\text{,}\) vérifie \(f(0) = 0\) et \(f(1)=1\text{,}\) et \(f(\mathcal C)=[0,1]\text{.}\)
Proof.
\(\triangleright\) Continuité de \(f\) : Soient \(x_0\in [0,1],\ \varepsilon>0\text{.}\) L'idée est que pour \(\delta\) assez petit, si \(|x-x_0|\lt \delta\text{,}\) alors les développements de \(x\) et de \(x_0\) en base 3 seront les mêmes pour un grand nombre des premières "tricimales".
Plus précisément, choisissons \(N\) assez grand pour que \(2^{-N} \lt \varepsilon\text{,}\) et prenons \(\delta=3^{-(N+1)}\text{.}\) Alors si \(|x-x_0|\lt \delta\text{,}\) les développements de \(x=\sum_{k\geq1}\frac{t_k}{3^k}\) et de \(x_0 =\sum_{k\geq1}\frac{c_k}{3^k}\) vérifient \(t_n = c_n\) pour tout \(n \leq N\text{.}\) Notons alors comme suit les développements binaires de \(f(x)\) et \(f(x_0)\text{:}\)
Alors \(y_n = d_n\) pour tout \(n \leq N\text{.}\) Donc, dès que \(|x-x_0|\lt \delta\text{,}\)
autrement dit, \(f\) est continue en \(x_0\text{.}\)
Ceci étant vrai pour tout \(x_0 \in [0,1]\text{,}\) \(f\) est continue sur \([0,1]\text{.}\)
\(\triangleright\) Croissance de \(f\text{:}\) Soient \(x,y\in [0,1]\) tels que \(x\lt y\text{.}\) On note
leurs écritures en base 3, et on pose \(n_0=\min\{k\in\mathbb N^*, t_k\neq t'_k\}\text{.}\) Alors, puisque \(x\lt y\text{,}\) on a \(x_{n_0}\lt y_{n_0}\text{.}\)
Par définition de \(f\text{,}\) les développements binaires de \(f(x)\) et \(f(y)\) diffèreront de même en \(n_0\text{,}\) avec la \(n_0\)-ième "bicimale" de \(f(x)\) inférieure ou égale 3 à celle de \(f(y)\text{,}\) donc \(f(x)\leq f(y)\text{.}\)
\(\triangleright\) Surjectivité de \(f:\mathcal C \rightarrow [0,1]\text{:}\) soit \(y\in [0,1]\text{,}\) on note
son développement en base 2. Alors pour tout \(k\text{,}\) \(y_k\in \{0,1\}\text{.}\) Posons \(x_k = 2y_k \in \{0,2\}\) et notons \(x\) l'élément de \([0,1]\) dont le développement en base 3 est donné par les \(x_k\text{:}\)
Alors \(x\in \mathcal C\) puisque son développement en base 3 ne comporte que des 0 et des 2.
De plus, le développement en base 2 de \(f(x)\) est donné par
donc \(y\) a un antécédent dans \(\mathcal C\) par \(f\text{.}\) Ceci étant vrai pour tout \(y\in [0,1]\text{,}\) \(f:\mathcal{C} \rightarrow [0,1]\) est surjective.
Les ensembles non-mesurables: ils sont partout !
Dans la section Section 4, on a construit un ensemble \(V \subset [-1,1]\) qui n'était pas mesurable par la mesure de Lebesgue. On va voir que la situation est pire que ce que l'on croyait: des suppôts non-Lebesgue-mesurables de \(V\) se cachent dans tout ensemble de mesure positive.
Pour cela, on montre le résultat intermédiaire suivant:
Proposition 6.4.
Soit \(E\subset V\) un ensemble mesurable. Alors \(\lambda(E)=0\text{.}\)
Proof.
En reprenant les notations de la preuve de l'existence de \(V\text{,}\) on note \((r_k)_{k\in \mathbb N}\) l'ensemble (dénombrable) des rationnels de \([-2,2]\text{,}\) et on pose \(E_k = r_k +E\text{,}\) pour \(k\in \mathbb N\text{.}\)
Puisque \(E\subset V\) et que les \(V_k = r_k+V\) sont disjoints, on en déduit que les \(E_k\) sont disjoints. De plus, puisque la mesure de Lebesgue est invariante par translation, on a pour tout \(k\text{,}\) \(\lambda(E_k)=\lambda(E)\text{.}\) Mais du coup
Mais puisque \(\bigcup_k E_k \subset \bigcup V_k \subset [-3,3]\text{,}\) on a \(\lambda(\bigcup_k E_k) \leq 6\text{,}\) donc nécessairement \(\lambda(E) =0\text{.}\)
En utilisant cela, on montre qu'en fait, il y a des sous-ensembles non mesurables cachés partout:
Proposition 6.5.
Soit \(A\in \mathcal L(\mathbb R)\) tel que \(\lambda(A)`\gt 0\text{.}\) Alors il existe un sous ensemble \(E\subset A\) non mesurable.
Proof.
Puisque \(\lambda(A)>0\text{,}\) et puisque \(\mathbb R= \bigcup_{n\in\mathbb N} [n,n+1[\text{,}\) il existe un \(n\in \mathbb N\) tel que \(\lambda(A\cap [n, n+1[)>0\text{.}\)
Soit \(B= (A\cap [n, n+1[) -n\text{:}\) autrement dit, on décale \(A\cap [n, n+1[\) de \(n\) vers la gauche. Ainsi, \(B\subset [0,1[\) et \(\lambda(B) >0\text{.}\)
Considérons les ensembles \(V_k=r_k+V\subset[-3,3]\text{:}\) on a vu qu'ils ne sont pas mesurables. Posons, pour chaque \(k\in\mathbb N\text{,}\) \(E_k = B \cap V_k\text{.}\) Si tous les \(E_k\) sont mesurables, alors, puique \(E_k - r_k \subset V\text{,}\) on a donc, d'après la proposition précédente:
pour tout \(k\text{.}\) Mais
donc
ce qui est contradictoire. Il existe donc au moins un \(k\) tel que \(E_k\) n'est pas mesurable, et donc, comme \(E_k \subset B\text{,}\) \(E_k +n \subset A\) est un sous-ensemble non mesurable de \(A\text{.}\)
Construction d'un ensemble Lebesgue-mesurable non borélien
Reprenons la fonction de Cantor \(f\) définie ci-dessus, et posons
Alors \(g\) est continue, comme somme de deux fonctions continues sur \([0,1]\text{,}\) et strictement croissante, donc injective. De plus, \(g(0) = 0, g(1) = 2\) donc par le théorème des valeurs intermédiaires, \(g\) est surjective. C'est donc une bijection continue. Soit \(h = g^{-1} : [0,2]\rightarrow[0,1]\) l'application réciproque. On a:
Lemma 6.6.
La fonction \(h\) est continue.
Proof.
On va montrer que l'image réciproque d'un ouvert de \([0,1]\) par \(h\) est un ouvert. Soit \(U\subset [0,1]\) un ouvert, alors \([0,1]\setminus U\) est un fermé de \([0,1]\text{,}\) qui est compact: donc c'est un compact. Or l'image d'un compact par une application continue est un compact, donc \(g([0,1]\setminus U)\) est un compact de \([0,2]\text{.}\) En particulier, c'est un fermé. Mais alors
est fermé, donc \(h^{-1}(U)\) est bien un ouvert de \([0,2]\text{.}\)
Remark 6.7.
Une bijection continue n'a pas forcément une réciproque continue. Quelques contre-exemples, et éclaircissements sur les cas où ça marche par ici.
On a de plus
Lemma 6.8.
L'ensemble \(g(\mathcal C)\) est de mesure de Lebesgue 1.
Proof.
Calculons la mesure du complémentaire de \(g(\mathcal C)\text{.}\)
Or \([0,1]\setminus \mathcal C\) est une union dénombrable d'intervalles disjoints \(I_k= ]a_k, b_k[\) (les "tiers du milieu" enlevés à chaque étape de la construction de \(\mathcal C\)), donc
Or, puisque \(g\) est croissante continue, \(g(I_k)=]g(a_k), g(b_k)[\) donc
puisque \(f\) est constante sur chaque \(I_k\text{,}\) donc \(f(b_k)=f(a_k)\text{.}\) On a donc \(\lambda(g(I_k)) = \lambda(I_k)\text{,}\) donc, en reprenant notre calcul,
puisque \(\mathcal C\) est de mesure nulle.
Donc la mesure de son complémentaire dans \([0,1]\) est 1. Comme \([0,2]\) est l'union disjointe de \(g(\mathcal C)\) et de \([0,2]\setminus g(\mathcal C)\text{,}\) on en déduit
comme souhaité.
Puisque \(\lambda(g(\mathcal C))>0\text{,}\) \(g(\mathcal C)\) contient un sous-ensemble non mesurable \(E\text{.}\) Soit \(A= g^{-1}(E)\text{.}\) Alors \(A\subset \mathcal C\text{,}\) donc \(A\) est un sous-ensemble d'un ensemble de mesure nulle: \(A\) est négligeable, donc Lebesgue-mesurable, puisque la mesure de Lebesgue est complète.
Or, si \(A\) était un borélien, puisque \(h\) est continue, donc borélienne 4 , on aurait que \(h^{-1}(A)= g(A) = E\) est aussi un borélien. Mais c'est impossible, puisque \(E\) n'est pas mesurable.
Ainsi, \(A\) est un élément de la tribu de Lebesgue qui n'est pas un borélien.