Skip to main content

Section 5.2 L'ensemble de Cantor

Au vu des exemples croisés jusqu'ici, on peut se demander s'il existe dans \(\mathbb R\) des ensembles \(\mu_1\)-négligeables qui ne soient pas dénombrables.

On va voir que c'est le cas: on va construire un ensemble de mesure nulle et non dénombrable dans \(\mathbb R\text{;}\) puis on s'en servira pour construire des exemples de sous-ensembles \(\mu_1\)-négligeables mais pas boréliens.

On part de l'intervalle \(\rbb 0,1\lbb \) et on itère l'opération "enlever le tiers du milieu":

  • A l'étape 1, on enlève à \(A_0=\rbb 0,1\lbb \) l'intervalle \(\left]\, \frac13, \frac 23\right[\, \text{.}\) Il nous reste

    \begin{equation*} A_1=\left[\, 0,\frac13\right]\, \cup\,\left[\, \frac23, 1\right[ \end{equation*}
  • On enlève le tiers du milieu de chacun de ces sous-intervalles: on enlève \(\left]\, \frac 19, \frac 29\right[\,\) à \(\left[\, 0,\frac13\right]\,\) et \(\left]\, \frac 79, \frac 89\right[\,\) à \(\left[, \frac23,1\right[ \text{.}\) Il nous reste

    \begin{equation*} A_2=\left[\, 0,\frac19\right[\, \cup\left[\, \frac29,\frac13\right[\, \cup\,\left[\, \frac23, \frac79\,\right[\, \cup\,\left[\, \frac89, 1\,\right[\, \end{equation*}
  • On itère ce procédé: pour \(n\in\mathbb N\)

    \begin{equation*} A_{n+1}= \frac{A_n}3 \cup \frac{2+A_n}3. \end{equation*}

    Ainsi, pour tout \(n\text{,}\) \(A_n\) est l'union de \(2^n\) intervalles fermés, deux à deux disjoints, chacun de longueur \(3^{-n}\text{.}\) Les extrémités de ces intervalles sont les \(2^{n+1}\) points de la forme

    \begin{equation*} \frac{\varepsilon_n}{3^n}+\sum_{k=1}^n\frac{t_k}{3^k} \text{ avec } \varepsilon_n\in\{0,1\},\ t_k\in\{0,2\} \end{equation*}

    les points avec \(\varepsilon_n=0\) donnent les extrémités gauches, et ceux avec \(\varepsilon_n=1\) donnent les extrémités droites.

    Remarquons que ces points demeurent des extrémités d'intervalles à chaque étape ultérieure: on a à la fois

    \begin{equation*} A_{n+1}\subset A_n \text{ et } \partial A_n \subset \partial A_{n+1}. \end{equation*}

L'ensemble de Cantor est l'intersection décroissante des \(A_n\text{:}\) \(\mathcal C = \bigcap_n A_n\text{.}\) C'est "ce qui reste" après une infinité d'étapes.

Figure 5.2.1. Etapes de la construction de l'ensemble de Cantor

Remarquons que \(\mathcal C\) est un fermé (comme intersection des fermés \(A_n\)), et de mesure de Borel nulle puisque \(\mu_1(A_0)=1\lt\infty\text{,}\) donc, par continuité monotone séquentielle,

\begin{equation*} \mu_1(\mathcal C)= \lim_{n\rightarrow\infty} \mu_1(A_n)=\lim_{n\rightarrow\infty}\left(\frac23\right)^n =0. \end{equation*}

Une autre façon de décrire à \(\mathcal C\) utilise l'écriture en base 3 des éléments de \(\rbb 0,1\lbb \text{.}\) On est plus habitué à les écrire en base 10: c'est ce qu'on appelle le développement décimal  1  de \(x \in \rbb 0,1\lbb \text{,}\)

\begin{equation*} x=0,d_1d_2d_3\dots = \sum_{k\geq1}\frac{d_k}{10^k} \end{equation*}

où les décimales \(d_k\) sont des entiers entre 0 et 9.

Mais il existe d'autres façons d'écrire les nombres : en base 2, par exemple, on aura \(x =\sum_{k\geq1}\frac{b_k}{2^k}\) avec \(b_k\in \{0,1\}\text{.}\) C'est ce que l'on appelle l'écriture binaire de \(x\text{,}\) particulièrement utile en informatique.

Ici, donc, on va utiliser l'écriture en base 3. Pour \(x\in \rbb 0,1\lbb \text{,}\) il existe des entiers \(t_k\in\{0,1,2\}\) tels que

\begin{equation*} x=\sum_{k\geq1}\frac{t_k}{3^k} \end{equation*}

Par exemple, l'écriture en base 3 de 1 correspond à \(t_k=2\) pour tout \(k\text{,}\) puisque

\begin{equation*} \sum_{k\geq1}\frac2{3^k} = 2 \sum_{k\geq1}\frac1{3^k}=2 \left(\sum_{k\geq0}\frac1{3^k} - 1\right)=2\left(\frac 1{1-\frac 13} - 1 \right)=1 \end{equation*}

et l'écriture de \(\frac13\) est donnée soit par \(t_1=1, t_k =0 \, \forall k\geq 2\text{,}\) soit par \(t_1=0, t_k=2 \, \forall k\geq 2\text{.}\)

Avec ces notations, l'ensemble de Cantor peut être décrit comme l'ensemble des éléments de \(\rbb 0,1\lbb \) dont une des écritures en base 3 ne comporte que des 0 et des 2.

En effet, à la première étape, on enlève tous les éléments entre \(\frac 13\) et \(\frac23\text{:}\) ce sont ceux la première "décimale" en base 3 vaut \(t_1=1\text{.}\) A l'étape 2, on enlève tous ceux qui vérifient \(t_2=1\text{.}\) Et ainsi de suite: à l'infini, il ne reste que les nombres dont l'écriture en base 3 ne comporte que des 0 et des 2.

Plus rigoureusement, on a, pour tous \(n,p\text{:}\)

\begin{equation*} \partial A_n = \left\{\frac{\varepsilon_n}{3^n}+\sum_{k=1}^n\frac{t_k}{3^k},\ \varepsilon_n\in\{0,1\},\ t_k\in\{0,2\}\right\}\subset \partial A_{n+p}\subset A_{n+p} \end{equation*}

donc \(\partial A_n \subset \mathcal C=\bigcap_{p\geq 0}A_{n+p}\text{.}\) Puisque \(\mathcal C\) est fermé, on en déduit que

\begin{equation*} \left\{x \in \rbb 0,1\lbb ,\ x = \sum_{k\geq1}\frac{t_k}{3^k},\ t_k\in\{0,2\}\right\}\subset \overline{\bigcup_{n\geq 1} \partial A_n} \subset \mathcal C. \end{equation*}

Or, l'ensemble de gauche est exactement celui des éléments de \(\rbb 0,1\lbb \) dont l'écriture en base 3 ne comporte pas de 1.

Réciproquement, si \(x\in \mathcal C\text{,}\) alors pour tout \(n\geq 1\text{,}\) \(x\in A_n\text{,}\) donc \(x\) est dans l'un des intervalles qui constituent \(A_n\text{.}\) En particulier, \(x\) est à distance au plus \(3^{-n}\) de l'extrémité gauche de cet intervalle, qui est de la forme

\begin{equation*} x^{(n)}= \sum_{k=1}^n\frac{t^{(n)}_k}{3^k},\ t^{(n)}_k\in\{0,2\} \end{equation*}

Montrons que pour un \(k\) donné, la suite \((t^{(n)}_k)_{n\geq k}\) est constante. Cela signifie que le développement en base 3 de \(x^{(n+1)}\) est obtenu en ajoutant une \((n+1)\)-ième "tricimale" à celui de \(x^{(n)}\) (sans changer les précédentes).

Puisque \(x^{(n)}\) est à distance au plus \(3^{-n}\) de \(x\) et \(x^{(n+1)}\) est à distance au plus \(3^{-(n+1)}\text{,}\) on a:

\begin{equation*} -\frac1{3^{n+1}}=\left(x-\frac1{3^{n+1}}\right)-x\leq x^{(n+1)}-x^{(n)}\leq x+\left(-x+\frac 1{3^n}\right)=\frac 1{3^n} \end{equation*}

d'où \(| x^{(n+1)}-x^{(n)}|\leq \frac 1{3^n}\text{.}\)

D'un autre côté, si l'une des \(n\) premières ``tricimales'' de \(x^{(n+1)}\) était différentes de celles de \(x^{(n)}\text{,}\) on aurait \(k_0:=\min\{k\ |\ t^{(n)}_k\neq t^{(n+1)}_k\}\leq n\text{,}\) et alors

\begin{equation*} | x^{(n+1)}-x^{(n)}| \geq \frac 2{3 ^{k_0}}-\frac 2{3^{n+1}}-\sum_{k=k_0+1}^n\frac 2{3^k} =\frac 1{3 ^{k_0}}+\frac 1{3^{n+1}}>\frac 1{3^n}, \end{equation*}

ce qui est contradictoire. La suite \((t^{(n)}_k)_{n\geq k}\) est donc constante, disons égale à \(t_k\text{.}\) On a donc pour tout \(n\text{,}\)

\begin{equation*} x=\lim_{n\rightarrow\infty} x^{(n)}=\lim_{n\rightarrow\infty}\sum_{k=1}^n \frac{t_k}{3^k} = \sum_{k=1}^\infty \frac{t_k}{3^k}. \end{equation*}

Subsection 5.2.1 Cardinal de \(\mathcal C\)

On va utiliser cette écriture pour montrer que Card\((\mathcal C)\)=Card\((\mathbb R)\text{,}\) ce qui montrera que l'ensemble de Cantor n'est pas dénombrable. On a obtenu

\begin{equation*} \mathcal C = \left\{x \in \rbb 0,1\lbb ,\ x = \sum_{k\geq1}\frac{t_k}{3^k},\ t_k\in\{0,2\}\right\} \end{equation*}

On définit une bijection entre \(\mathcal C\) et l'ensemble des parties de \(\mathbb N\text{,}\) \(\mathcal P(\mathbb N)\) par

\begin{align*} f: \mathcal P(\mathbb N^*) \amp \rightarrow \mathcal C\\ A \amp\mapsto \sum_{k\geq1}\frac{2 \cdot \mathbb{1}_A(k-1)}{3^k} \end{align*}

\(\triangleright\) Le réel \(f(A)\) est bien un élément de \(\mathcal C\) puisque son écriture en base 3 ne comporte que des 0 et des 2.

\(\triangleright\) \(f\) est injective: si \(f(A) = f(B)\text{,}\) alors pour tout \(i\in\mathbb N\text{,}\) \(\mathbb{1}_A(i) = \mathbb{1}_B(i)\text{,}\) donc

\begin{equation*} i \in A \iff \mathbb{1}_A(i)=1 \iff \mathbb{1}_B(i)=1 \iff i \in B, \end{equation*}

autrement dit, \(A=B\text{.}\)

\(\triangleright\) \(f\) est surjective: pour tout \(x = \sum_{k\geq1}\frac{t_k}{3^k} \in \mathcal C\text{,}\) \(x=f(A)\)\(A =\{k\in \mathbb N, t_{k+1}=2\}\text{.}\)

Or, un résultat classique de théorie des ensembles assure qu'il n'y a pas de bijection entre \(\mathbb N\) et \(\mathcal P(\mathbb N)\) et plus généralement, entre \(A\) et \(\mathcal P(A)\text{,}\) quel que soit l'ensemble \(A\text{,}\) comme expliqué à 5:15 dans cette excellente vidéo:

donc il n'y a pas de bijection entre \(\mathbb N\) et \(\mathcal C\text{.}\) Donc \(\mathcal C\) n'est pas dénombrable.

De plus, Card(\(\mathcal P(\mathbb N)\))=Card(\(\{0,1\}^\mathbb N\)), via la bijection \(A\mapsto \mathbb{1}_A\text{,}\) et par ailleurs, on peut définir une bijection entre \(\rbb 0,1\rbb \) et \(\{0,1\}^\mathbb N\) par

\begin{align*} g:\rbb 0,1\rbb \amp \rightarrow\{0,1\}^\mathbb N \\ x\amp \mapsto (x_n)_{n\in\mathbb N} \text{ avec } \begin{cases} x_0 = E(2x)\\ x_n=E(2^{n+1}(x-\sum_{k=0}^{n-1} \frac {x_k}{2^{k+1}})),\ n\geq 1 \end{cases} \end{align*}

donc, \(g(x)\) est le développement de \(x\) en base 2 et on a \(x=\sum_{k\geq 0}\frac {x_k}{2^{n+1}}\text{.}\) On a donc bien Card\((\mathbb R)\)= 2  Card\((\rbb 0,1\rbb )\)=Card\((\{0,1\}^{\mathbb N})\)=Card\((\mathcal P(\mathbb N))\)=Card\((\mathcal C)\text{.}\)

L'ensemble de Cantor est donc un sous-ensemble borélien de \(\mathbb R\) qui a autant d'éléments que \(\mathbb R\text{,}\) et qui est de mesure de Borel nulle. Tous les sous-ensembles de \(\mathcal C\) sont donc des éléments de la tribu complétée \(\mathscr L(\mathbb R)\text{,}\) et il y en a \(\text{Card}(\mathcal P(\mathbb R))\text{,}\) ce qui est strictement supérieur à Card\((\mathbb R)=\)Card\((\mathscr B(\mathbb R))\text{.}\)

Un résumé de tout ceci:

Notons que cette écriture n'est pas unique: ainsi, 1=0.9999999....admet deux développements décimaux.
Au fait, pourquoi ?