Skip to main content

Section 5.4 Comparaison des tribus de Borel et de Lebesgue

De fait, la tribu de Lebesgue est beaucoup, beaucoup plus grosse que celle de Borel, comme le montre le résultat suivant:

On ne montrera pas le premier point, qui fait intervenir des considérations de théorie des ensembles qui dépassent les ambitions de ce cours. On se contentera d'agiter vaguement les mains en direction d'une façon de le faire.

Pour compter les boréliens, il faut commencer par les comprendre un peu mieux: toute union ou intersection dénombrable d'ouverts ou de fermés est un borélien, mais, même si notre intuition peine à dépasser ce stade, on est loin d'obtenir ainsi tous les boréliens. Le tas d'ensembles obtenu à partir des ouverts par une suite dénombrable d'opérations d'unions, intersections et passage au complémentaire n'est pas lui-même stable par union et intersection dénombrables: ce n'est donc pas une tribu, et ce n'est donc pas celle de Borel.

On définit alors la famille de toutes les unions dénombrables de ces machins-là, la famille de toutes leurs intersections dénombrables, et on intersecte les deux. Et... aucun de ceux-là n'est une tribu. On itère donc ce procédé via une récurrence transfinie (une technique qui, malgré son nom, n'est probablement pas enseigné à Poudlard). On obtient ainsi une hiérarchie de familles de sous-ensembles de plus en plus grosses, dont l'union donne les boréliens.

C'est en gardant trace de combien d'éléments comportent ces familles que l'on peut conclure que Card\((\mathscr B(\mathbb R))=\)Card\((\mathbb R)\text{.}\)

Le deuxième point, en revanche, est à notre portée, et nous donne en plus l'opportunité de parler d'un des ensembles les plus échevelés parmi les parties de \(\mathbb R\) suffisamment connues pour avoir un nom: l'ensemble de Cantor.

L'idée est la suivante: on va construire un borélien \(A\) de mesure nulle, et de même cardinal que \(\mathbb R\text{.}\) Alors \(\mathcal P(A)\subset \mathscr N(\mu)\subset \mathscr L(\mathbb R)\subset \mathcal P(\mathbb R)\) (où \(\mu\) est la mesure de Borel), et d'une autre côté, Card\((\mathcal P(A))=\)Card\((\mathcal P(\mathbb R))\text{,}\) ce qui nous donne Card \(\mathscr L (\mathbb R)=\) Card\((\mathcal P(\mathbb R))\text{.}\)

Subsection 5.4.1 Un ensemble Lebesgue-mesurable non borélien

Par des considérations plutôt abstraites de cardinalité, on s'est assurés que la tribu de Lebesgue a plus d'éléments que celle de Borel.

Pour mieux comprendre à quoi peut ressembler un tel animal, on va utiliser l'ensemble de Cantor pour construire un exemple concret d'élément de \(\mathscr L(\mathbb R)\setminus\mathscr B(\mathbb R)\text{.}\)

La fonction de Cantor

Figure 5.4.2. La fonction de Cantor

On définit une fonction \(f:\rbb 0,1\lbb \rightarrow \rbb 0,1\lbb \) comme suit.

Soit \(x\in \rbb 0,1\lbb \text{,}\) d'écriture en base 3

\begin{equation*} x = \sum_{k\geq1}\frac{t_k}{3^k} \end{equation*}

On pose \(N(x) = \min\{k \in \mathbb N, t_k =1\}\) si \(x\) admet des 1 dans son écriture décimale, et \(N(x)=\infty\) sinon.

On pose alors, pour \(n\leq N(x):\)

\begin{equation*} b_n= \begin{cases} \frac{t_n}2 \text{ si } n\lt N(x) \\ 1 \text{ si } n=N(x) \end{cases} \end{equation*}

Alors, pour tout \(n\leq N(x)\text{,}\) \(b_n \in \{0,1\}\) puisque, pour tout \(n\lt N(x)\text{,}\) \(t_n \in \{0,2\}\text{.}\)

On peut donc utiliser les \(b_n\) pour former le développement en base 2 d'un élément de \(\rbb 0,1\lbb \text{,}\) et on définit ainsi \(f\) par

\begin{equation*} f(x)= \sum_{j=1}^{N(x)} \frac{b_j}{2^j}\in\rbb 0,1\lbb . \end{equation*}

Remarquons que si l'écriture en base 3 de \(x\) comporte un premier 1 en position \(N\text{,}\) alors on "coupe" le développement binaire de \(f(x)\) à \(N\text{.}\) Donc tous les \(x\) dont la \(N\)-ième "tricimale" \(t_N\) est égale à 1 sont envoyés sur le même réel par \(f\text{.}\)

Par exemple, si \(x\in \lbb \frac 13, \frac 23\rbb \) alors le développement en base 3 de \(x\) est \(0,1t_2t_3\dots_3\text{,}\) donc \(N=1\) et \(f(x) = \frac 12\text{.}\) Donc \(f\) est constante égale à \(\frac 12\) sur \(\lbb \frac 13, \frac 23\rbb \text{.}\)

On obtient en fait que \(f\) est constante sur chaque intervalle qu'on a enlevé à \(\rbb 0,1\lbb \) pour construire \(\mathcal C\text{,}\) d'où la forme de la fonction de Cantor, et d'où son surnom: "l'escalier du Diable".

\(\triangleright\) Continuité de \(f\) : Soient \(x_0\in \rbb 0,1\lbb ,\ \varepsilon>0\text{.}\) L'idée est que pour \(\delta\) assez petit, si \(|x-x_0|\lt \delta\text{,}\) alors les développements de \(x\) et de \(x_0\) en base 3 seront les mêmes pour un grand nombre des premières "tricimales".

Plus précisément, choisissons \(N\) assez grand pour que \(2^{-N} \lt \varepsilon\text{,}\) et prenons \(\delta=3^{-(N+1)}\text{.}\) Alors si \(|x-x_0|\lt \delta\text{,}\) les développements de \(x=\sum_{k\geq1}\frac{t_k}{3^k}\) et de \(x_0 =\sum_{k\geq1}\frac{c_k}{3^k}\) vérifient \(t_n = c_n\) pour tout \(n \leq N\text{.}\) Notons alors comme suit les développements binaires de \(f(x)\) et \(f(x_0)\text{:}\)

\begin{equation*} f(x_0) = \sum_{j=1}^\infty \frac{d_j}{2^j}, \quad f(x) = \sum_{j=1}^\infty \frac{y_j}{2^j} \end{equation*}

Alors \(y_n = d_n\) pour tout \(n \leq N\text{.}\) Donc, dès que \(|x-x_0|\lt \delta\text{,}\)

\begin{equation*} |f(x)-f(x_0)| \leq \sum_{j=N+1}^\infty \frac{|y_j-d_j|}{2^j} \leq \frac1{2^N} \lt \varepsilon; \end{equation*}

autrement dit, \(f\) est continue en \(x_0\text{.}\)

Ceci étant vrai pour tout \(x_0 \in \rbb 0,1\lbb \text{,}\) \(f\) est continue sur \(\rbb 0,1\lbb \text{.}\)

\(\triangleright\) Croissance de \(f\text{:}\) Soient \(x,y\in \rbb 0,1\lbb \) tels que \(x\lt y\text{.}\) On note

\begin{equation*} x=\sum_{k\geq1}\frac{x_k}{3^k},\ y=\sum_{k\geq1}\frac{y_k}{3^k} \end{equation*}

leurs écritures en base 3, et on pose \(n_0=\min\{k\in\mathbb N^*, t_k\neq t'_k\}\text{.}\) Alors, puisque \(x\lt y\text{,}\) on a \(x_{n_0}\lt y_{n_0}\text{.}\)

Par définition de \(f\text{,}\) les développements binaires de \(f(x)\) et \(f(y)\) diffèreront de même en \(n_0\text{,}\) avec la \(n_0\)-ième "bicimale" de \(f(x)\) inférieure ou égale 1  à celle de \(f(y)\text{,}\) donc \(f(x)\leq f(y)\text{.}\)

\(\triangleright\) Surjectivité de \(f:\mathcal C \rightarrow \rbb 0,1\lbb \text{:}\) soit \(y\in \rbb 0,1\lbb \text{,}\) on note

\begin{equation*} y = \sum_{k\geq 1}\frac{y_k}{2^k} \end{equation*}

son développement en base 2. Alors pour tout \(k\text{,}\) \(y_k\in \{0,1\}\text{.}\) Posons \(x_k = 2y_k \in \{0,2\}\) et notons \(x\) l'élément de \(\rbb 0,1\lbb \) dont le développement en base 3 est donné par les \(x_k\text{:}\)

\begin{equation*} x = \sum_{k\geq 1}\frac{x_k}{3^k} = \sum_{k\geq 1}\frac{2y_k}{3^k} \end{equation*}

Alors \(x\in \mathcal C\) puisque son développement en base 3 ne comporte que des 0 et des 2.

De plus, le développement en base 2 de \(f(x)\) est donné par

\begin{equation*} f(x)= \sum_{j=1}^\infty \frac{x_j/2}{2^j} = \sum_{j=1}^\infty \frac{y_j}{2^j} =y, \end{equation*}

donc \(y\) a un antécédent dans \(\mathcal C\) par \(f\text{.}\) Ceci étant vrai pour tout \(y\in \rbb 0,1\lbb \text{,}\) \(f:\mathcal{C} \rightarrow \rbb 0,1\lbb \) est surjective.

Les ensembles non-mesurables: ils sont partout !

Dans un épisode précédent  2 , on a construit un ensemble \(V \subset \rbb -1,1\lbb \) qui n'était pas mesurable par la mesure de Lebesgue. On va voir que la situation est pire que ce que l'on croyait: des suppôts non-Lebesgue-mesurables de \(V\) se cachent dans tout ensemble de mesure positive.

Pour cela, on montre le résultat intermédiaire suivant:

En reprenant les notations de la preuve de l'existence de \(V\text{,}\) on note \((r_k)_{k\in \mathbb N}\) l'ensemble (dénombrable) des rationnels de \(\rbb -2,2\lbb \text{,}\) et on pose \(E_k = r_k +E\text{,}\) pour \(k\in \mathbb N\text{.}\)

Puisque \(E\subset V\) et que les \(V_k = r_k+V\) sont disjoints, on en déduit que les \(E_k\) sont disjoints. De plus, puisque la mesure de Lebesgue est invariante par translation, on a pour tout \(k\text{,}\) \(\lambda(E_k)=\lambda(E)\text{.}\) Mais du coup

\begin{equation*} \lambda(\bigcup_k E_k) = \sum_k \lambda(E_k)=\sum_k \lambda(E)= \lambda(E)\sum_k 1 = \begin{cases} \infty \text{ si } \lambda(E)>0\\ 0 \text{ si } \lambda(E)=0. \end{cases} \end{equation*}

Mais puisque \(\bigcup_k E_k \subset \bigcup V_k \subset \rbb -3,3\lbb \text{,}\) on a \(\lambda(\bigcup_k E_k) \leq 6\text{,}\) donc nécessairement \(\lambda(E) =0\text{.}\)

En utilisant cela, on montre qu'en fait, il y a des sous-ensembles non mesurables cachés partout:

Puisque \(\lambda(A)>0\text{,}\) et puisque \(\mathbb R= \bigcup_{n\in\mathbb N} \rbb n,n+1\rbb \text{,}\) il existe un \(n\in \mathbb N\) tel que \(\lambda(A\cap \rbb n, n+1\rbb )>0\text{.}\)

Soit \(B= (A\cap \rbb n, n+1\rbb ) -n\text{:}\) autrement dit, on décale \(A\cap \rbb n, n+1\rbb \) de \(n\) vers la gauche. Ainsi, \(B\subset \rbb 0,1\rbb \) et \(\lambda(B) >0\text{.}\)

Considérons les ensembles \(V_k=r_k+V\subset\rbb -3,3\lbb \text{:}\) on a vu qu'ils ne sont pas mesurables. Posons, pour chaque \(k\in\mathbb N\text{,}\) \(E_k = B \cap V_k\text{.}\) Si tous les \(E_k\) sont mesurables, alors, puique \(E_k - r_k \subset V\text{,}\) on a donc, d'après la proposition précédente:

\begin{equation*} \lambda(E_k - r_k) = \lambda(E_k) = 0 \end{equation*}

pour tout \(k\text{.}\) Mais

\begin{equation*} \bigcup_k E_k = \bigcup_k (B \cap V_k)= B\cap \bigcup_k V_k = B \cap \rbb 0,1\lbb = B \end{equation*}

donc

\begin{equation*} 0\lt \lambda(B) = \sum_k \lambda(E_k) = \sum_k 0 = 0, \end{equation*}

ce qui est contradictoire. Il existe donc au moins un \(k\) tel que \(E_k\) n'est pas mesurable, et donc, comme \(E_k \subset B\text{,}\) \(E_k +n \subset A\) est un sous-ensemble non mesurable de \(A\text{.}\)

Construction d'un ensemble Lebesgue-mesurable non borélien

Reprenons la fonction de Cantor \(f\) définie ci-dessus, et posons

\begin{align*} g: \rbb 0,1\lbb \amp \rightarrow \rbb 0,2\lbb \\ x \amp \mapsto x + f(x) \end{align*}

Alors \(g\) est continue, comme somme de deux fonctions continues sur \(\rbb 0,1\lbb \text{,}\) et strictement croissante, donc injective. De plus, \(g(0) = 0, g(1) = 2\) donc par le théorème des valeurs intermédiaires, \(g\) est surjective. C'est donc une bijection continue. Soit \(h = g^{-1} : \rbb 0,2\lbb \rightarrow\rbb 0,1\lbb \) l'application réciproque. On a:

On va montrer que l'image réciproque d'un ouvert de \(\rbb 0,1\lbb \) par \(h\) est un ouvert. Soit \(U\subset \rbb 0,1\lbb \) un ouvert, alors \(\rbb 0,1\lbb \setminus U\) est un fermé de \(\rbb 0,1\lbb \text{,}\) qui est compact: donc c'est un compact. Or l'image d'un compact par une application continue est un compact, donc \(g(\rbb 0,1\lbb \setminus U)\) est un compact de \(\rbb 0,2\lbb \text{.}\) En particulier, c'est un fermé. Mais alors

\begin{equation*} \rbb 0,2\lbb \setminus h^{-1}(U) = h^{-1}(\rbb 0,1\lbb \setminus U) = g(\rbb 0,1\lbb \setminus U) \end{equation*}

est fermé, donc \(h^{-1}(U)\) est bien un ouvert de \(\rbb 0,2\lbb \text{.}\)

Remarque 5.4.7.

Une bijection continue n'a pas forcément une réciproque continue. Quelques contre-exemples, et éclaircissements sur les cas où ça marche par ici 3 .

On a de plus

Calculons la mesure du complémentaire de \(g(\mathcal C)\text{.}\)

\begin{equation*} \lambda(\rbb 0,2\lbb \setminus g(\mathcal C)) = \lambda(\rbb 0,2\lbb \setminus h^{-1}(\mathcal C)) = \lambda(h^{-1}(\rbb 0,1\lbb \setminus \mathcal C)) = \lambda(g(\rbb 0,1\lbb \setminus \mathcal C)) \end{equation*}

Or \(\rbb 0,1\lbb \setminus \mathcal C\) est une union dénombrable d'intervalles disjoints \(I_k= \lbb a_k, b_k\rbb \) (les "tiers du milieu" enlevés à chaque étape de la construction de \(\mathcal C\)), donc

\begin{equation*} \lambda(g(\rbb 0,1\lbb \setminus \mathcal C)) = \lambda\left(g\big(\bigcup_k I_k\big)\right) = \lambda\left(\bigcup_k g(I_k)\right) = \sum \lambda(g(I_k)) \end{equation*}

Or, puisque \(g\) est croissante continue, \(g(I_k)=\lbb g(a_k), g(b_k)\rbb \) donc

\begin{equation*} \lambda(g(I_k)) = g(b_k)-g(a_k) = (b_k + f(b_k)) - (a_k + f(a_k)) = (b_k - a_k) + (f(b_k)-f(a_k)) = b_k - a_k, \end{equation*}

puisque \(f\) est constante sur chaque \(I_k\text{,}\) donc \(f(b_k)=f(a_k)\text{.}\) On a donc \(\lambda(g(I_k)) = \lambda(I_k)\text{,}\) donc, en reprenant notre calcul,

\begin{equation*} \lambda(\rbb 0,2\lbb \setminus g(\mathcal C)) = \sum_k \lambda(I_k) =\lambda(\rbb 0,1\lbb \setminus \mathcal C)= 1, \end{equation*}

puisque \(\mathcal C\) est de mesure nulle.

Donc la mesure de son complémentaire dans \(\rbb 0,1\lbb \) est 1. Comme \(\rbb 0,2\lbb \) est l'union disjointe de \(g(\mathcal C)\) et de \(\rbb 0,2\lbb \setminus g(\mathcal C)\text{,}\) on en déduit

\begin{equation*} \lambda(g(\mathcal C)) = \lambda(\rbb 0,2\lbb ) - \lambda(\rbb 0,2\lbb \setminus g(\mathcal C)) = 1, \end{equation*}

comme souhaité.

Puisque \(\lambda(g(\mathcal C))>0\text{,}\) \(g(\mathcal C)\) contient un sous-ensemble non mesurable \(E\text{.}\) Soit \(A= g^{-1}(E)\text{.}\) Alors \(A\subset \mathcal C\text{,}\) donc \(A\) est un sous-ensemble d'un ensemble de mesure nulle: \(A\) est négligeable, donc Lebesgue-mesurable, puisque la mesure de Lebesgue est complète.

Or, si \(A\) était un borélien, puisque \(h\) est continue, donc borélienne 4 , on aurait que \(h^{-1}(A)= g(A) = E\) est aussi un borélien. Mais c'est impossible, puisque \(E\) n'est pas mesurable.

Ainsi, \(A\) est un élément de la tribu de Lebesgue qui n'est pas un borélien.

on aura égalité dans les cas où \(N(x)=N(y)\leq n_0\)
Preuve du théorème Théorème 2.3.2
fr.wikipedia.org/wiki/Th%C3%A9or%C3%A8me_de_la_bijection#Hom%C3%A9omorphisme
L'image réciproque d'un borélien par \(h\) est un borélien; voir chapitre suivant