Skip to main content

Section 2.3 Le retour des problèmes

Quand il s'agit d'intervalles, l'inégalité

\begin{equation*} |I\cup J| \leq |I|+|J| = \ell(I)+\ell(J) \end{equation*}

vient uniquement du double comptage de l'intersection \(I\cap J\) dans \(\ell(I)+\ell(J)\text{.}\)

Mais si \(I\) et \(J\) sont distincts, alors on a une superbe égalité:

\begin{equation*} |I\cup J| = |I|+|J| \end{equation*}

Exercice 2.3.1. Union disjointe dintervalles ouverts.

Montrons ce résultat ! Soient donc \(I,J\) deux intervalles disjoints. Non vides, sinon ce n'est pas très passionnant.

Puisque la mesure extérieure est sous-additive, on sait déjà que

\begin{equation*} |I\cup J| \leq |I| + |J| \end{equation*}

donc il nous suffit de montrer que

\begin{equation*} |I| + |J| \leq |I\cup J| \end{equation*}

(a)

Montrer que, si \(|I| = +\infty\) ou \(|J| = +\infty\text{,}\) alors on a bien

\begin{equation*} |I\cup J| = |I|+|J| \end{equation*}

(b)

Supposons donc que

\begin{equation*} a=\inf I,\ b=\sup I,\ c= \inf J,\ d=\sup J \end{equation*}

sont tous de braves réels finis. On suppose que \(a\leq c\text{,}\) ce qui ne porte pas spécialement à conséquence.

On a 4 cas possibles:

et \(I\) et \(J\) ne sont disjoints que si \(b\leq c\text{.}\)

Montrer que, si \(b=c\text{,}\) alors on a bien

\begin{equation*} |I| + |J| \leq |I\cup J| \end{equation*}

 1 

(c)

On suppose maintenant que \(b \lt c\text{,}\) et on note \(\delta=c-b \gt0\text{.}\)

Soit \(\varepsilon \gt 0\text{,}\) justifier qu'il existe une suite \(I_n\) d'intervalles tels que

\begin{equation*} |I\cup J| + \varepsilon \gt \sum_{n\in\N} \ell(I_n) \end{equation*}
Indice.

La mesure extérieure \(|I\cup J|\) est une borne inférieure: qu'est-ce que ça implique sur \(|I\cup J|+\varepsilon\) ?

(d)

Montrer que, pour tout \(n\in \N\text{,}\) on peut trouver des intervalles \(I_{j,n},j=1,...,k_n\) tels que

\begin{equation*} \ell(I_{j,n}) \lt \delta \text{ et } I_n=\cup_{j=0}^{k_n} I_{j,n} \end{equation*}

et que, dans ce cas,

\begin{equation*} I_{j,n}\cap I\cap J = \emptyset \end{equation*}
Indice.

Si \(I_n= \rbb a_n, b_n \rbb\text{,}\) prenons \(M\in\N\) assez grand pour que

\begin{equation*} \frac{b_n - a_n}{M} \\lt \frac{\delta}2 \end{equation*}

et considérer, pour \(j=1,\ldots,M\)

\begin{equation*} I_{j,n}= \,\left[, a_n+(j-1)\frac{b_n-a_n}M, a_n+j\frac{b_n-a_n}M\, \right[\,. \end{equation*}

(e)

En déduire qu'il existe deux ensembles disjoints \(A,B\in\N\times\N\) tels que

\begin{equation*} I\subset \sum_{(n,j)\in A} I_{j,n}, J\subset \sum_{(n,j)\in B} I_j,n \end{equation*}

Conclure que

\begin{equation*} |I| + |J| \leq |I\cup J|+\varepsilon \end{equation*}

(f)

Eliminer le \(\varepsilon\gt 0\text{.}\)

Cette astuce s'appelle "se donner un \(\varepsilon\) de place": lorsqu'on veut obtenir une inégalité \(Truc \leq Machin\text{,}\) surtout quand on a des bornes inf ou sup, il est souvent plus facile de montrer que \(Truc \leq Machin+\varepsilon\text{,}\) même si \(\varepsilon\) est microscopique.

Terrence Tao, un mathématicien pas trop mauvais  2  , expose les mutliples applications de ce principe sur son excellent blog 3 , et a donné ce titre à son non moins excellent manuel d'analyse "An Epsilon Of Room".

Puisque la mesure extérieure généralise la longueur des intervalles, et jusqu'ici le fait avec talent, on se prend à espérer que l'additivité continue de marcher pour n'importe quels \(A,B\subset \R\) disjoints.

Mais non.

Exercice 2.3.2. Abominable contre-exemple de Vitali.

(a)

Pour chaque \(a\in \rbb -1,1\lbb \text{,}\) on définit l'ensemble:

\begin{equation*} C_a = \{x \in \rbb -1,1\lbb , x-a \in \mathbb Q\} \end{equation*}

 4 

Montrer que

\begin{equation*} \rbb -1,1\lbb = \bigcup_{a\in\rbb -1,1\lbb }C_a \end{equation*}
Indice.

Remarquer que \(a\in C_a\text{,}\) pour tout \(a\in \rbb -1,1\lbb\text{.}\)

Spoiler.

On procède par double inclusion:

\(\boxed{\subset}\) Soit \(a\in \rbb -1,1\lbb\text{.}\) Alors \(a-a=0\in \mathbb Q\) donc

\begin{equation*} a\in C_a \subset \bigcup_{a\in\rbb -1,1\lbb }C_a \end{equation*}

\(\boxed{\supset}\) Pour tout \(a\in \rbb -1,1\lbb\text{,}\) \(C_a \subset \rbb -1,1\lbb \text{,}\) donc \(\bigcup_{a\in\rbb -1,1\lbb }C_a \subset \rbb -1,1\lbb \text{.}\)

(b)

Montrer que, pour tous \(a,b\in \rbb -1,1\lbb\text{,}\) on a

\begin{equation*} C_a\cap C_b=\emptyset \text{ ou } C_a=C_b \end{equation*}
Spoiler.

Supposons qu'il existe \(x \in C_a \cap C_b\) 5  et montrons qu'alors, forcément, \(C_a=C_b\text{.}\)

Soit \(y\in C_a\text{,}\) montrons que \(y\in C_b\) (l'autre inclusion se montre de la même façon).

On sait donc que \(y-a \in \mathbb Q\text{.}\)

D'un autre côté, puisque \(x\in C_a \cap C_b\text{,}\)

\begin{equation*} \begin{cases} x-a \in \mathbb Q \\ x-b \in \mathbb Q. \end{cases} \end{equation*}

du coup

\begin{equation*} y-b = \underbrace{(y-a)}_{\in \Q} + \underbrace{(a-x)}_{\in \Q} + \underbrace{(x-b)}_{\in \Q} \end{equation*}

Donc \(y-b\in\Q\text{,}\) autrement dit \(y\in C_b\text{.}\)

On montre exactement de la même façon que \(C_b \subset C_a\text{,}\) donc \(C_a = C_b\text{.}\)

Donc, si \(C_a\) et \(C_b\) ne sont pas disjoints, alors \(C_a=C_b\text{.}\)

(c)

Une fois éliminés des \(C_a\) en double, on a donc obtenu que les \((C_a)_a\) restants forment une partition de \(\rbb -1,1\lbb\text{.}\)

On va piocher un élément dans chacun de ces \(C_a\text{.}\)  6 

On note \(V\subset \rbb -1,1\lbb \) l'ensemble de tous ces éléments, et on va re-partitionner \(\rbb -1,1\lbb\) en ensembles translatés de \(V\text{.}\)

Puisque \(\mathbb Q \cap \rbb -2,2\lbb \) est dénombrable 8 , on peut l'énumérer sous la forme d'une suite: on note

\begin{equation*} \mathbb Q \cap \rbb -2,2\lbb=\{ r_k, k \in \mathbb N\} \end{equation*}

et on pose \(V_k=r_k + V\text{.}\) Montrer que les \(V_k\) sont deux-à-deux disjoints.

Spoiler.

Supposons qu'il existe \(x \in V_k \cap V_j\text{,}\) et montrons que \(r_k=r_j\text{.}\)

On a donc deux éléments \(v_1,v_2\in V\text{,}\) tels que

\begin{equation*} x=r_k +v_1 = r_j+v_2 \end{equation*}

donc \(v_1-v_2 = r_j -r_k \in \mathbb Q\text{,}\) et donc \(v_1 \in C_{v_2}\text{.}\)

Or, comme on a vu, \(v_2 \in C_{v_2}\text{,}\) et par définition, \(V\) ne contient qu'un élément de chaque classe \(C_a\text{.}\) On a donc forcément \(v_1 = v_2\text{,}\) et de là \(r_j = r_k\text{.}\)

Par contraposée, dès que \(r_j \neq r_k\text{,}\) \(V_k \cap V_j=\emptyset\text{.}\)

(d)

Montrer que \(\rbb -1,1\lbb \subset \bigcup_{k\in\mathbb N} V_k\text{,}\)

Indice.

Commencer par noter que, pour tout \(x \in \rbb -1,1\lbb \text{,}\) il existe \(v \in V\) tel que \(v \in C_x\text{.}\)

Spoiler.

Soit \(x \in \rbb -1,1\lbb\text{.}\) Puisque \(V\) contient un élément de chaque classe \(C_a\text{,}\) \(V\) contient un élément de \(C_x.\)

Mais alors, \(v-x\in \Q\) et

\begin{equation*} \begin{cases}-1\leq v \leq 1 \\ -1\leq x \leq 1\end{cases} \text{ donc } -2\leq v-x\leq 2 \end{equation*}

Donc, il existe \(q\in \Q \cap \rbb -2,2\lbb\) tel que \(v-x = q\text{.}\)

Mais du coup, \(-q\in \Q \cap \rbb -2,2\lbb\) aussi, et donc c'est l'un des \(r_k\text{.}\) Et de là,

\begin{equation*} x= -q +v = r_k +v \in V_k \subset \bigcup_{k\in\mathbb N} V_k \end{equation*}

(e)

En déduire que

\begin{equation*} \sum_{k\in \mathbb N} |V_k| \geq 2 \end{equation*}
Spoiler.

Puisque la mesure extérieure est croissante, on a donc

\begin{equation*} 2 = |\rbb -1,1\lbb|\leq \left|\bigcup_{k\in\mathbb N} V_k\right| \end{equation*}

et par sous-additivité,

\begin{equation*} \left|\bigcup_{k\in\mathbb N} V_k\right| \leq \sum_{k\in \mathbb N} |V_k| \end{equation*}

ce qui nous donne le résultat souhaité.

(f)

En déduire que \(|V| \neq 0\text{.}\)

Spoiler.

Puisque la mesure extérieure est invariante par translation 2.2.2, on aurait aussi, pour tout \(k\in\N\text{,}\)

\begin{equation*} |V_k|=|r_k+V|=|V|. \end{equation*}

Si on avait \(|V|=0\text{,}\) on aurait aussi \(|V_k|=0\) pour tout \(k\in\N\text{,}\) et du coup

\begin{equation*} 2 \leq \sum_{k\in \mathbb N} |V_k| = \sum_{k\in \mathbb N} 0 =0 \end{equation*}

....ce qui serait un problème.

Et donc, \(|V| \neq 0\text{.}\)

(g)

Montrer que, pour tout \(\in\N\text{,}\)

\begin{equation*} \left|\bigcup_{k=1}^n V_k\right| \leq 6 \end{equation*}

Pour tout \(k \in \N\text{,}\) pour tout \(v\in V\text{,}\) on a

\begin{equation*} \begin{cases}-1\leq v \leq 1 \\ -2\leq r_k \leq 2\end{cases} \text{ donc } -3\leq r_k+v\leq 3 \end{equation*}

Autrement dit, pour tout \(k \in \N\text{,}\) \(V_k\subset \rbb -3,3\lbb\text{,}\) donc \(\bigcup _{k\in\mathbb N} V_k \subset \rbb -3,3\lbb\text{.}\)

Et donc, comme la mesure extérieure est toujours croissante,

\begin{equation*} \left|\bigcup_{k\in\mathbb N} V_k\right| \leq |\rbb -3,3\lbb|= 6 \end{equation*}

De plus, pour tout \(n\in\N\text{,}\)

\begin{equation*} \bigcup_{k=1}^n V_k\subset \bigcup_{k\in\mathbb N} V_k \end{equation*}

donc, toujours par croissance de \(|.|\text{,}\)

\begin{equation*} \left|\bigcup_{k=1}^n V_k\right| \leq \left|\bigcup_{k\in\mathbb N} V_k\right| \leq 6 \end{equation*}
Indice.

Montrer que \(\bigcup_{k\in\mathbb N} V_k\) est inclus dans un intervalle de longueur 6, et utiliser la croissance de la mesure extérieure.

(h)

En déduire qu'il existe \(N\in\N\) tel que

\begin{equation*} \left|\bigcup_{k=1}^N V_k\right| \lt \sum_{k=1}^N |V_k| \end{equation*}
Indice.

On a déjà remarqué que, pour tout \(k\in\N\text{,}\) \(|V_k|=|V|\text{.}\) Du coup, pour un entier \(n\text{,}\) que vaut \(\sum_{k=1}^n |V_k|\) ?

Si \(n\) est assez grand, est-ce que ça ne serait pas plus grand que, disons, 6 ?

Spoiler.

On a déjà observé que, pour tout \(k\in\N\text{,}\) \(|V_k|=|V|\text{,}\) donc, pour tout \(n\in\N^*\text{,}\)

\begin{equation*} \sum_{k=1}^n |V_k|= \sum_{k=1}^n |V| = n|V| \end{equation*}

Puisque \(|V| \gt 0\text{,}\) on a \(\lim_{n\rightarrow \infty} n|V|=+\infty\text{,}\) donc on peut choisir \(N\in\N\) tel que \(N|V| \gt 6\text{.}\)

Et donc,

\begin{equation*} \left|\bigcup_{k=1}^N V_k\right| \leq 6 \lt N|V| = \sum_{k=1}^N |V_k| \end{equation*}

(i)

En déduire que la mesure extérieure n'est pas additive: on n'a pas, pour tous \(A, B \in \mathcal P(\mathbb R)\text{,}\) \(|A\cup B| = |A| + |B|\text{.}\)

Spoiler.

Si on avait, pour tous \(A\) et \(B\) dans \(\mathcal P(\mathbb R)\text{,}\) \(|A\cup B| = |A| + |B|\text{,}\) alors par récurrence, on aurait, pour tout \(n\in\N\) et pour tous sous-ensembles \(A_1, A_2, \dots, A_n\) deux à deux disjoints,

\begin{equation*} |A_1\cup\dots \cup A_n| = |A_1|+\dots + |A_n| \end{equation*}

Or, \(V_1\ldots, V_N\) sont des ensembles deux à deux disjoints, mais

\begin{equation*} |V_1\cup...\cup V_N|\lt |V_1|+...+|V_N| \end{equation*}

donc, par contraposée, il existe donc \(A\) et \(B\) dans \(\mathcal P(\mathbb R)\) tels que \(|A\cup B| \neq |A| + |B|\text{.}\)

Pour se faire une idée de ces étranges ensembles \(V\) et \(V_k\text{:}\)

D'autres conséquences bizarres de l'axiome du choix 9 :

Cette propriété manquante est un dommage irréparable:

  • D'une part, pourla construction d'une théorie des probabilités raisonnables, il ne semble pas satisfaisant de se contenter de la sous-additivité dans le cas d'évènements incompatibles.

  • D'autre part, historiquement, la question qui préoccupait les fondateurs de la théorie de la mesure, c'est la construction d'une intégrale qui améliore l'intégrale de Riemann: celle-ci est construite en partitionnant le domaine de définition d'une fonction \(f:[a,b] \rightarrow\R\) en sous-intervalles \([x_k,x_{k+1}]\text{,}\) et en approchant l'aire sous la courbe par

    \begin{equation*} \sum_{k=0}^{n-1} \inf_{[x_k,x_{k+1}]}f \, \ell([x_k,x_{k+1}]). \end{equation*}

    Et l'idée de Lebesgue est de partitionner \([a,b]\) en sous ensembles disjoints \(C_k\) mieux adaptés, et d'approcher l'intégrale par

    \begin{equation*} \sum_{k=0}^{n-1} \inf_{C_k} f\,\cdot \, \text{"longueur"}(C_k). \end{equation*}

    Mais pour que ça marche, il faut que la somme de la longueur des \(C_k\) donne exactement celle de \([a,b]\) !

Cette histoire d'additivité est donc un défaut critique.

Peut-être, donc, a-t-on fait fausse route avec la mesure extérieure. Il nous faut peut-être faire preuve de plus de subtilité dans l'approche de \(A\) par des intervalles...

Mais non. Le résultat suivant piétine nos ambitions:

Exercice 2.3.3. Preuve du théorème défaitiste.

(a)

Supposons qu'il existe une telle fonction \(m\text{.}\) Montrer qu'alors, \(m\) est monotone: si \(A\subset B\text{,}\) alors \(m(A)\leq m(B)\text{.}\)

Spoiler.

Quels que soient \(A\) et \(B\text{,}\) on a \(B= B\cap(A\cup A^c) = (B\cap A) \cup (B\setminus A)\text{.}\)

Si de plus \(A\subset B\text{,}\) on a \(B\cap A = A\) et donc \(B=A\cup (B\setminus A)\text{.}\) Or \(A\) et \(B\setminus A\) sont disjoints, donc, puisqu'on a supposé que \(m\) est additive,

\begin{equation*} m(B) = m(A) + \underbrace{m(B\setminus A)}_{\geq 0} \geq m(A). \end{equation*}

(b)

Montrer que, pour tous \(a,b \in \mathbb R\text{,}\) \(m(\rbb a,b\lbb ) = b-a\text{.}\)

Indice.

Donnez-vous un ou deux \(\varepsilon\) de place !

Spoiler.

Soit \(\varepsilon\gt 0\text{,}\) alors on a

\begin{equation*} \lbb a,b\rbb \subset \rbb a,b\lbb \subset \lbb a- \varepsilon, b+ \varepsilon\rbb \end{equation*}

et comme on vient de montrer que \(m\) est croissante,

\begin{equation*} b-a = m(\lbb a,b\rbb ) \leq m(\rbb a,b\lbb ) \leq m(\lbb a- \varepsilon, b+ \varepsilon\rbb )=b-a+2 \varepsilon. \end{equation*}

Ceci étant vrai pour tout \(\varepsilon\gt 0\text{,}\) on peut passer à la limite \(\varepsilon \rightarrow 0\text{,}\) ce qui nous donne bien

\begin{equation*} m(\rbb a,b\lbb ) = b-a. \end{equation*}

(c)

Montrer que l'ensemble \(V\) de Vitali pose le même problème à \(m\) qu'à la mesure extérieure.

Spoiler.

Reprenons alors les ensembles \(V\) et \(V_k\) introduits dans la preuve du théorème Théorème 2.3.2. Par additivité, on a

\begin{equation*} m\left(\bigcup_{k\in \mathbb N} V_k\right) = \sum_{k\in \mathbb N} m(V_k) = \sum_{k\in \mathbb N} m(V) \end{equation*}

et, puisque \(\rbb -1,1\lbb \subset \bigcup_{k\in \mathbb N} V_k \subset \rbb -3,3\lbb \text{,}\)

\begin{equation*} \begin{cases} \sum_{k\in \mathbb N} m(V) \geq m(\rbb -1,1\lbb )=2 \text{ donc } m(V) >0\\ \sum_{k\in \mathbb N} m(V) \leq m(\rbb -3,3\lbb )= 6 \text{ donc } m(V) = 0, \end{cases} \end{equation*}

ce qui est absurde.

Comme le disait un grand penseur 10 ,

"Lourd est le parpaing de la réalité sur la tartelette aux fraises de nos illusions."

Il va donc nous falloir revoir nos ambitions, et abandonner (au moins) une de nos exigences sur la fonction \(m\text{.}\) Mais:

  • On ne peut pas abandonner la première hypothèse: que ce soit pour construire une intégral ou pour faire des probabilités, le but de la démarche est justement de généraliser les longueurs d'intervalles.

  • On a déjà discuté plus haut de la nécessité de la seconde hypothèse pour notre procédé de passage à la limite.

  • On ne peut pas abandonner la troisième non plus.

    Cela pourrait, éventuellement, sembler raisonnable pour des probabilités (si on imagine une probabilité gaussienne, les intervalles proches de la moyenne sont plus probables que ceux qui en sont très loin), mais cela limiterait drastiquement le cadre (pas de probabilité uniforme)

    Et pour définir une intégrale, cette invariance est naturelle: il serait étrange qu'en translatant le graphe d'une fonction, on change l'aire sous sa courbe. 11 

Que reste-t-il alors ?

\(\leadsto\) On va restreindre l'ensemble de définition de \(m\) à un sous-ensemble de \(\mathcal P(\mathbb R)\text{,}\) de façon à se débarasser des sous-ensembles "pathologiques" comme ceux de Vitali.

Ce cas peut effectivement se produire: si \(I\) est ouvert à droite ou \(J\) ouvert à gauche, \(b=c\) n'empêche pas \(I\) et \(J\) d'être disjoints.
Figure 2.3.1. Ici, Terrence Tao est à droite. Il travaille sur une preuve avec le célèbre mathématicien Paul Erdos. A 10 ans.
terrytao.wordpress.com/2009/02/28/tricks-wiki-give-yourself-an-epsilon-of-room/

\(C_a\) est la classe d'équivalence de \(a\) pour la relation

\begin{equation*} a\sim b \iff a-b\in \mathbb \Q \end{equation*}
Autrement, \(C_a \cap C_b \neq \emptyset\) et on a gagné

Cette opération a l'air tout à fait innoncente, mais elle fait intervenir l'axiome du choix 7 , un axiome de la théorie des ensembles qui ne fait pas consensus.

carolinevernier.website/ZFCaxioms.html#axiomeC
Pourquoi ? Voir par ici 1.2.6
Mais rien à voir avec la théorie de la mesure: c'est juste pour faire une pause avant de devoir faire face au naufrage de notre idée de mesure.
twitter.com/Bouletcorp/status/410390478526242816?lang=en/
C'est néanmoins ce que fit Stieljes: mais ici, on va suivre le chemin de Lebesgue.