Fonctions convexes/Définition et premières propriétés
Dans tout ce chapitre, et désignent des intervalles de ℝ.
On dit qu'une application est
- convexe sur si :
- ;
- strictement convexe sur si, pour et , on a même : .
Les inégalités de la définition sont connues sous les noms d’inégalité de convexité et d’inégalité de convexité stricte.
Ces définitions s’appliquent à des fonctions qui ne sont pas forcément dérivables. Dans le cas où la fonction est dérivable ou mieux admet une dérivée seconde, nous verrons que l’on peut trouver des caractérisations plus simples des fonctions convexes et une condition suffisante de convexité stricte.
On dit qu'une application est concave (resp. strictement concave) sur si est convexe (resp. strictement convexe) sur .
Nous allons étudier maintenant quelques propriétés des fonctions convexes.
Une application est convexe sur si et seulement si pour tous points et de sa courbe représentative, l’arc est en-dessous de la corde .
Il n’y a pas vraiment de démonstration à faire ici. Cette propriété n’est en fait que la traduction visuelle de la définition que nous avons donnée d’une fonction convexe.
Nous allons essayer de mieux voir ceci à travers les deux lemmes suivants :
Tout réel s'écrit sous la forme pour un unique , car
- , avec .
Cette unique solution vérifie :
Soient le point de coordonnées et le point de coordonnées .
Un point appartient au segment si et seulement si ses coordonnées sont de la forme :
- , avec .
Notons les coordonnées de et celles de . Les points du segment sont, par définition, tous les barycentres des deux points et , pondérés respectivement par deux coefficients de même signe tels que , c'est-à-dire les points de coordonnées , avec .
Grâce aux deux lemmes qui précèdent et au schéma qui suit, nous comprenons maintenant mieux que la propriété 1 n’est que la traduction de la définition d’une fonction convexe.
Si une application est convexe alors, pour tous dans :
et par conséquent,
.
Réciproquement, si l'une des trois inégalités est vérifiée pour tous dans alors est convexe.
L'inégalité des pentes a été démontrée dans le chapitre « Convexité » de la leçon sur les fonctions d’une variable réelle.
Soit une application . Pour tout , on définit l’application :
- .
Alors, les cinq propriétés suivantes sont équivalentes :
- est convexe sur ;
- pour tout , est croissante sur ;
- pour tout , est croissante sur ;
- pour tout , les valeurs de sur sont inférieures à celles sur ;
- pour tout , est croissante sur .
Les propriétés 2, 3 et 4 sont respectivement équivalentes aux trois inégalités des pentes, donc chacune est équivalente à la convexité de . Par conséquent, la cinquième l'est aussi.
Si est convexe, alors est réunion de trois sous-intervalles consécutifs (dont certains peuvent être vides) tels que est strictement décroissante sur le premier, constante sur le deuxième et strictement croissante sur le troisième.
Soit une fonction convexe.
- Si alors ou bien est décroissante, ou bien .
- Si alors ou bien est croissante, ou bien .
- Si et si est majorée, alors elle est constante.
- Si et n'est pas décroissante alors, d'après la propriété 4, il existe tel que sur , est strictement croissante, en particulier :.Or d'après la propriété 3, pour tout , , c'est-à-dire , ou encore.Comme , on en déduit : .
- se démontre comme 1., ou s'en déduit par le changement de variable .
- est une conséquence immédiate de 1. et 2.
D'après la propriété 3, pour tout , la fonction « pente » est croissante.
Elle admet donc (d'après le théorème de la limite monotone) une limite à gauche et à droite en finies. Cela montre que est dérivable à gauche et à droite, donc continue.
Une fonction convexe sur un intervalle non ouvert peut être discontinue aux extrémités de cet intervalle. Par exemple, la fonction définie par
est convexe sur mais n’est pas continue en . |
Soit une fonction convexe strictement monotone sur un intervalle ouvert . Sur l'intervalle , est
- convexe si est décroissante ;
- concave est croissante.
Le second point se déduit du premier en remplaçant par l'application . Supposons donc désormais décroissante (strictement).
D’après la propriété 6, f, étant convexe sur l’intervalle ouvert I, sera continue sur I. Comme, de plus, f est strictement décroissante sur I, on en déduit que f est bijective sur I. Par conséquent f-1 existe. Soit a, b ∈ f(I), posons c = f-1(a) et d = f-1(b).
Comme f est convexe, on a :
f étant décroissante, f–1 sera aussi décroissante et par conséquent, on en déduit :
c’est-à-dire :
Ce qui montre que f-1 est convexe.
Soit une fonction convexe. Pour toute fonction ,
- si est convexe et croissante alors la composée est convexe ;
- si est concave et décroissante alors est concave.
Le second point se ramène au premier en remplaçant par . Supposons donc désormais convexe et croissante.
Soient et . Par convexité de ,
donc, par croissance de ,
et en appliquant la convexité de au second membre, on obtient :
.
Si une fonction est logarithmiquement convexe, c'est-à-dire si est convexe, alors est convexe.
Soient (convexe) et (la fonction exponentielle, croissante et convexe). D'après la propriété précédente, est convexe. Or .
Le théorème suivant est démontré dans ce paragraphe car il s’applique à des fonctions convexes qui ne sont pas forcément dérivables. Mais compte tenu de l’importance de ce théorème, nous le reprendrons dans un chapitre spécialement consacré à ses applications.
Soit une fonction convexe. Pour tout (x1, x2, … , xn) ∈ In et pour toute famille (λ1, λ2, … , λn) ∈ (ℝ+)n telle que λ1 + λ2 + … + λn = 1, on a :
- .
Nous raisonnerons par récurrence sur n.
La propriété est triviale pour n = 1 et, plus généralement, lorsque l'un des λk vaut 1 (les autres étant alors nuls).
Supposons-la vraie pour n.
Soit (λ1, λ2,… λn+1) ∈ [0, 1[n+1 tel que :
et soit (x1, x2, … , xn+1) ∈ In+1.
Posons λ = 1 – λn+1 (strictement positif), puis
.
L’inégalité de convexité nous permet d’écrire :
.
Par hypothèse de récurrence, on a :
Par conséquent :
et la propriété est vraie pour n + 1.
Soient une fonction convexe et un point intérieur à l'intervalle . Alors, il existe tels que
Considérons la fonction croissante de la propriété 3 ci-dessus et un réel tel que . Pour tout , on a , avec égalité si . La propriété est donc satisfaite en prenant .
Soit une fonction continue. Pour que soit convexe sur , il suffit qu'elle soit « faiblement convexe », c'est-à-dire que
- .
(L'expression « faiblement convexe » est empruntée à Emil Artin, The Gamma Function, Holt, Rinehart and Winston, 1964, 39 p. [lire en ligne], p. 5.)
Cette démonstration, extraite de Constantin Nicolescu et Lars-Erik Persson, Convex Functions and their Applications: A Contemporary Approach, Springer, 2006 [lire en ligne], p. 10, utilise le théorème de Weierstrass (ou « des bornes »). Pour une autre démonstration, voir le § « Possibilité de n'utiliser que des milieux » de l'article de Wikipédia sur les fonctions convexes.
Raisonnons par contraposée, c'est-à-dire supposons que (continue sur ) n'est pas convexe et montrons qu'alors elle n'est même pas « faiblement convexe ».
Par hypothèse, il existe un intervalle tel que le graphe de la restriction de à ce sous-intervalle ne soit pas entièrement en-dessous de la corde qui joint à , c'est-à-dire tel que la fonction (continue)
vérifie :
- .
Par continuité de , l'ensemble des points de en lesquels atteint ce maximum possède un plus petit élément, .
Puisque et , on a . Il existe donc tel que et . Par définition de et ,
- , et ,
si bien que
- .
Par conséquent, n'est pas « faiblement convexe ». On en déduit facilement que non plus.