Théorie physique des distributions/Introduction des distributions
Ce deuxième chapitre introduit la notion de distribution tout en justifiant les motivations qui sont à l'origine de cette introduction.
Position du problème
[modifier | modifier le wikicode]Soit ℘ l’ensemble des fonctions physiques. Ces fonctions sont censées représenter la plupart des fonctions que l’on rencontre en physique. Si l’on considère, par exemple, les circuits électriques, nous savons que l’on peut décrire le comportement d'une tension ou d'un courant dans une partie d'un circuit électrique par une équation différentielle. En fait, des considérations sur le circuit électrique amènent à établir une équation différentielle dont la résolution est censée nous donner toutes les possibilités d'évolution de la tension ou du courant considéré. En réalité, on se heurte ici à un problème que nous allons exposer :
Les équations différentielles, que l’on établit dans un circuit électrique, sont la plupart du temps, pour les circuits les plus simples, des équations du premier ordre ou du second ordre. Ce qui entraîne que les fonctions, solutions de ces équations, admettent respectivement une dérivée première ou une dérivée seconde. Nous savons pourtant que les intensités dans les condensateurs ou les tensions aux bornes des bobines peuvent être discontinues et, par conséquent, sont des fonctions non dérivables en certains points. Nous sommes donc amenés à penser que les équations différentielles, qui décrivent un circuit, ne nous permettent de trouver que les fonctions qui sont dérivables et passent sous silence toutes les fonctions qui ne le sont pas.
En fait, ce que l’on reproche à l’ensemble ℘, c’est de contenir des fonctions qui ne sont pas dérivables, car ces fonctions ne peuvent pas être solutions d'une équation différentielle. Si nous réfléchissons à ce problème, nous ne pouvons pas nous empêcher de penser que, dans l'évolution historique des mathématiques, nous nous sommes déjà trouvés dans des situations similaires. Par exemple, certaines équations numériques ne pouvaient pas être résolues parce que, dans l’ensemble des nombres réels, les nombres négatifs n'ont pas de racine carrée. Nous savons que ce problème a été résolu en introduisant un ensemble plus vaste que l’ensemble des nombres réels et dont un de ses sous-ensembles pouvait être identifié à l’ensemble des nombres réels. Cet ensemble, que l’on a nommé ensemble des nombres complexes, permettait aux nombres négatifs d’avoir des racines carrées en dehors de ℝ et permettait ainsi de résoudre des équations qui n'avaient pas, jusqu'alors, de solutions.
Pour en revenir à notre ensemble ℘, le problème qui se pose est donc le suivant : Cet ensemble contient des fonctions qui ne sont pas dérivables. Ne peut-on pas définir un ensemble plus vaste dont une partie pourrait être identifiée à ℘ et qui permettrait de rendre toutes les fonctions de ℘ dérivables, quitte à ce que ses dérivées soient en dehors de ℘ ?
Résolution du problème
[modifier | modifier le wikicode]On rappelle qu'une application linéaire d'un espace vectoriel dans l’ensemble des nombres réels est appelée forme linéaire.
On rappelle aussi que l’ensemble des formes linéaires sur un espace vectoriel V, est un espace vectoriel que l’on notera V'. V' est appelé dual de V.
Si u est un vecteur de V et f une forme linéaire de V'. Plutôt que de désigner par f(u) l'image du u par f, on préférera utiliser le crochet de dualité en posant :
.
Soient W un espace vectoriel et V ⊂ W un sous-espace. Alors, il existe un plongement canonique de W' dans V'.
Soit φ un élément de W', c'est-à-dire une forme linéaire sur W. Sa restriction à V est une forme linéaire sur V, donc appartient à V'. L'application (linéaire) de restriction ainsi définie (de W' dans V') est injective car toute forme linéaire sur V s'étend en (au moins) une forme linéaire sur W (par exemple : nulle sur un supplémentaire arbitraire de V dans W).
Nous avons défini au chapitre précédent trois espaces vectoriels , , ,
vérifiant :
D'après le théorème précédent, nous aurons donc :
« ».
Nous voyons que est le plus grand dual au sens de l'inclusion. C'est donc lui que nous choisirons pour résoudre le problème, exposé dans le paragraphe précédent. Nous poserons donc la définition suivante :
On appelle espace des distributions, le dual de l'espace vectoriel des fonctions indéfiniment dérivables à support compact. Une distribution est donc une forme linéaire sur .
Le sous-espace sera le sous-espace des distributions tempérées (sur lequel on peut définir une transformée de Fourier).
Le sous-espace sera le sous-espace des distributions à support compact (qui joue un rôle dans le produit de convolution).
Dans le contexte de la théorie des distributions, , , seront appelés espaces de fonctions-test.
Il nous reste à vérifier que cet espace répond bien à ce que l’on attendait. Nous devons donc vérifier deux choses :
- d’abord qu’il existe bien un isomorphisme de l'espace ℘ des fonctions physiques vers un sous-espace P des distributions ;
- ensuite, il faut définir une dérivation dans telle que les distributions dans P soient toutes dérivables et prolongent bien la dérivation dans ℘.
Nous réservons le chapitre suivant au deuxième point et nous nous contenterons, dans la fin de ce chapitre, de vérifier le premier point.
Morphisme injectif de ℘ dans l’ensemble des distributions
[modifier | modifier le wikicode]Soit ψ une fonction de ℘ dans ainsi défini :
Soit p une fonction physique de ℘. L'image de p par ψ sera la forme linéaire Tp de qui a tout φ de associe le réel :
L'intégrale précédente est bien définie puisque φ est à support compact.
Pour simplifier l'écriture, nous avons noté Tp la forme linéaire (distribution) qui est l'image de p par ψ. Toutes les distributions ne pourront pas se noter ainsi car nous verrons qu’il existe dans des distributions (forme linéaire) qui n'ont pas d'antécédent par ψ. Ces distributions seront alors la plupart du temps notée simplement T. Parmi les distributions de , celles qui ont un antécédent par ψ seront appelées distributions régulières. |
Montrons que la fonction ψ est bien un morphisme injectif de ℘ dans .
Nous devons montrer, tout d’abord, que : ∀ p, q ∈ ℘, ψ(p + q) = ψ(p) + ψ(q)
Calculons ψ(p + q) : L'image par ψ de p+q est la forme linéaire qui a toute fonction φ de associe le réel :
Qui peut s'écrire par linéarité de l'intégrale :
Où l’on voit apparaître la somme des images de la forme linéaire, image de p par ψ avec la forme linéaire image de q par ψ.
On a donc bien : ∀ p, q ∈ ℘, ψ(p + q) = ψ(p) + ψ(q)
Nous devons montrer ensuite que : ∀ p ∈ ℘, ∀ λ ∈ ℝ, ψ(λp) = λψ(p)
Calculons ψ(λp) : L'image par ψ de λp est la forme linéaire qui a toute fonction φ de associe le réel :
Qui peut s'écrire par linéarité de l'intégrale :
Où l’on voit apparaître le produit du scalaire λ par l'image de la forme linéaire, image de p par ψ.
On a donc bien : ∀ p ∈ ℘, ∀ λ ∈ ℝ, ψ(λp) = λψ(p)
Montrons ensuite que ψ est injective. Pour cela, nous devons montrer que, si pour deux fonctions physiques p et q, nous avons ψ(p) = ψ(q), alors nous avons nécessairement p = q.
Nous voyons que cela revient à montrer que :
Nous admettrons ce résultat qui est un peu fastidieux à démontrer.
|
Soit maintenant P l'espace image par ψ de l'espace vectoriel ℘ des fonctions physiques. D'après ce qui précède, nous voyons que ψ est un isomorphisme de ℘ dans P. Nous pouvons donc identifier ℘ à P et nous dirons, par abus de langage, que l’ensemble des fonctions physiques est un sous-espace vectoriel des distributions. Nous pourrons donc parler indifféremment de fonctions ou de distributions lorsque nous envisagerons un élément de P.
Nous rappelons qu'une distribution de P sera dite régulière. P est le sous-ensemble des distributions régulières de .
Toujours par abus de langage, comme la valeur en un point d'une fonction f se note f(x), on pourra rencontrer pour les distributions non régulières la notation T(x) qui, bien sûr, n'a aucun sens et ne sert qu’à rappeler le type de variable sur lequel on travaille. Ce sera souvent le cas pour la distribution de Dirac (définie plus loin) que l’on notera quelquefois δ(x) ou δ(t) si la variable est le temps.
Nous voyons que nous avons réalisé pour ℘ et une démarche similaire à celle qui avait été réalisée avec les ensembles des nombres réels et des nombres complexes.
Distributions à support compact
[modifier | modifier le wikicode]Dans un paragraphe précédent, nous avons nommé l’ensemble comme étant l’ensemble des distributions à support compact. Dans ce paragraphe, nous allons donner une définition équivalente en se basant sur l'espace et les fonctions-test de pour mieux expliciter ce que l’on entends par distribution à support compact. Nous admettrons que le sous-espace de obtenu coïncide avec le sous-espace .
nous définirons, tout d’abord, le support d'une fonction-test.
Soit φ, une fonction-test de . On appelle support de φ, que l’on note supp(φ), l’ensemble des réels pour lesquels φ n’est pas nul.
On définira une distribution à support compact de ainsi :
Une distribution T sera dite à support compact s'il existe un intervalle [a;b] de ℝ tel que :
Le support de T sera alors le plus petit fermé F(au sens de l'inclusion) de ℝ tel que :
F étant fermé et borné par [a;b] sera, par conséquent, un ensemble compact. Ceci justifie l'appellation de distribution à support compact.
On démontre et nous admettrons que le sous-espace des fonctions à support compact de résultant de la définition ci-dessus coïncide avec .
Opérateur de translation
[modifier | modifier le wikicode]Pour une simple fonction, si l’on souhaite faire une translation de sa courbe représentative dans un repère, d'une valeur a, nous savons qu’il nous suffit d'enlever la valeur a, à sa variable x. Autrement dit, si une fonction est définie par :
La translatée de la valeur a sera défini par :
Si a est positif, la courbe représentative sera translatée vers la droite. Si a est négatif, la courbe représentative sera translatée vers la gauche.
Par commodité d'écriture, nous pouvons définir un opérateur de translation que l’on notera τa et nous noterons τa.f la fonction qui a pour courbe représentative, la translatée de la courbe représentative de f, de la valeur a.
On peut donc écrire :
Nous nous proposons de généraliser à une distribution T, l'opérateur de translation et de donner un sens à τa.T.
Commençons donc par les distributions régulières.
Soit f une fonction physique et soit Tf, la distribution régulière associée. Essayons alors d'exprimer la distribution régulière Tτa.f associé à τa.f. On a :
Nous pouvons faire un changement de variable en posant y = x- a, on obtient :
Nous généraliserons donc l'opérateur de translation aux distributions ainsi :
Soit T une distribution. La translatée de a de la distribution T sera définie par :
Suite de distributions et convergence au sens des distributions
[modifier | modifier le wikicode]Lorsque l’on étudie les fonctions, nous sommes amené à définir des suites de fonctions. Ces suites de fonctions étant définis, nous nous posons la question de savoir si celles-ci convergent vers une fonction limite. Nous définissons même plusieurs types de convergences comme la convergence simple ou la convergence uniforme. Bien souvent, nous avons vu qu'une suite de fonctions ne converge pas vers une limite.
Sur ce point , une idée s'élève peu à peu dans notre esprit. Maintenant que nous avons agrandi notre ensemble de fonction physique en créant l'espace des distributions, dans lequel l’ensemble des fonctions physiques a été immergé, est-ce que les suites de fonctions qui ne convergeaient pas avant, ne vont-elles pas converger vers une distribution en dehors de l'espace des distributions régulières. C'est ce que nous allons étudier dans ce paragraphe !
Nous commencerons par donner une définition de la convergence des distributions.
Soit (Tn)n∈ℕ une suite de distributions. On dit que (Tn) converge simplement vers une distribution T, dans si :
Pour mettre en application cette définition, nous allons donner un exemple de suite de fonctions physiques qui ne converge pas dans l’ensemble des fonctions, mais qui va converger, dans , vers une distribution qui n’est pas régulière.
Soit la suite de fonctions (fn)n∈ℕ, définie par :
Nous voyons que cette suite de fonctions ne converge pas dans l’ensemble des fonctions puisque l’on a :
Calculons toutefois la limite de cette suite en les considérant comme des distributions. Nous appellerons Tn la distribution régulière correspondant à fn
Nous avons alors :
La deuxième intégrale est plus délicate à calculer. Calculons donc à part :
En introduisant les valeurs absolues, nous avons :
φ étant une fonction continue, nous avons :
Nous voyons qu’à partir d'une certaine valeur de n, nous aurons :
Compte-tenu des bornes d'intégration de l'intégrale, nos avons alors :
Nous en déduisons que :
On a obtenu :
Ce qui nous permet de conclure que :
Nous pouvons finir le calcul commencé plus haut :
Nous voyons que la suite de distributions (Tn) convergerait vers une distribution T qui serait définie par :
On vérifie que cette définition correspond bien à la définition d'une forme linéaire sur et par conséquent T est bien une distribution que l’on nomme « distribution de Dirac » et que l’on notera δ0 ou simplement δ par la suite.
On appelle distribution de Dirac, que nous noterons δ, la forme linéaire qui, à toutes fonctions-test φ de , associe sa valeur en 0.
Nous avons donc bien constaté qu'une suite de fonctions qui ne convergeaient pas dans l’ensemble des fonctions peut très bien converger dans l’ensemble des distributions.
Notons que nous pouvons généraliser la définition de la distribution de Dirac en 0 en un point quelconque a :
On appelle distribution de Dirac en a, que nous noterons δa, la forme linéaire qui, à toutes fonctions-test φ de , associe sa valeur en a.
Une application au circuit électrique, de ce qui précède, est celle-ci : Supposons que l’on applique, à l'instant a, une tension aux bornes d'un circuit durant un temps très court. Si notre intention est d'appliquer cette tension durant le temps le plus court possible, on pourra alors, pour simplifier les calculs, remplacer cette action par une distribution de Dirac en a, affectée d'un facteur égal au produit de la tension appliquée par le temps d'application de la tension. On dira alors que l’on a appliqué une impulsion au circuit à l'instant a. |
Produit de distributions
[modifier | modifier le wikicode]Nous allons aborder, dans ce paragraphe, la question concernant le produit des distributions. La somme de deux distributions découle naturellement du fait que l’ensemble des distributions est un espace vectoriel, mais peut-on définir le produit de deux distributions.
Pour cela, nous commencerons à raisonner sur les distributions régulières pour essayer de voir si l’on peut en déduire une première formule, quitte à voir si cette formule peut se généraliser à toutes les distributions. Si nous considérons deux fonctions physiques p et q, nous savons, de façon classique, que :
En notant • le produit hypothétique de deux distributions, nous devrions alors avoir :
Il nous faut donc trouver une définition du produit de deux distributions qui soit compatible avec cette formule. Nous voyons que nous avons successivement :
Une longue réflexion nous montre qu'aucune relation ne semble émerger pour lier ces trois formules. Il semble donc que l’on doivent abandonner tout espoir de définir un produit entre deux distributions d'une façon générale.
Pourtant, si nous observons la troisième relation, nous voyons qu'elle peut se mettre sous la forme :
Et là, un faible espoir commence à naître. Il faudrait pour poursuivre les calculs que p.φ soit une fonction-test. Et cela ne peut se produire que si p est indéfiniment dérivable. Par conséquent, si p est infiniment dérivable, nous voyons que nous avons :
Ce qui est déjà mieux que rien !
En faisant abstraction des intégrales, nous retiendrons :
Et en combinant avec la relation :
que l’on espérait avoir, nous obtenons :
Si nous essayons de généraliser, nous voyons que nous ne pouvons faire aucun compromis sur p qui doit être indéfiniment dérivable. Par contre, nous n'avons aucune contrainte sur la fonction q de Tq et donc nous généraliserons à ce niveau-là, en remplaçant Tq par T, fonction quelconque de . Nous obtenons donc :
Et nous voyons que nous avons réussit à définir le produit de deux distributions dans le cas très particulier, où l'une des deux est la distribution associée à une fonction indéfiniment dérivable.
Par abus de langage, nous identifierons Tp avec p et laisserons tomber la notation •. Nous poserons alors la définition suivante :
Le produit d'une distribution T par une fonction indéfiniment dérivable p est défini par la relation :
Étudions, à titre d'exemple, le produit de la distribution de Diras en a par une fonction indéfiniment dérivable g.
Nous avons :
On retiendra :
Soit g, une fonction indéfiniment dérivable. Le produit de la fonction g par la distribution de Dirac en a vérifie :
Ou encore, par abus d'écriture :