Recherche:La Logique Contextuelle
Attention : le titre d’affichage « Recherche:La Logique Contextuelle » écrase l’ancien titre d’affichage « La Logique Contextuelle ».
Introduction
[modifier | modifier le wikicode]Proposée par Arnaud Kohler, la logique contextuelle Lc[1] est un langage formel dont l'objectif est la modélisation et l'exploitation des connaissances par un agent intelligent. Elle postule qu'une phrase est, en soit, un ensemble de signes « qui ne dit rien » : son sens est dans les pensées, le langage est son moyen de communication, et cette relation (entre le langage et la pensée), parce qu'elle est consciente, doit être modélisée dans le formalisme qui porte l'expression.
Appliqué à la logique propositionnelle, l’exercice conduit à l'élaboration d'un langage sémantiquement non monotone et syntaxiquement monotone. Se situant dans le cadre de la révision des croyances et garantissant la cohérence syntaxique, Lc propose des réponses à quelques difficultés propres aux langages formels, comme l’exploitation de connaissances avec exception, incohérentes ou aléthiques, et bénéficie d’une capacité à supporter des « pensées imaginées ».
Le terme a aussi été employé par N. Gauvrit pour nommer un modèle de logique locale[2] permettant d'élucider certains paradoxes de la logique naturelle, et par Y. Gauthier pour proposer une analogie avec les logiques internes[3].
Le postulat contextuel
[modifier | modifier le wikicode]Considérons un tableau peint, par exemple La Joconde de Léonard de Vinci. Nous le pensons comme un tout :
« Par le nom de pensée, je comprends tout ce qui est tellement en nous que nous en sommes immédiatement connaissant » - René Descartes, Méditations métaphysiques[4]
Nous le désignons par un nom, La Joconde – mais ce nom n’est pas le tableau qu’il désigne, nous sommes immédiatement connaissant de cela. Et nous le décrivons par un ensemble de phrases :
« La Joconde est le portrait d'une jeune femme, sur fond d'un paysage montagneux aux horizons lointains et brumeux. Elle est disposée de trois quarts et représentée jusqu'à la taille, bras et mains compris, regardant le spectateur, ce qui est relativement nouveau à l'époque... » - Wikipedia, La Joconde
Mais quand bien même cette description serait idéalement complète et parfaite, elle n'est pas le tableau qu'elle décrit. Nous sommes immédiatement connaissant de cela aussi. Nous établissons donc instantanément, et sans doute possible, une distinction tranchée entre la pensée que nous avons du tableau (symbolisons cette pensée par le signe c) et les mots ou les phrases f que nous utilisons dans le langage pour le désigner ou le décrire. Dans le même instant, et de manière toute aussi immédiate, nous établissons un lien entre c et f. Toutefois :
« Nous ne devons pas dire : Le signe complexe aRb dit que a se trouve dans la relation R avec b, mais : Que a se trouve dans une certaine relation R avec b dit que aRb » - Ludwig Wittgenstein, Tractatus logico-philosophicus [5]
Le postulat contextuel[6] propose la modélisation suivante de cette affirmation :
Soit L un langage formel muni de la fonction d’interprétation ⊨. Une formule bien formée f de L est un ensemble de signes qui n’a pas de signification. Son sens est porté par une pensée, qui est une proposition élémentaire de L. Pour c symbolisant cette pensée, la relation entre c et f est c ⊨ f.
Ainsi, l’expression c ⊨ f n’affirme ni la pensée c ni l'ensemble de signes f, mais la connaissance (ou la conscience, dans le sens d'une relation intériorisée et immédiate) que l'ensemble de signes f exprime la pensée c. Elle entraîne une restriction de la fonction d’interprétation aux expressions C ⊨ f, pour C un ensemble de propositions élémentaires réputées symboliser des pensées et f une formule du langage.
Applicable à toute logique formelle L, le postulat contextuel génère la logique formelle L contextualisée. La logique propositionnelle contextualisée, notée Lc, est appelée par convention de langage la logique contextuelle.
Contextualisation de la logique propositionnelle
[modifier | modifier le wikicode]La difficulté : modéliser ce qui est vrai et faux
[modifier | modifier le wikicode]Dans le cadre de la logique propositionnelle, considérons un ensemble de propositions élémentaires {a, b, c, d} et un ensemble de formules :
ELp = {a → b, c → a, d → a, d → ¬ b}
On obtient les productions suivantes :
{ELp, c} ⊢ b
{ELp, d} ⊢ b ∧ ¬ b
La dernière inférence ne rend pas le résultat escompté. En effet, le besoin est de pouvoir dire que la formule (a → b) est vraie en général. Notamment, elle est vraie lorsque d n'est pas vraie : d est un cas particulier pour lequel la formule n'est pas applicable. Mais si on remplace (a → b) par (¬ d → (a → b)) dans ELp, on obtient :
{ELp, c} ⊢ ¬ d → b
{ELp, d} ⊢ ¬ b
La modélisation permet de résoudre la particularité du traitement associée à d. Mais, en inscrivant explicitement l'exception dans la formule, elle fait perdre la notion de généralité.
Cet exemple illustre les deux difficultés majeures des langages formels classiques : pouvoir modéliser qu’une proposition peut être vraie et fausse (si elle est généralement vraie, c’est qu’elle est parfois fausse), et pouvoir qualifier son interprétation, pour dire qu’elle est, selon certains critères, plutôt vraie ou plutôt fausse. Il semble nécessaire de faire évoluer le formalisme pour y parvenir. De nombreuses études ont été réalisées dans ce but, participant à la constitution de la famille des logiques dites non classiques. Parmi les pistes empruntées, on trouve l’affaiblissement des règles de production syntaxique (pour échapper au principe d’explosion, qui dit que b ∧ ¬ b produit toute formule f, ce qui n’est pas acceptable), la définition d’une relation d’ordre entre les formules (pour exprimer que a → b est moins certaine que les autres par exemple), et l’enrichissement de la vision binaire {vrai, faux} (par l’adjonction de connecteurs modaux pour qualifier l’interprétation, ou par l’adjonction de nouvelles valeurs de vérité).
Les formules de ELp sont syntaxiquement bien formées, ce qui autorise l’application de ⊢. Mais si on applique le postulat contextuel, elles ne permettent pas l’utilisation de ⊨. ELp présente un ensemble de signes, auquel on impose un comportement automatique sans signification autre que syntaxique. Le fait de dire (ou de lire) a → b génère pourtant mécaniquement une pensée, qu’on associe à la formule : nous lui prêtons un sens, et de cela nous sommes immédiatement connaissant. Pour utiliser la connaissance que nous avons de ce sens dans le cadre de notre raisonnement, nous devons l’intégrer dans notre modélisation.
Plusieurs solutions sont possibles pour contextualiser ELp. Nous pouvons, par exemple, considérer qu’il exprime une unique pensée. C'est le parti pris des logiques classiques, qui sont des langages mono-pensée[1]. Cette question introduit le sujet de l'apprentissage et de la méthode de modélisation des nouvelles informations. Le sujet étant ouvert, nous supposerons ici, pour les besoins de l'exercice, que chaque formule qui apparait dans la rédaction choisie pour présenter ELp est liée à une pensée dédiée. L’ensemble contient quatre formules. Utilisons les signes A, B, C et D pour noter les pensées associées. Selon le postulat contextuel, ce sont des propositions élémentaires. Nous obtenons :
ELc = {A ⊨ a → b, B ⊨ c → a, C ⊨ d → a, D ⊨ d → ¬ b}
La première expression, par exemple, se lit : « la pensée A dit a → b » (ou « a → b exprime la pensée A »). Notons que les modèles contenants {¬ A, ¬ B, ¬ C, ¬ D} vérifient ELc : « Toutes les pensées sont possiblement fausses » est une conséquence immédiate du postulat contextuel.
Contexte, croyance et connaissance
[modifier | modifier le wikicode]Nous utiliserons dans la suite de la rédaction les définitions suivantes :
Une conjonction de pensées est un contexte. Par exemple, A ∧ B est un contexte. Il sera noté {A, B}. Un contexte identifie donc l’ensemble des modèles dans lesquels un ensemble de pensées désignées est vrai.
Une formule produite par un contexte est une croyance. Par exemple, la croyance c → b est produite par le contexte {A, B}.
Une expression comme contexte ⊨ croyance est une connaissance. Dans Lc, une connaissance n'exprime pas la validité d'une pensée ou d'une croyance, mais modélise la conscience d'une relation entre un contexte (des pensées), qui porte une sémantique selon le postulat contextuel, et la croyance (un ensemble de signes) qui l’exprime dans le langage.
Pour respecter le postulat contextuel, symbolisons par H (pour Hypothèse) la pensée consistant à interroger la base de connaissances.
Si H dit que c est vraie, c’est-à-dire H ⊨ c. On obtient {A, B, C, D, H} ⊨ b.
Si H dit que d est vraie, cad H ⊨ d, on obtient {A, B, C, D, H} ⊨ b ∧ ¬ b.
Pour d, l’utilisation de l’ensemble de la base génère une incohérence. Pour la résoudre, il serait peut-être intéressant de pouvoir sélectionner le sous-ensemble des pensées pertinentes en fonction de H - plus exactement, de pouvoir conserver A lorsque H ⊨ c et de pouvoir le désélectionner lorsque H ⊨ d.
La sémantique des contextes
[modifier | modifier le wikicode]La base d'exemple contient cinq connaissances (symbolisées par A, B, C, D et H). Cela fait, par combinaison, un nombre important de contextes possibles. Posons quelques définitions pour les distinguer. Un contexte est dit :
- impossible si, et seulement si, il n’est vérifié dans aucun modèle vérifiant l’ensemble des formules considéré,
- possible si, et seulement si, il est vérifié dans au moins un modèle vérifiant l’ensemble des formules considéré,
- impossible minimal si tout contexte qu’il contient strictement est possible,
- possible maximal si tout contexte qui le contient strictement est impossible,
- crédible s’il n’a pas de jointure non vide avec un contexte impossible minimal,
- crédible maximal s’il contient tous les contextes crédibles.
Les contextes impossibles minimaux indiquent que les pensées qui les composent ne sont pas fiables : au moins une des pensées considérée est fausse. Appliquons une stratégie de prudence, et retenons le contexte crédible maximal. Nous l’appellerons le contexte de référence de l’interprétation sémantique. Celle-ci se définit par :
- une croyance est crédible si elle est produite par le contexte de référence,
- elle est improbable si sa négation est produite par le contexte de référence,
- elle est non interprétable si elle n'est ni crédible ni improbable.
Si H ⊨ c, le contexte de référence est {A, B, C, D, H}, et on obtient {A, B, C, D, H} ⊨ b. Si H ⊨ d, {A, C, D, H} est un contexte impossible minimal. Le contexte de référence est donc limité à {B}. Il ne propose pas de conclusion concernant d.
La notion de méta pensée
[modifier | modifier le wikicode]Lorsque H ⊨ d, le contexte impossible minimal {A, C, D, H} interroge : au moins une de ces 4 propositions n'est pas correcte. En réponse, nous souhaiterions pouvoir modéliser que A peut être vraie et fausse. En affirmant cela, nous émettons une qualité sur une pensée : nous émettons une méta-pensée (Jacques Pitrat[7]). Il y a donc des pensées (qui disent des relations entre des propositions atomiques de Lp), et des méta-pensées (qui disent des relations entre des pensées, et peut-être des propositions atomiques de Lp). Il y a aussi probablement des méta-méta-pensées, etc.
En disant cela, nous établissons une relation d’ordre entre les pensées. Pour la formaliser, convenons que les propositions élémentaires de Lp sont de rang 0, que les pensées sont de rang 1, que les méta-pensées sont de rang 2, etc. Donnons une définition qui nous sera utile par la suite :
Le contexte vide est de rang 0. Un contexte est de rang i>0 s’il est composé de pensées dont le rang est supérieur ou égal à i, et de rang strictement i si toutes les pensées qui le composent sont de rang i.
Ceci établi, intégrons les nouvelles pensées A' (qui dit que la pensée A est vraie) et B' (qui dit que la pensée A est fausse) :
ELc = {A ⊨ a → b, B ⊨ c → a, C ⊨ d → a, D ⊨ d → ¬ b, A' ⊨ A, B' ⊨ ¬ A}
{A', B'} étant un contexte impossible minimal, les contextes de référence restent identiques pour H ⊨ c et pour H ⊨ d. Dit autrement : l’introduction de A' et B' ne fait pas varier les conclusions. La définition du contexte de référence que nous avons retenue ne permet manifestement pas d'exploiter les nouvelles informations A' et B'. Elle est trop restrictive. Voyons s'il est possible de trouver une définition plus pertinente.
Les contextes épistémiques
[modifier | modifier le wikicode]Nous proposons d'assujettir la pertinence d'une pensée à son rang. Dans notre exemple, A' et B', qui sont de rang 2, portent des connaissances supposées plus pertinentes que A, B, C, D et H, qui sont de rang 1. Pour formaliser cela, sélectionnons les contextes possibles maximaux de rang au moins 2, en utilisant le rang comme une relation d’ordre pour privilégier des pensées sur les autres, puis retenons les contextes crédibles maximaux de rang 1 associés à cette sélection. Nous obtenons :
- Pour i le plus haut rang des pensées dans ELc, soit Ci+1 le contexte vide.
- Pour j = i à 2, sélection dans chaque {ELc, Cj+1} des contextes Cj possibles maximaux de rang j.
- Pour chaque C2 obtenu, sélection du contexte crédible maximal de rang 1 dans {ELc, C2}.
On obtient ainsi un ensemble composé de plusieurs contextes de références, que nous appellerons les contextes épistémiques.
La sémantique contextuelle
[modifier | modifier le wikicode]Adaptons la fonction d’interprétation pour tenir compte du fait qu’il peut y avoir plusieurs contextes de référence. Par rapport à un ensemble de connaissances ELc, nous dirons qu’une croyance est :
- possible si, et seulement si, au moins un contexte de référence la produit,
- crédible si, et seulement si, au moins un contexte de référence la produit et si aucun contexte de référence ne produit sa négation,
- vraie si, et seulement si, tous les contextes de référence la produisent,
- improbable si, et seulement si, aucun contexte de référence ne la produit et si au moins un contexte de référence produit sa négation,
- fausse si, et seulement si, tous les contextes de référence produisent sa négation,
- paradoxale si, et seulement si, au moins un contexte de référence la produit et au moins un contexte de référence produit sa négation,
- non interprétable si elle n’est ni crédible ni improbable.
Appliquons. Si H ⊨ c, nous avons 2 contextes possibles maximaux de rang 2 :
{A'}. Le contexte crédible maximal dans {ELc, A'} est {A', A, B, C, D, H}. Il produit {a, b, c, ¬ d}.
{B'}. Le contexte crédible maximal dans {ELc, B'} est {B', B, C, D, H}. Il produit {a, c}.
=> Si H ⊨ c, alors b ∧ c et a ∧ c sont crédibles : b est crédible. Si H ⊨ d, nous avons 2 contextes possibles maximaux de rang 2 :
{A'}. Le contexte crédible maximal dans {ELc, A'} est {A', A, B}. Il produit {a → b, c → a}.
{B'}. Le contexte crédible maximal dans {ELc, B'} est {B', B, C, D, H}. Il produit {a, ¬ b, d}.
=> Si H ⊨ d, alors ¬ b ∧ d et a ∧ d sont crédibles, et a → b est possible, ainsi que a ∧ ¬ b ∧ d : b est improbable.
Enfin, si l’hypothèse est le contexte vide, les contextes de référence sont {B’, B, C, D}, qui ne produit pas de proposition élémentaire de rang 0, et {A', A, B, C, D}, qui produit ¬ d. Dit autrement : à défaut d'hypothèse, Lc conclut que d, qui caractérise une exception, est improbable.
L'apport de la contextualisation à la logique propositionnelle
[modifier | modifier le wikicode]Ces résultats entraînent deux constats :
- la contextualisation apporte à Lp la possibilité de modéliser des règles avec exception en respectant les règles de production syntaxique de la logique propositionnelle : b est crédible si c est vraie, et est improbable si d est vraie. Et si on intègre une nouvelle pensée qui dit que (e → a ) est vraie, alors b est crédible si on suppose H ⊨ e. Dit autrement : la pensée A est vraie tant que son application ne génère pas une contradiction (ce qu'on peut traduire par : A est généralement vraie),
- d a un comportement particulier : cette proposition est par défaut interprétée comme improbable. C’est une conséquence de son caractère d’exception : d est improbable tant qu’elle n’est pas explicitement crédible. Si on suppose que toutes les règles admettent une exception (ce qui est possible), et que l’ensemble des connaissances est exhaustif (ce qui est une supposition théorique), Lc conclut, à défaut d'hypothèse, que toute proposition élémentaire de Lp est improbable. Cela paralyse, dans l’absolu, la capacité de décision : le raisonnement dans Lc conduit à douter de tout.
Cet exemple montre comment Lc modélise et exploite les informations :
- aléthiques : Lc ne modélise pas qu’une formule est « crédible », « nécessaire » ou « généralement vraie », mais uniquement qu’elle peut être « vraie ou fausse ». L’interprétation utilise cette information en dé priorisant la formule lorsqu’elle se trouve face à une contradiction : elle est vraie tant qu'elle n'est pas explicitement fausse. Nous avons utilisé un exemple simple, il aurait évidemment été possible de modéliser des cas relationnels plus compliqués, intégrant des pensées croisées de rang supérieur à 2,
- incomplètes : (a → b ) est une information incomplète, considérée comme vraie tant qu’elle ne génère pas une contradiction,
- incohérentes : elles sont modélisées via les contextes. « Les choses sont vraies ou fausses selon la face par où on les regarde » - Blaise Pascal , Pensées[8] .
Techniquement, la contextualisation de Lp lui apporte la capacité à raisonner sur les modèles : les relations logiques entre les pensées et leurs rangs sont utilisés pour sélectionner des sous-ensembles de pensées (les contextes de référence), et la fonction sémantique consolide les interprétations issues de chaque contexte.
Synthèse des propriétés de Lc
[modifier | modifier le wikicode]Dans Lc, un ensemble de connaissances est toujours syntaxiquement cohérent (« toutes les pensées sont fausses » caractérise un modèle toujours possible).
Lc respecte les règles de production syntaxique de la logique propositionnelle. Il est de ce fait syntaxiquement monotone.
Lc est sémantiquement non monotone : l’adjonction d’une nouvelle connaissance peut entraîner une modification des contextes de références, et donc des résultats de l’interprétation sémantique.
Lc a une conception perspectiviste de la connaissance : les contextes de référence identifient des sous-ensembles des connaissances (des perspectives), et l’interprétation sémantique est la somme des interprétations issues de chaque perspective. En supposant f, g et h trois formules telles que f ∧ g ⊢ h, la sémantique contextuelle peut se prononcer sur f et sur g (selon deux contextes éventuellement distincts), et dire dans le même instant que h n’est pas interprétable. Une application immédiate est la possibilité d’interpréter deux croyances f et ¬ f comme étant simultanément possibles selon deux perspectives différentes.
Lc a une conception faillibiliste de la connaissance : toute pensée pouvant être fausse, Lc interprète comme crédible une croyance dès l’instant où elle est produite par un raisonnement justifiable et qui ne la contredit pas. La justification est portée par la définition retenue pour construire les contextes de référence.
La production de pensées imaginées
[modifier | modifier le wikicode]Les langages formels classiques infèrent des formules par application du modus ponens. Ce sont des productions par déduction, l’imagination leur échappe complètement. La cohérence sémantique d'une expression qui ne serait pas produite par les règles classiques du langage formel serait forcément incertaine, et son apparition pourrait générer une explosion en logique classique.
Dans Lc, la garantie de la cohérence syntaxe permet d’étendre les connaissances par n’importe quelle autre connaissance, à condition qu’elle soit portée par une pensée nouvelle. La logique contextuelle peut donc supporter des productions par induction ou par abduction par exemple – ou, de manière générale, toute combinaison de signes syntaxiquement bien formée.
La logique contextuelle dans la famille des langages formels
[modifier | modifier le wikicode]Les logiques para-consistantes et la modélisation de l’incohérence
[modifier | modifier le wikicode]Les formalismes classiques sont fondés sur l'hypothèse que les règles syntaxiques sont autonomes des sens des propositions :
« Un langage formel est, par définition, un langage ne possédant qu'une syntaxe et pas de sémantique » - Jacques Hébenstreit, Automates et langages formels, Encyclopedia Universalis
Associée aux trois principes d’Aristote (tiers exclu (a est vrai ou faux), non contradiction (a n’est pas à la fois vrai et faux), et identité (a est a)), elle conduit au principe d’explosion. Les logiques para-consistantes se donnent comme objectif de tolérer les incohérences en échappant à l’explosion. La démarche couramment empruntée consiste à affaiblir les principes d’Aristote pour limiter les capacités d’inférence du langage. La voie empruntée par Lc est de conserver les principes d’Aristote, et de contourner l’hypothèse initiale en affirmant que les propositions élémentaires sont toutes égales face à la syntaxe, mais pas face à la sémantique.
L’approche perspectiviste de Lc lui permet alors de considérer qu’une proposition peut être vraie selon une perspective, fausse selon une autre, et que ces deux perspectives (les contextes de référence) sont vraies simultanément l’une et l’autre. Lc n’est donc pas un formalisme para-consistant. Il peut dire que a est possible et non possible, mais il n’échappe pas au principe d’explosion. Si on retient un contexte de référence qui produit syntaxiquement a ∧ ¬a, alors il produira toute croyance f quelle qu’elle soit. L’incohérence est acceptée dans la sémantique de Lc, elle reste non tolérable dans sa syntaxe.
Cela lui apporte toutefois la capacité à modéliser des paradoxes, et d'affirmer que les chevaux bon marché sont rares, et donc chers selon le sens commun (puisque, comme chacun sait, tout ce qui est rare est cher), tout en négociant dans le même instant le prix de vente dudit cheval supposé bon marché – et donc pas cher.
Les logiques modales et la modélisation des informations aléthiques
[modifier | modifier le wikicode]Pour pouvoir raisonner sur la qualité de la valeur d’interprétation, les approches modales étendent l’expressivité des langages par l’adjonction d’un nouveau connecteur. Le connecteur modal épistémique le plus utilisé est le connecteur aléthique ◻. ◻ f exprime usuellement que f est nécessaire, et son dual ¬◻¬ f, noté ◇ f, que f est possible. Le langage s’adosse sur la sémantique des mondes possibles (proposée par Saul Aaron Kripke) pour bénéficier d’une fonction d’interprétation.
La logique contextuelle conserve la syntaxe de la logique propositionnelle, et fait porter le niveau de crédibilité sur la fonction d’interprétation en exploitant une classification des propositions élémentaires (les rangs des pensées). Arnaud Kohler propose la relation suivante entre les deux formalismes[1] :
Soit une formule f. Soit i le plus haut rang des propositions élémentaires qui la composent. f est dite possible (au sens modal) s’il existe des propositions B et C de rang i+1 telles que B ⊨ f et C ⊨ ¬ f, et est nécessaire si B existe et que C n’existe pas.
Cette traduction permet de modéliser l’ensemble {◇ f, ◇¬ f}, mais pas l’ensemble limité à {◇ f}. Il est interprété comme {◻ f} tant que la connaissance C ⊨ ¬ f n’est pas introduite explicitement dans la base. Lc est donc moins expressif que le langage modal. C’est une conséquence de son caractère faillibiliste : s’il existe un raisonnement qui justifie la possibilité de f, alors f est considérée comme crédible tant que la possibilité de son contraire n’est pas explicitement exprimée.
Sous réserve d’accepter cette limite, l’apport de Lc sur les formalismes modaux est sa capacité à modéliser des informations aléthiques en restant dans le cadre de la syntaxe propositionnelle.
La monotonie et la non-monotonie
[modifier | modifier le wikicode]L’objectif de la non-monotonie est de pouvoir modéliser qu’une formule f peut être interprétée comme vraie dans un ensemble {E}, et fausse dans un ensemble {E, g}. Les langages proposés sont le plus souvent soit complètement monotones (syntaxiquement et sémantiquement), soit complètement non monotones (syntaxiquement et sémantiquement). La logique contextuelle propose un formalisme monotone syntaxiquement (si {E} produit f alors {E, g} produit f) et non monotone sémantiquement (f peut être crédible dans E et improbable dans {E, g}).
Compte tenu des principes d’adéquation (ce qui est produit est vrai) et de complétude (ce qui est vrai est produit), un langage complètement non monotone ne produit des formules que si rien ne contredit cette production. En conservant la monotonie syntaxique, la logique contextuelle échappe à cet écueil. Considérons par exemple la logique des défauts proposée par Raymond Reiter. Elle étend les règles de production par des expressions de la forme (a : b / c), qui se lisent :
« Si a est vrai et que rien ne contredit b alors c est produit »
Lc permet la modélisation et l’exploitation de règles avec exception. Toutefois, rapportée à la syntaxe de Raymond Reiter, l’expressivité de Lc se limite aux règles de la forme (a : b ∧ c / b ∧ c), en ajoutant a → b ∧ c à tous les modèles qui l’autorisent[1]. L’explication est la même que pour les langages modaux : exprimer une possibilité (par exemple « b et a → c sont possibles ») conduit à la considérer comme crédible tant que la possibilité de son contraire n’est pas explicitement exprimée.
L’enracinement épistémique
[modifier | modifier le wikicode]Le principe a été proposé par Peter Gärdenfors et David Makinson[9]. Il suppose l’existence d’une relation d’ordre qui permet de faire un choix lorsque deux informations sont contradictoires. Au-delà des questions philosophiques que cela pose, l’enracinement épistémique répond déjà à un problème technique. Un langage classique ne peut pas techniquement absorber une incohérence parce que l’incohérence syntaxique lui est interdite. Il a besoin d’une solution systématique pour y échapper.
La logique contextuelle n’a pas ce problème, puisque la cohérence syntaxique est garantie. Le principe de l’enracinement épistémique n’est donc pas pour elle une nécessité technique. Les questions philosophiques restent ouvertes.
Les logiques adaptatives
[modifier | modifier le wikicode]Pour résoudre les différents problèmes rencontrés par les logiques classiques, Diderick Batens[10] propose de considérer qu’il existe plusieurs stratégies de raisonnement. Il conviendrait de sélectionner celle la mieux adaptée à la base de connaissances. Considérons, par exemple, l’ensemble de formules suivant :
ELa = {¬ p, ¬ q, p ∨ q, p ∨ r, q ∨ r}
Il est incohérent, donc explosif dans le cadre de la logique propositionnelle. Si on adopte une stratégie favorisant la fiabilité du raisonnement, il n’est pas possible de déduire r : il serait imprudent de conclure quoi que ce soit en utilisant les trois premières formules. Cependant, si on retient une stratégie qui minimalise les anormalités, et qu’on considère qu’au moins deux des trois premières formules est vraie, alors r est produit. En logique contextuelle, l’ensemble devient :
Elp = {A⊨ ¬ p, B ⊨ ¬ q, C ⊨ p ∨ q, D ⊨ p ∨ r, E ⊨ q ∨ r}
{A, B, C} étant un contexte impossible minimal, {D, E} est le contexte de référence. En l’état des connaissances, r n’est pas interprétable. Utiliser les contextes épistémiques qui retiennent au rang 1 les contextes crédibles maximaux relève donc d’une stratégie prudente. Mais si on adopte les contextes possibles maximaux, on obtient trois contextes de référence :
{A, B, D, E}, qui produit {¬ p, ¬ q, r}
{A, C, D, E}, qui produit {¬ p, q, r}
{B, C, D, E}, qui produit {p, ¬ q, r}
Avec cette définition des contextes de référence, r est crédible. Lc n’est toutefois pas une logique adaptative :
- les deux formalismes partagent la capacité d’adapter l’interprétation sémantique aux caractéristiques locales. Lc choisit d’utiliser ou non une connaissance en fonction de l’hypothèse intégrée dans la base,
- mais son principe n’est pas d’adapter la définition de son raisonnement face à une contradiction. Elle utilise une stratégie d’inférence unique, basée sur les contextes de référence, dont la définition est établie de manière définitive selon des critères théoriques généraux. Dans l’exemple ci-dessus, une solution possible consisterait à modéliser, par une méta-pensée, le choix stratégique qu’au moins deux des pensées A, B ou C est vraie pour produire r en restant sur les contextes épistémiques.
La sémantique générale
[modifier | modifier le wikicode]Le postulat contextuel et la sémantique générale proposée par Alfred Korzybski partagent un même constat initial :
« Nous vivons souvent en fonction des représentations des "faits" autant qu’en fonction des "faits". Avant de pouvoir agir, nous devons avoir une certaine forme de représentation dans notre cerveau. Avant de pouvoir nous asseoir sur une chaise, vous devez avoir une certaine forme de représentation de cette chaise dans votre cerveau et votre système nerveux. Vous agissez en fonction de ces représentations dans votre système nerveux. » - A. Korzybski, Séminaire de sémantique générale de 1937
Mais tandis que la sémantique générale conclue à une insuffisance des approches aristotélicienne et cartésienne, le postulat contextuel considère que cet écart est connu, et que, parce que l'agent intelligent en a conscience, il doit être intégré et participer à la modélisation du langage formel. Dans Lc, la raison d'être du langage est de communiquer. Il ne modélise pas un raisonnement ou une volonté, mais exprime une pensée. Le postulat contextuel fait alors écho au mentalais (le langage de la pensée, thèse développée par Jerry Fodor), en concluant que la modélisation du raisonnement est une conséquence de la modélisation de la pensée.
Mise en perspective
[modifier | modifier le wikicode]En mathématiques
[modifier | modifier le wikicode]Il est généralement admis que la logique classique est insuffisante pour modéliser et exploiter des connaissances qui sortent d'un cadre rigoureux, comme les mathématiques par exemple. De nombreux formalismes logiques ont été développés pour y pallier, sans succès définitif.
« « La » logique, à supposer qu’il convienne encore de s’y intéresser, serait d’ailleurs, de l’aveu même des logiciens vraiment modernes, mal nommée : il n’y a que des logiques, en quantité indéfinie, qui sont comme les outils d’une trousse de bricoleur » - Daniel Andler, Introduction aux sciences cognitives[11]
Face aux difficultés rencontrées par les logiques classiques, le postulat contextuel conclue que :
Les propositions élémentaires d’un langage formel sont toutes égales face à la syntaxe, mais sont inégales face à la sémantique.
Un formalisme classique contextualisé respecte les trois principes d’Aristote, et est pourtant capable de modéliser et d’exploiter des informations aléthiques, incomplètes ou incohérentes. La contextualisation d’un langage du nième ordre sera une étape nécessaire pour enrichir l’expressivité du langage, et tester ses solutions de modélisation sur des cas plus complexes et représentatifs du raisonnement humain. A contrario de la trousse de bricoleur, la logique contextuelle ouvre des pistes de réflexions sur l'existence d'un formalisme fédérateur de l'ensemble des langages logiques.
En philosophie
[modifier | modifier le wikicode]En assujettissant toute interprétation sémantique à un contexte, Lc décorrèle les mécaniques du raisonnement (les trois principes d'Aristote) des mécaniques de la pensée (l'interprétation sémantique), contournant ainsi le dogme de l'adéquation et de la complétude. Le formalisme obtenu présente quelques singularités comportementales, caractéristiques d'une approche faillibiliste et perspectiviste de la connaissance :
- une connaissance n'affirme pas la certitude d'un fait, mais uniquement la conscience d'une description de ce fait supposé par une phrase dans le langage,
- l'ensemble des croyances est composé de sous-ensembles de croyances non joints - et non joignables,
- la modélisation des paradoxes est possible, et est nécessaire au processus d'interprétation - qui lui-même s'adosse à une mécanique de production syntaxique totalement aristotélicienne,
- le raisonnement ne peut se faire sans confrontation à des faits ou à des hypothèses - sans hypothèse, rien est,
- le doute est intrinsèque au langage - tout est faux est un modèle acceptable de toute base de connaissances contextuelles.
Ces comportements requestionnent l'idée selon laquelle limiter la pensée à ce qui est logique l'appauvrirait, et enrichit les réflexions sur les relations entre pensée et langage[12].
En sciences cognitives
[modifier | modifier le wikicode]En supposant l’ensemble exhaustif des connaissances, l’application du postulat contextuel conduit à considérer que toutes les pensées sont possiblement fausses, et que toute autre proposition élémentaire est improbable[6]. Face à lui-même, un système cognitif appliquant un raisonnement contextuel serait, dans l’absolu, condamné à douter de tout. Les sciences cognitives proposent une réponse à ce problème. Les recherches ont conduit à distinguer la Mémoire à Long Terme (MLT, contenant l’ensemble des connaissances) et la Mémoire à Court Terme (MCT, contenant les connaissances utilisées à un instant t pour réagir à un stimulus). Des seuils cognitifs ont été identifiés, qui bordent la fonction de sélection des données de la MCT :
- le changement minimal : le contenu de la MCT évolue a minima entre deux instants,
- le critère d'évolution, parfois assimilé à l’enracinement épistémique : la MCT privilégie la convocation de connaissances dites primitives, ou les plus récentes,
- les seuils d'incapacités techniques : la MCT ne peut exploiter simultanément qu’un nombre limité (et apparemment faible) de connaissances,
- les seuils sémantiques : les travaux de Jacques Pitrat montrent qu'un humain n'est pas capable de raisonner sur plus de quatre niveaux de méta-connaissances,
- le seuil du raisonnement proportionné : confronté à un stimulus, l’objectif n’est pas de réaliser la meilleure analyse théorique, mais d’atteindre un niveau d’analyse suffisant pour entraîner une réaction.
Dans un formalisme classique, une nouvelle information doit être confrontée à la totalité de la base (la MLT) pour garantir le maintien de sa cohérence syntaxique. Un langage contextualisé peut s’autoriser à interpréter une nouvelle information uniquement sur un sous-ensemble (la MCT). C’est une réponse possible à la question de « l’inférence non démonstrative », concept mis en avant ces dernières années par quelques auteurs[11]. Dans Lc, la production syntaxique est complètement aristotélicienne. Les sciences cognitives invitent à l’adosser à une fonction de sélection des connaissances, qui relève d’une logique « pragmatique » (les seuils cognitifs répondent à l’évidence à des contraintes de faisabilité), formalisable mais distincte de celle du langage formel.
Le modélisation du test suivant devient dès lors abordable. Après avoir, d’une manière ou une autre, introduit l’idée de la couleur blanche dans les pensées immédiates d’une personne, nous lui demandons de répondre rapidement à la question suivante : « Que boit la vache ? ». Sa première réponse sera très souvent « Du lait », qu’elle corrigera après quelques secondes de réflexion. Ce test utilise des capacités de raisonnement et des mécaniques d’adaptation au contexte externe. Une forme de production de pensée imaginée est appliquée, utilisant les connaissances qu’une vache boit un liquide et que le lait est un liquide, et la plupart des seuils cognitifs est exploitée.
Les sciences cognitives sauvent du risque de paralysie généré par le raisonnement contextuel : quand bien même nous bénéficierions d’un ensemble de connaissances exhaustif, les seuils limiteraient notre capacité à exploiter toutes les informations disponibles.
En Intelligence Artificielle
[modifier | modifier le wikicode]Toutes les applications de l'IA, qu’elles relèvent de l'approche symbolique (par les langages formels) ou de l'approche connexionniste (par les réseaux de neurones), ont à ce jour une limite commune : elles relèvent de l’IA dite faible. Les systèmes captent, raisonnent et interagissent, dans le contexte environnemental pour lesquels ils ont été conçus, aux questions que leurs concepteurs avaient anticipées, et répondent mécaniquement selon les processus plus ou moins complexes qui leur ont été inculqués : ils réagissent à ce pour quoi, et de la manière dont, il était prévu qu’ils réagissent.
Dans la mécanique de raisonnement, la statistique apporte à l’IA connexionniste une capacité d’induction qui fait défaut à l’IA symbolique. Et le Big Data lui ouvre une dimension vertigineuse. Mais son application a des limites. Par exemple, avec les outils actuels, l’absorption par une IA connexionniste de plusieurs milliers d’images de chat ne lui garantit pas la reconnaissance d’un chat avec une certitude de 100%. Dans le même temps, l’être humain obtient des résultats au moins équivalents à partir de quelques photos. Une forte probabilité d’occurrence ne semble pas suffire : la machine doit pouvoir modéliser des idées abstraites, mais aussi être consciente de ses raisonnements et de ses émotions. Cela, ce sera l’IA dite générale, ou forte.
À défaut d'y parvenir, une voie de recherche très empruntée consiste à tenter de simuler l'intelligence humaine au travers d'outils de plus en plus performants. Les limites calculatoires semblant atteintes, de grands espoirs sont fondés sur l'avènement annoncés des calculateurs quantiques, qui démultiplieront le nombre de données traitables. La complexité calculatoire tiendra lieu d'intelligence en rendant impossible toute traçabilité. Dans cette voie (honorable et intéressante par ailleurs), la question n'est pas d'établir un agent intelligent, mais de construire un outil tellement complexe qu'il devient impossible de savoir s'il l'est ou pas.
En modélisant la pensée dans le langage formel, la logique contextuelle apporte au système intelligent un formalisme qui lui permet d'avoir conscience et de raisonner par introspection, en modélisant des relations entre des propositions élémentaires (ou des ensembles de propositions) qui peuvent être associées à des pensées, des actions ou des émotions[13]. Il faut toutefois éviter le piège de l’anthropomorphisme ou celui du mythe de Frankenstein, en définissant ce qu'est une émotion dans le cadre de l'IA, et les réflexes auxquelles elle doit être associée : les réponses sont directement dépendantes du corporel de l’agent intelligent. Les émotions et les motivations que ressentira une IA forte seront, selon toute vraisemblance, très éloignées de celle d'un être humain.
Références
[modifier | modifier le wikicode]- ↑ 1,0 1,1 1,2 et 1,3 Arnaud Kohler, « Proposition d’une structure de représentation de la connaissance pour les raisonnements non classiques », Université d’Aix-Marseille I, France, thèse de doctorat en informatique, 1995
- ↑ Nicolas Gauvrit, « La logique contextuelle », Thèse en informatique, Paris, EHESS, 1er janvier 2001
- ↑ Yvon Gauthier, « De la logique interne », Vrin - Mathesis, (ISBN 978-2-7116-1048-8) - avril 1991
- ↑ René Descartes, « Méditations métaphysiques. Objections et Réponses (I à VI) », édition sous la direction de Jean-Marie Beyssade et de Denis Kambouchner, éd. Gallimard Tel (2018), 1641
- ↑ Ludwig Wittgenstein, Tractatus logico-philosophicus, traduction Gilles Gaston Granger, éd. Gallimard Tel (1993), 1921
- ↑ 6,0 et 6,1 Arnaud Kohler, « La logique contextuelle - Entre langage formel et langage naturel », Université de Lorraine (hal-02120285), 2020
- ↑ Jacques Pitrat, Méta-connaissance, Futur de l'Intelligence Artificielle, Hermes, 1990
- ↑ Blaise Pascal, Pensées , no 99 édition Brunschvicg
- ↑ Peter Gärdenfors & David Makinson, Relations between the logic of theory change and nonmonotonic logic, in André Fuhrmann and Michael Morreau, eds. The Logic of Theory Change, LNAI-465, 1991
- ↑ Diderick Batens, Une caractérisation générale des logiques adaptatives, Logique & Analyse 173–174–175, 2001
- ↑ 11,0 et 11,1 Daniel Andler, Introduction aux sciences cognitives, Gallimard, 2004
- ↑ Arnaud Kohler, « Les cultures et les langages formels », LTML (hal-02320997), 2019
- ↑ Arnaud Kohler, « Relation entre IA symbolique et IA forte », Université de Lorraine (hal-02444894), 2020