La suggestion de l'orthographe correcte

Discussions à propos du traitement de textes Writer mais également sur l'éditeur HTML.
Les questions sur les macros doivent être postées dans la section dédiée en dessous.

Modérateur : Vilains modOOs

OlivierR
SuppOOrter
SuppOOrter
Messages : 1037
Inscription : 24 mai 2006 22:34
Localisation : Lorraine, France
Contact :

La suggestion de l'orthographe correcte

Message par OlivierR »

Un correcteur orthographique ne se contente pas de reconnaître les mots corrects et de souligner les formes erronées, il doit aussi être capable de suggérer l'orthographe correcte.

Pour ce faire, nous disposons de peu de moyens. Dans le fichier des affixes, qui définit les règles de déclinaison-conjugaison, il y a quelques commandes qui permettent d'aider le correcteur à suggérer les formes correctes.

TRY - Cette ligne indique les caractères avec lesquels jouer:

Code : Tout sélectionner

TRY aàâäbcçdeéèêëfghiîïjklmnoôöpqrstuùûüvwxyzæœAÀÂÄBCÇDEÉÈÊËFGHIÎÏJKLMNOÔÖPQRSTUÙÛÜVWXYZÆŒáíÿñåóşăã
Ces lignes associent les caractères affiliés :

Code : Tout sélectionner

MAP 12
MAP aàâä
MAP eéèêë
MAP iîïy
MAP oôö
MAP uùûü
MAP cç
MAP AÀÂÄ
MAP EÉÈÊË
MAP IÎÏY
MAP OÔÖ
MAP UÙÛÜ
MAP CÇ
REP - Cette commande associe des groupes de caractères :

Code : Tout sélectionner

REP 60
REP f ph
REP ph f
REP c qu
REP qu c
REP k qu
REP qu k
REP x ct
REP ct x
REP bb b
REP b bb
REP cc c
REP c cc
REP ff f
REP f ff
REP ll l
REP l ll
REP mm m
REP m mm
REP nn n
REP n nn
REP pp p
REP p pp
REP rr r
REP r rr
REP ss s
REP s ss
REP ss c
REP c ss
REP ss ç
REP ç ss
REP tt t
REP t tt
REP œ oe
REP oe œ
REP æ ae
REP ae æ
REP ai é
REP é ai
REP ai è
REP è ai
REP ai ê
REP ê ai
REP ei é
REP é ei
REP ei è
REP è ei
REP ei ê
REP ê ei
REP o au
REP au o
REP o eau
REP eau o
REP disez dites
REP fesez faites
REP faisez faites
REP sanctionnable punissable
REP questionnable discutable
REP décrédibilis discrédit
REP antitartre détartrant
REP puit puits
Comme vous le voyez, il est aussi possible de suggérer la correction de barbarismes ou d'erreurs récurrentes.


KEY - Cette commande permet de décrire le clavier (et devrait permettre au correcteur de mieux repérer les erreurs de frappe) :

Code : Tout sélectionner

KEY azertyuiop|qsdfghjklmù|wxcvbn|aéz|yèu|iço|oàp|aqz|zse|edr|rft|tgy|yhu|uji|iko|olpm|qws|sxd|dcf|fvg|gbh|hnj
KEY est une nouvelle fonctionnalité de Hunspell qui ne servira que dans les prochaines versions du dictionnaire et d'OOo.


MAXNGRAMSUGS - Cette commande permet d'étendre le nombre de suggestions faites par le correcteur.

Code : Tout sélectionner

MAXNGRAMSUGS num
Cette valeur n'est pas définie dans le fichier des affixes. Le nombre d'entrées suggérées est donc celui par défaut.
Dernière modification par OlivierR le 17 mars 2009 10:11, modifié 4 fois.
LibreOffice 7.1Windows 10Grammalecte, correcteur grammatical et orthotypographique
OlivierR
SuppOOrter
SuppOOrter
Messages : 1037
Inscription : 24 mai 2006 22:34
Localisation : Lorraine, France
Contact :

Re: La suggestion de l'orthographe correcte

Message par OlivierR »

Comparaison des correcteurs d'OOo et de Word, par Agnès Souque :
http://fr.openoffice.org/docs/AnalyseCr ... ue1107.pdf (2006)

L'analyse datant de 2006, les résultats devraient être meilleurs pour OOo, puisqu'à cette époque, OOo était très mauvais avec les mots accentués et les doubles consonnes. Les lignes REP et MAP dont j'ai parlé plus haut ont grandement amélioré la suggestion sur cet aspect, mais c'est encore perfectible.
Dernière modification par OlivierR le 04 mars 2009 11:48, modifié 1 fois.
LibreOffice 7.1Windows 10Grammalecte, correcteur grammatical et orthotypographique
Pierre
Membre hOOnoraire
Membre hOOnoraire
Messages : 142
Inscription : 25 nov. 2005 10:29
Localisation : Tours - France

Re: La suggestion de l'orthographe correcte

Message par Pierre »

Bonjour à tous,

Comment améliorer les suggestions du correcteur orthographique ?

Lorsque nous tapons francois, le correcteur ne propose ni François, ni français ...
Autre exemple détérer ne suggère pas déterrer alors que détèrer nous le propose !

A bientOOot
Synanceia (Pierre)
OOo 3.2 - WinXP Pro-SP3, Win-7, Ubuntu 9.10
--
Vive la liberté !
Merci à tous les contributeurs des projets libres.
OlivierR
SuppOOrter
SuppOOrter
Messages : 1037
Inscription : 24 mai 2006 22:34
Localisation : Lorraine, France
Contact :

Re: La suggestion de l'orthographe correcte

Message par OlivierR »

Bonjour Pierre,

C'est plutôt énigmatique.
Pourquoi, avec détèrer, le correcteur arrive à suggérer déterrer, mais pas avec détérer, je n'en ai pas la moindre idée.

Par contre, je dirais que le domaine des commandes MAP et REP demande à être exploré. Pour l'instant, je me suis contenté de créer ce qui me semblait évident, mais je n'ai jamais fait de tests poussés.

Par exemple, rien qu'en ajoutant la ligne:

Code : Tout sélectionner

MAP fF
Le correcteur parvient à suggérer François au lieu de francois.
LibreOffice 7.1Windows 10Grammalecte, correcteur grammatical et orthotypographique
OlivierR
SuppOOrter
SuppOOrter
Messages : 1037
Inscription : 24 mai 2006 22:34
Localisation : Lorraine, France
Contact :

Re: La suggestion de l'orthographe correcte

Message par OlivierR »

Bonjour à tous,

J'ai discuté de ça avec l'auteur de Hunspell.

Voilà ce qu'il m'a dit:

Hunspell utilise un mélange de plusieurs algorithmes.

L'algorithme basé sur la ligne TRY recherche toutes les suggestions possibles à une distance de Levenshtein de 1 depuis le mot mal orthographié.

Dans le cas, d'une substitution réussie avec cet algorithme, il n'y a pas de recherche dans le dictionnaire.
La raison principale est le gain de temps. Mais les futures versions de Hunspell ne contiendront pas cette limitation.

La prochaine version de Hunspell fera une recherche dans le dictionnaire, même si l'algorithme de TRY trouve quelque chose. Ça étendra donc le domaine de recherche.

Les lignes MAP et REP ne sont pas utilisées par l'algorithme de suggestion basé sur le dictionnaire. C'est pourquoi les caractères accentués sont aussi éloignés qu'un autre du même caractère accentué.
Et, dans cet algorithme, l'ajout ou le retrait d'une lettre est considéré comme plus coûteux que la substitution d'une lettre par une autre. C'est pourquoi changer, par exemple, mm en m sera moins bien évalué que changer mm en me.

En gros, il n'y a pas grand chose à faire, hormis attendre que Hunspell s'améliore.
LibreOffice 7.1Windows 10Grammalecte, correcteur grammatical et orthotypographique
Pierre
Membre hOOnoraire
Membre hOOnoraire
Messages : 142
Inscription : 25 nov. 2005 10:29
Localisation : Tours - France

Re: La suggestion de l'orthographe correcte

Message par Pierre »

Merci pour ton enquête et surtout pour tes explications :super:
Synanceia (Pierre)
OOo 3.2 - WinXP Pro-SP3, Win-7, Ubuntu 9.10
--
Vive la liberté !
Merci à tous les contributeurs des projets libres.
Répondre