Le dictionnaire français classique

Questions liées au programme de setup ou à l'installation ainsi que des problèmes d'ordre général qui ne sont pas liés à un module spécifique (dictionnaire, impression, etc).

Modérateur: Vilains modOOs

Le dictionnaire français classique

Messagepar Vazkor » 29 Juin 2007 13:14

Salut,

Pour éviter les hors sujet dans le fil de discussion [Tuto] Correcteur d'orthographe, je préfère démarrer une autre discussion pour placer nos commentaires, résultats des tests, etc.

Je viens de me livrer à un test de mon dictionnaire actuel avec une liste de plus de 250 000 mots récupérée il y a des mois sur le site d'ABU-CNAM.
Sur 20 006 mots commençant par a, 569 ne sont pas reconnus (< 3%). Et il y a dans cette liste un paquet de mots exotiques sur lesquels j'ai fait l'impasse ou que j'ai omis parce que trop proches de mots courants : ave <> avec, interjection aïe <> aie, abréviation am <> an, ablier <> fablier, sablier, tablier, ...
Et je n'ai pas compté les mots fautifs, selon moi qui je ne suis pas linguiste.

Faut-il ajouter tous les mots en -iste, -isme, -ment, -able, -ible, en anti- ne posant normalement pas de problème ? Je ne le pense pas.

Personnellement, j'estime que quand on utilise un mot de derrière les fagots, on sait l'écrire et on fait attention. C'est le cas de tous les mots très techniques, faisant partie du jargon scientifique.

Faut-il vouloir incorporer dans le dictionnaire des mots que personne ne rencontrera au cours de toute une vie, à moins que cela ne fasse partie du jargon de sa profession ?

De toute façon, il faut bien choisir de s'arrêter quelque part. Le but n'est pas de recopier un dictionnaire en 12 volumes. Je ne pense pas que cela aide l'utilisateur lambda d'OOo ou Firefox, bien au contraire si cela risque de masquer ses fautes de frappe.

Je préfère de loin que le vérificateur attire mon attention en soulignant à tort un mot existant mais absent du dico, que de ne pas souligner une faute de frappe parce que malheureusement pour moi ce mot existe bel et bien mais n'est que très rarement employé alors que ce n'est pas celui-là que je voulais taper.

@+
OOo 3.0.0 sous Windows 2000
Avatar de l’utilisateur
Vazkor
Membre OOrganisé
Membre OOrganisé
 
Message(s) : 74
Inscrit le : 28 Juin 2007 20:03
Localisation : Belgique, Liège + 5 Km

Messagepar Papayes » 29 Juin 2007 13:29

Bonjour,

Je te remercie de ton travail extra.
Aussitôt essayé, aussitôt adopté.

Vazkor a écrit:Personnellement, j'estime que quand on utilise un mot de derrière les fagots, on sait l'écrire et on fait attention. C'est le cas de tous les mots très techniques, faisant partie du jargon scientifique.

Je suis de ton avis, si j'utilisais un mot très technique comme polytétrafluoroéthylène ,
je le mettrai tout simplement dans mes AutoTextes!

A+
papayes
Dernière édition par Papayes le 29 Juin 2007 13:31, édité 1 fois.
"Tout ce qui n'est pas donné est perdu"
Avatar de l’utilisateur
Papayes
Membre fOOndateur
Membre fOOndateur
 
Message(s) : 4154
Inscrit le : 07 Déc 2005 14:55
Localisation : Vic-Fezensac dans le Gers

Messagepar Dude » 29 Juin 2007 13:30

Par dictionnaire, on entend effectivement mots usuels. Avoir un dico trop gros risque ensuite de ralentir les petites configurations.

8)
Poser une question, c'est bien. Répondre aux autres, c'est encore mieux.
Améliorez AOO et votez pour les issues
Avatar de l’utilisateur
Dude
Grand Maître de l'OOffice
Grand Maître de l'OOffice
 
Message(s) : 22277
Inscrit le : 03 Mars 2006 08:45
Localisation : 127.0.0.1

Messagepar Vazkor » 29 Juin 2007 13:44

Salut,

Serais-tu aussi chimiste pour prendre justement cet exemple-là ?

Je vais me présenter rapidement en toute modestie (hum !)
Né en juillet 1945 au pays de Herve, je suis un Liégeois pure souche.
J'ai eu la chance d'être plutôt bon élève au cours de mes études.
Toujours dans les trois premiers de la classe au cours des primaires, dans les dix premiers au cours de mes humanités anciennes (latin-grec).
A l'Univ ça a été moins brillant mais j'ai été chercher une licence ès sciences chimiques après des humanités qui ne m'y préparaient guère.

Ensuite, parce que je n'avais pas de boulot en vue, j'ai choisi de rempiler à la fin de mon service militaire et j'ai fait une carrière complète comme Officier des Troupes du Service Médical.
Cela m'a non seulement obligé à devenir bilingue français-néerlandais, mais aussi à apprendre un peu beaucoup d'allemand et d'anglais usuel, et surtout à perfectionner mon français pourtant déjà excellent parce que j'ai énormément rédigé avec des chefs plutôt teigneux avec l'orthographe et même le style utilisé.
Cela me faisait râler quand un colonel d'origine flamande critiquait mes traductions.

Maintenant que je me repose après 26 ans de carrière, j'ai toujours un vrai radar à débusquer les "phôtes de Laure Tograff" et je me débrouille plus que bien en grammaire et syntaxe.

Mon dada a été pendant des années la sécurité informatique, après la sécurité militaire (cryptographie, etc.) Mon palmarès c'est ça rien que sur Assiste et près de 10.000 messages sur Mémoclic.


@+
Dernière édition par Vazkor le 17 Jan 2008 23:13, édité 2 fois.
OOo 3.0.0 sous Windows 2000
Avatar de l’utilisateur
Vazkor
Membre OOrganisé
Membre OOrganisé
 
Message(s) : 74
Inscrit le : 28 Juin 2007 20:03
Localisation : Belgique, Liège + 5 Km

Messagepar Vazkor » 29 Juin 2007 15:05

Salut,

Je continue mes tests avec la "mégaliste" de mots déclinés d'ABU.
N'allez donc pas trop vite pour officialiser le dico.
J'y trouve encore quelques fautes à l'occasion, mais avec des mots comme blondir où j'avais blondira/x au lieu de blondirai/X.

Ce sont de petites erreurs qui échappent facilement tant que l'on ne rencontre pas le mot dans un texte et avec un verbe c'est une série de formes qui est soulignée.

@+
OOo 3.0.0 sous Windows 2000
Avatar de l’utilisateur
Vazkor
Membre OOrganisé
Membre OOrganisé
 
Message(s) : 74
Inscrit le : 28 Juin 2007 20:03
Localisation : Belgique, Liège + 5 Km

Messagepar Dude » 29 Juin 2007 15:16

Vazkor a écrit:mais avec des mots comme blondir où j'avais blondira/x au lieu de blondirai/X.

Blondir : c'est pour faire de la cuisine ou de la coiffure ? :mrgreen:
Poser une question, c'est bien. Répondre aux autres, c'est encore mieux.
Améliorez AOO et votez pour les issues
Avatar de l’utilisateur
Dude
Grand Maître de l'OOffice
Grand Maître de l'OOffice
 
Message(s) : 22277
Inscrit le : 03 Mars 2006 08:45
Localisation : 127.0.0.1

Messagepar Vazkor » 29 Juin 2007 15:42

Salut,

Je n'en sais rien alors que ce mot je le dis au moins 100 fois par jour :D

Je rigole toujours quand je vois abaca tout au début du dictionnaire.
Définition du Larousse :
abaca nom masculin (esp. abacá)
Bananier des Philippines, dont les feuilles fournissent une matière textile, le chanvre de Manille. (Famille des musacées.)

et un peu plus bas, abacule qui lui est même inconnu du TLFi

C'est le genre de mots très utiles .... pour qui joue au Scrabble ou fait des mots croisés, mais pas vraiment pour nous ...

On voit bien que le dictionnaire de Pythoud a été créé pour le projet GUTenberg, donc avec un tas de mots littéraires, exotiques ou vieillis que l'on peut rencontrer en corrigeant des bouquins qui datent de plus de 70 ans quand ce n'est pas des siècles.

@+
Dernière édition par Vazkor le 09 Juil 2007 10:16, édité 4 fois.
OOo 3.0.0 sous Windows 2000
Avatar de l’utilisateur
Vazkor
Membre OOrganisé
Membre OOrganisé
 
Message(s) : 74
Inscrit le : 28 Juin 2007 20:03
Localisation : Belgique, Liège + 5 Km

Messagepar Vazkor » 29 Juin 2007 16:01

Re,
Dude a écrit:Avoir un dico trop gros risque ensuite de ralentir les petites configurations.

Avec mon PC de 5 ans déjà avec processeur AMD Athlon XP 1700+ et seulement 500 Mo de RAM, je ne rencontre pas de problème même avec une vingtaine d'icônes qui siègent en permanence dans la zone de notification et souvent une quinzaine de fenêtres ouvertes.

Le vrai danger vient plutôt d'un dico trop complet qui accepte des mots que l'on tape par erreur (parce qu'ils existent, même si on ne le sait pas) et ne souligne donc pas nos inévitables fautes de frappe.

@+

PS : Maintenant que j'ai mis à jour mon profil, c'est fini d'être ici incognito. Mon avatar de défenseur des loups est bien trop connu.
Dernière édition par Vazkor le 02 Juil 2007 18:14, édité 1 fois.
OOo 3.0.0 sous Windows 2000
Avatar de l’utilisateur
Vazkor
Membre OOrganisé
Membre OOrganisé
 
Message(s) : 74
Inscrit le : 28 Juin 2007 20:03
Localisation : Belgique, Liège + 5 Km

Messagepar Vandeput » 30 Juin 2007 17:54

Bonjour,

Un autre belge vous salue, tout aussi bilingue (race non reconnue et donc forcément non protégée - celle-là je ne pouvais pas la loupé !), mais non pas français-néerlandais comme mon compatriote, mais bien néerlandais-français.
Non pas de Liège, mais de Bruxelles (- 20 km en venant de Liège)

Il est vrai que les dictionnaires m'énervent aussi ... parfois.
A titre d'exemple : travaux de "zinguerie" est signalé comme fautif, et zingue rie (en deux mots) est proposé comme alternative.
(vous avez compris, j'étais "dans" le bâtiment)

J'ai souvent remarqué que la correction de mots reconnus comme fautifs, alors qu'ils ne le sont pas, consiste tout simplement à y inclure une espace.
Le problème n'est pas d'ajouter l'orthographe exacte au dictionnaire, mais bien de supprimer l'existante.

Quelqu'un aurait-il une idée ?
andré
2.2 sous Windows XP
Vandeput
Membre enthOOusiaste
Membre enthOOusiaste
 
Message(s) : 409
Inscrit le : 12 Fév 2007 15:33
Localisation : Bruxelles

Messagepar Vazkor » 30 Juin 2007 22:31

Salut,

Le vérificateur suggère "zingue rie" parce qu'il connaît ces deux mots séparés et pense à tort qu'il manque une espace : zingue comme forme de zinguer et rie comme forme de rire.

La solution est d'ajouter toi-même "zinguerie" ou "zinguerie/S" au dictionnaire (avec /S, si tu penses que le pluriel est utile).
Note que le Petit Larousse sur CD-ROM en ma possession ne connaît pas ce mot.

Sans vouloir casser du sucre sur le dos de l'auteur d'un certain dico pour le projet GUTenberg, on y trouve ces mots tout à fait inutiles dont la présence est donc indispensable dans un dico de vérification d'orthographe :
zingari
zingaro
zinjanthrope/S
zinnia/S
zinzin/S

zinzinulai/w
zinzinulais/v
zinzinulé
zinzinule/u
zinzinuler
zinzinulerai/x
zinzolin

Zinjanthrope, zinnia et zinzin mis à part, le reste est inconnu du Larousse !

@+
Image

P.S. : Je suis d'Alleur, commune d'Ans, première gare à la sortie de Liège sur la ligne Liège-Oostende. Mais j'indique toujours Liège + 5 km pour éviter aux Français et Québécois d'ouvrir un atlas.
Je conseille d'ailleurs toujours sur les forums de se situer par rapport à une grande ville connue de la plupart (une préfecture, par exemple) et non en disant qu'on est de tel département ou région. Le pire c'est quand un français dit qu'il est du 51 :twisted:
OOo 3.0.0 sous Windows 2000
Avatar de l’utilisateur
Vazkor
Membre OOrganisé
Membre OOrganisé
 
Message(s) : 74
Inscrit le : 28 Juin 2007 20:03
Localisation : Belgique, Liège + 5 Km

Messagepar Pierre-Yves Samyn » 01 Juil 2007 05:39

Vazkor a écrit:Zinjanthrope, zinnia et zinzin mis à part, le reste est inconnu du Larousse !


Pour toutes les formes de zingaro et zinzinuler (chanter pour de petits oiseaux), cela m'étonne... ? Les zingari ne sont-ils pas connus pour aimer zinzinuler ?

Vazkor a écrit:Le pire c'est quand un français dit qu'il est du 51


A moins qu'il ne fasse référence à sa consommation, un peu comme si un habitué du Carré se recommandait du péké, ou du coupé menthe...

Quoique non, à la réflexion, c'est peu probable :)
Pierre-Yves Samyn
Grand Maître de l'OOffice
Grand Maître de l'OOffice
 
Message(s) : 11276
Inscrit le : 02 Mai 2006 09:42

Messagepar Vazkor » 01 Juil 2007 13:06

Salut,

Je continue à tester le dico avec la liste d'ABU-CNAM. Les mots commençant par les lettres a à e sont validés, soit 111725 mots sur 251312.
J'ai bien sûr encore découvert de petites erreurs dans mon dico.

Les mots exotiques ne me dérangent pas dans la mesure où ils ne ressemblent pas à des mots nettement plus fréquents.

Je viens ainsi de liquider sans hésiter toute la série ébaubie à ébaubîtes, ébaubir étant strictement voisin de ébaudir au sens des linguistes.

Je veux éviter que des fautes de frappe soient acceptées à tort parce que des mots exotiques trop proches sont dans le dico.

Je m'y colle à nouveau...

@+
OOo 3.0.0 sous Windows 2000
Avatar de l’utilisateur
Vazkor
Membre OOrganisé
Membre OOrganisé
 
Message(s) : 74
Inscrit le : 28 Juin 2007 20:03
Localisation : Belgique, Liège + 5 Km

Messagepar Vazkor » 02 Juil 2007 17:02

Salut,

Vérification terminée.
De la liste de plus de 250.000 mots de ABU-CNAM, seulement 7455 mots n'ont pas été reconnus, soit 3 %.

Si l'on tient compte que cette liste contient :
1. pas mal d'erreurs : mots inconnus même du TLFi, adjectifs verbaux déclinés à tort, conjugaison complète de verbes impersonnels
2. des mots vraiment trop rares (et parfois trop proches de mots courants) sur lesquels j'ai fait l'impasse.
3. les formes simples telles que absentais et absentait, alors que le dico fr-FR ne reconnaît que les formes précédées du pronom personnel élidé (m'absentais, t'absentais, s'absentait), formes pour lesquelles je n'ai pas toujours testé toutes les possibilités,

alors le pourcentage de mots non-reconnus est encore nettement inférieur.

Cette vérification m'a surtout été utile pour débusquer encore une série d'erreurs de drapeau telles que /w après un futur, et plus insidieux un /Y à la place d'un /y, erreur difficile à repérer quand on balaie rapidement la liste de mots.

La dernière version 2007 de mon dico est disponible sur mon site à l'adresse suivante (modifiée ce 02/06/2008) :
http://perso.latribu.com/rocky2/mydico.html
Pour l'installation automatique dans Firefox et Thunderbird j'ai créé le fichier xpi nécessaire.

Cette version peut maintenant être largement diffusée.

@+
Dernière édition par Vazkor le 03 Juin 2008 13:53, édité 2 fois.
OOo 3.0.0 sous Windows 2000
Avatar de l’utilisateur
Vazkor
Membre OOrganisé
Membre OOrganisé
 
Message(s) : 74
Inscrit le : 28 Juin 2007 20:03
Localisation : Belgique, Liège + 5 Km

Messagepar Vazkor » 02 Juil 2007 17:23

Salut,

Maintenant "zinguerie", inconnu du Petit Larousse Illustré sur CD-ROM, mais bien repris au TLFi, est correctement reconnu.

Il faut aussi remarquer que s'il y a deux erreurs dans un mot, le vérificateur est incapable de suggérer le mot correct.

Pour les mots composés et œ je n'ai toujours pas trouvé la solution.
Si j'examine les fichiers dic et aff proposés pour tenir compte de la ligature œ, j'y trouve le caractère "½" à la place de "œ". Quand je l'ai testé, cela n'a rien changé. Peut-être n'aurais-je pas dû corriger cette erreur apparente.

@+
OOo 3.0.0 sous Windows 2000
Avatar de l’utilisateur
Vazkor
Membre OOrganisé
Membre OOrganisé
 
Message(s) : 74
Inscrit le : 28 Juin 2007 20:03
Localisation : Belgique, Liège + 5 Km

Messagepar Bidouille » 03 Juil 2007 07:56

Vazkor a écrit:Le pire c'est quand un français dit qu'il est du 51 :twisted:

Oui les français de France ont tendance à croire qu'ils sont seuls au monde.

Devinette : comment appelle t-on une personne qui ne parle qu'une seule langue ?
Réponse : un français
Avatar de l’utilisateur
Bidouille
RespOOnsable forum
RespOOnsable forum
 
Message(s) : 10582
Inscrit le : 08 Nov 2005 17:23
Localisation : Brest, France

Messagepar Vazkor » 03 Juil 2007 16:01

Bonjour Bidouille,

Quel honneur de voir que le grand chef s'intéresse à mes écrits !
Pour les mots composés et œ je n'ai toujours pas trouvé la solution.
Si j'examine les fichiers dic et aff proposés pour tenir compte de la ligature œ, j'y trouve le caractère "½" à la place de "œ". Quand je l'ai testé, cela n'a rien changé. Peut-être n'aurais-je pas dû corriger cette erreur apparente.

Eh bien, j'aurais dû conserver ces caractères ½ parce que ça fonctionne contre toute apparence.

J'ai incorporé ce caractère dans mes affixes et ajouté les lemmes le contenant à mon fichier fr-FR.dic pour Firefox et Bingo ! les ligatures œ sont bien acceptées même dans la conjugaison ô combien indispensable de œilletonner.
Si j'entre correctement le œ (avec Alt+0156) dans œvre, le mot est souligné et œuvre et ivre me sont proposés dans cet ordre, ce qui est parfaitement correct .

contre-coeur contre-cœur et même coeur-contre et cœur-contre c'est indifférent! Le dico ne souligne rien !
contrecoeur et contrecœur sont aussi acceptés ainsi que et cœur-contre mais pas cœurcontre

Comme je l'ai toujours dit jusqu'à présent insérer les mots composés dans le dico ne sert strictement à rien actuellement.

La nuit dernière, j'ai encore corrigé les conjugaisons de ouïr et de oindre, qui étaient incomplètes.
Cela m'énervait de voir que "oyais" passait mais pas "Oyez, bonne gens ! " qui est pratiquement la seule forme que l'on rencontre.

Un de vos spécialistes pourra bientôt proposer ce dictionnaire français classique corrigé et amélioré à la communauté OpenOffice.
Je suppose que vous y avez vos contacts. Moi je n'y connais personne et j'écris très mal l'anglais que je lis pourtant sans le moindre problème (méconnaissance de la grammaire et de la syntaxe).

Taille actuelle de mon dico : 999 Ko pour 81664 lemmes avec les commentaires. Je ne l'ai pas fait exprès, je l'jure .

J'hésite à retirer les quelques 120 lemmes avec "oe" après ajout des lemmes avec "œ", ligature que je n'utilise pas souvent mais que je rencontre dans des textes que je corrige sur Wikipédia.
Les marquer d'un commentaire serait peut-être une bonne idée, laissant à l'utilisateur final la possibilité de les retrouver facilement et de décider de les conserver ou pas.

J'espère vraiment achever ce travail avant ce vendredi 13 juillet, pour mon anniversaire... Et cela fera pratiquement un an jour pour jour que je suis là-dessus, puisque je retrouve des fichiers de travail datés du 2/8/2006.

Cordialement,
Dernière édition par Vazkor le 04 Juil 2007 14:31, édité 1 fois.
OOo 3.0.0 sous Windows 2000
Avatar de l’utilisateur
Vazkor
Membre OOrganisé
Membre OOrganisé
 
Message(s) : 74
Inscrit le : 28 Juin 2007 20:03
Localisation : Belgique, Liège + 5 Km

Messagepar Vazkor » 04 Juil 2007 03:44

Salut,

Personne ne me répond.
C'est trop injuste. J'aime pas parler dans le vide...

J'ai encore comme projet (moins urgent) de scinder ce dictionnaire trop complet en un dictionnaire de base et un dictionnaire spécialisé à fusionner éventuellement. En fait c'est la démarche inverse de celle de Christophe Pythoud, qui lui a fusionné des dictionnaires partiels en un seul avec comme résultat que des lemmes se retrouvaient affublés de drapeaux répétés, inutiles voire incompatibles.
Diviser les dico sera plus facile et moins dangereux en partant d'un gros dictionnaire correct. Cela permettra d'éviter qu'en cas de fusion, des lemmes se retrouvent en double mais avec des drapeaux différents.

J'ai déjà ajouté dans mon dico après les lemmes concernés, un commentaire #[œ] pour les formes avec ligature et #[^œ] pour celles sans ligature (lemmes à supprimer au cas où on adopte définitivement la ligature).

On y trouve donc maintenant les deux formes :
angstr½m/LMS #[œ]
angstroem/LMS #[^œ]
Ici elle sont groupées, mais ce n'est pas le cas quand oe est au début du mot : les formes avec ½ initial se retrouvent tout au début du fichier et les formes avec "oe" initial après la ligne 54700.

édité : les formes oe ont été remplacées dans la version définitive. Il n'y a donc plus de commentaires #... sauf à la première ligne, à propos des ½.

@+
Dernière édition par Vazkor le 07 Juil 2007 17:28, édité 2 fois.
OOo 3.0.0 sous Windows 2000
Avatar de l’utilisateur
Vazkor
Membre OOrganisé
Membre OOrganisé
 
Message(s) : 74
Inscrit le : 28 Juin 2007 20:03
Localisation : Belgique, Liège + 5 Km

Messagepar Pierre-Yves Samyn » 04 Juil 2007 07:00

Bonjour

Vazkor a écrit:Personne ne me répond.
C'est trop injuste. J'aime pas parler dans le vide...


On peut supposer que Tchantchès et Nanesse discuteront bien volontiers le 15 août en roture autour d'une bière... :)

Euh... Bien sûr nous somme ici sur un forum et non une messagerie :) et je n'ai pas grand chose à dire sur le fond, n'étant pas assez compétent.

Toutefois :

Vazkor a écrit:Un de vos spécialistes pourra bientôt proposer ce dictionnaire français classique corrigé et amélioré à la communauté OpenOffice.
Je suppose que vous y avez vos contacts. Moi je n'y connais personne et j'écris très mal l'anglais que je lis pourtant sans le moindre problème (méconnaissance de la grammaire et de la syntaxe).


Tu peux toujours t'inscrire sur la liste dédiée aux testeurs des versions localisées en français. Nul doute qu'il se trouverait là quelqu'un qui ferait son miel de ton formidable travail.

cf. http://user.services.openoffice.org/fr/forum/viewtopic.php?p=31308#31308
Pierre-Yves Samyn
Grand Maître de l'OOffice
Grand Maître de l'OOffice
 
Message(s) : 11276
Inscrit le : 02 Mai 2006 09:42

Messagepar Vazkor » 05 Juil 2007 03:17

Salut,
Pierre-Yves a écrit:Tu peux toujours t'inscrire sur la liste dédiée aux testeurs des versions localisées en français. Nul doute qu'il se trouverait là quelqu'un qui ferait son miel de ton formidable travail.
Je n'en doute pas ! Merci pour l'info.

Je m'accorde encore quelques jours pour peaufiner le dico et je le leur propose pour le 14 juillet.

Je trouve en effet encore de petites anomalies dans le fichier dic, comme "sourire" dont toute la conjugaison n'était pas reconnue, alors qu'il se conjugue comme "rire".

J'ai aussi supprimé du fichier aff toutes les règles d'affixes qui n'ont jamais été utilisées (et qui ne le seront jamais parce que bien trop compliquées à utiliser en tenant compte des élisions).
Il s'agit des quinze règles ABEHIJKYZ abefik


Tu sembles bien connaître la Cité Ardente...

@+
OOo 3.0.0 sous Windows 2000
Avatar de l’utilisateur
Vazkor
Membre OOrganisé
Membre OOrganisé
 
Message(s) : 74
Inscrit le : 28 Juin 2007 20:03
Localisation : Belgique, Liège + 5 Km

Messagepar Bidouille » 05 Juil 2007 10:07

En tout cas, je salue ici votre travail pour cette communauté.

Merci et :bravo:
Dernière édition par Bidouille le 05 Juil 2007 16:00, édité 1 fois.
Avatar de l’utilisateur
Bidouille
RespOOnsable forum
RespOOnsable forum
 
Message(s) : 10582
Inscrit le : 08 Nov 2005 17:23
Localisation : Brest, France

Messagepar Vazkor » 05 Juil 2007 12:49

Salut,

Au départ je me suis inquiété au contenu du dictionnaire, parce que je trouvais que le vérificateur d'orthographe soulignait beaucoup de mots à tort sur les mille pages de Wikipédia que j'ai corrigées sans parler des bouquins pour ELG (Ebooks Libres et gratuits) que je vérifiais en quelques jours.

Je me suis donc informé en récupérant la documentation disponible sur Internet et je me suis lancé dans cette galère pensant que cela serait réglé rapidement, en un mois environ.

Si j'avais pu penser que cela me tiendrait occupé pendant un an, je n'aurais même pas commencé. Mais après quelques mois de travail, il aurait été ridicule de tout laisser tomber puisque j'aurais perdu mon temps pour rien.

Mais c'est plus qu'un travail de bénédictin, parce que pour chaque lemme, il faudrait examiner les drapeaux à la loupe pour repérer les répétitions, les drapeaux inutiles ou incompatibles et le plus difficile de tout les absents.
Pour tout arranger, les drapeaux du dictionnaire d'origine étaient présentés dans un ordre non standardisé avec des répétions du genre /LMLMRS... ce qui quand je triais la liste sur les lemmes ou sur les drapeaux ne me faisait pas remarquer tout de suite les anomalies.
Une fois ces drapeaux nettoyés et remis dans un ordre plus logique (PFX puis SFX), je pouvais remarquer que par exemple des verbes à conjugaison similaire n'avaient pas les mêmes drapeaux alors qu'ils commençaient tous les deux par une voyelle et supprimer les inutiles et ajouter les absents.
Un autre cas typique est celui d'un mot qui est à la fois un nom et un verbe comme abîme suivi des drapeaux LMSjnmtlu :
L et l sont incompatibles et le S est inutile puisque abîmes est généré par le suffixe u du présent ; les drapeaux corrects sont donc Mjntlu.
On voit ici le résultat de la fusion brutale des fichiers nonverbes.dico et verbes-gp12.dico qui ont été créés par Christophe Pythoud en 1999.

J'arrête ici avec les détails techniques.
Cette nuit je viens encore de corriger un paquet d'erreurs en rajoutant environ 300 mots au dictionnaire (essentiellement des formes s'+futur/conditionnel/passé simple) qui étaient encore soulignés lors d'un test.

Et dans le fichier aff, j'ai supprimé 15 règles d'affixes jamais utilisées (et qui ne le seront sans doute jamais parce que bien trop compliquées à mettre en oeuvre)
Ce sont les règles concernant les préfixes ad-, ex-, in- devant les non-verbes et les verbes (avec toutes les variantes).

@+
OOo 3.0.0 sous Windows 2000
Avatar de l’utilisateur
Vazkor
Membre OOrganisé
Membre OOrganisé
 
Message(s) : 74
Inscrit le : 28 Juin 2007 20:03
Localisation : Belgique, Liège + 5 Km

Messagepar vinc-mai » 05 Juil 2007 15:52

Après tout ce travail pour lequel je te félicite vivement :bravo: , il ne te reste plus qu'à attaquer le dico de grammaire :lol: :marto: :aie:.

Encore un grand BRAVO!
(Ooo 2.3 sur windows XP)
OOo 2.3 sur Ubuntu 7.10
Avatar de l’utilisateur
vinc-mai
PassiOOnné
PassiOOnné
 
Message(s) : 540
Inscrit le : 22 Déc 2005 15:13
Localisation : Rhône-Alpes

Messagepar OlivierR » 05 Juil 2007 16:25

Bonjour,

je viens de prendre connaissance de votre travail (même si je n'ai pas encore eu le temps de regarder votre dictionnaire dans le détail)

Si vous voyez 1/2 à la place de la ligature oe, c'est parce que vous lisez les fichiers avec un éditeur qui ne comprend pas le iso-8859-15, mais le iso-8859-1.

Ce que vous appelez un commentaire à la suite d'un lemme, c'est en vérité le champ "morphologique" définis dans les spécifications de Hunspell. Ce sera un jour potentiellement utile pour un correcteur grammatical.

Pour connaître les déclinaisons engendrées par les drapeaux, vous trouverez peut-être cette page utile :
http://dico.savant.free.fr/affixestest.php

Je n'ai pas encore déclaré le site publiquement, parce que je n'ai pas fini d'écrire mes outils de gestion des dictionnaires (et j'ai un peu la flemme en ce moment, alors j'avance lentement).

Pour les mots composés, il faut lire à nouveau les spécifications de Hunspell, car il y a désormais un attribut WORDCHARS, qui permet de définir les caractères spéciaux reconnus par le correcteur :
http://sourceforge.net/docman/display_d ... _id=143754

Comme vous, j'ai aussi supprimé les drapeaux inutiles (et trop complexes de surcroît pour jamais l'être), les mêmes que vous : ABEHIJKYZ abefik :)

J'ai aussi ajouté les lignes

WORDCHARS '-.

MAP 12
MAP aàâä
MAP eéèêë
MAP iîï
MAP oôö
MAP uùûü
MAP cç
MAP AÀÂÄ
MAP EÉÈÊË
MAP IÎÏ
MAP OÔÖ
MAP UÙÛÜ
MAP CÇ

REP 18
REP f ph
REP ph f
REP c qu
REP qu c
REP tt t
REP t tt
REP ll l
REP l ll
REP nn n
REP n nn
REP pp p
REP p pp
REP mm m
REP m mm
REP ½ oe
REP oe ½
REP æ ae
REP ae æ

Il a aussi été proposé d'autres modifications dans le fichier des affixes.
ce serait bien que vous postiez les vôtres sur la mailing-list dic


Olivier R.
LibreOffice 7.0Windows 10Grammalecte, correcteur grammatical et orthotypographique
OlivierR
SuppOOrter
SuppOOrter
 
Message(s) : 1036
Inscrit le : 24 Mai 2006 21:34
Localisation : Lorraine, France

Messagepar Vazkor » 05 Juil 2007 21:01

Salut,
vinc-mai a écrit:Après tout ce travail pour lequel je te félicite vivement :bravo: , il ne te reste plus qu'à attaquer le dico de grammaire :lol: :marto: :aie:.

Encore un grand BRAVO!

Certainement pas, j'ai déjà passé bien trop de temps sur le dictionnaire, bien plus utile qu'un correcteur grammatical qui ne fait que lancer de fausses alertes.
Je n'en ai personnellement pas besoin et quand j'ai testé celui de MS Office pourtant assez performant il m'énervait au plus haut point en me demandant à tout bout de champ "si j'avais bien fait l'accord du participe passé avec le complément d'objet direct placé avant"...

Je me suis vite empressé de désactiver cette option.

@+
OOo 3.0.0 sous Windows 2000
Avatar de l’utilisateur
Vazkor
Membre OOrganisé
Membre OOrganisé
 
Message(s) : 74
Inscrit le : 28 Juin 2007 20:03
Localisation : Belgique, Liège + 5 Km

Messagepar Vazkor » 05 Juil 2007 21:24

Salut Olivier,

je viens de prendre connaissance de votre travail (même si je n'ai pas encore eu le temps de regarder votre dictionnaire dans le détail)

Prenez votre temps, on n'est plus à une année près, et cela me ferait grand plaisir que vous me montriez les dernières erreurs que je n'ai pas encore remarquées alors que pendant 11 mois j'ai retourné ce dictionnaire dans tous les sens jusqu'à aller vérifier les dicos d'origine de 1999.
Si vous voyez 1/2 à la place de la ligature oe, c'est parce que vous lisez les fichiers avec un éditeur qui ne comprend pas le iso-8859-15, mais le iso-8859-1.

J'utilise UltraEdit, qui je pense est ce qui se fait de mieux comme éditeur de texte et hexadécimal, sous Windows en tout cas.
Même dans votre message, c'est bien ½ qui s'affiche dans la section REP et ce avec Firefox qui comprend bien l'iso-8859-15.
Ce que vous appelez un commentaire à la suite d'un lemme, c'est en vérité le champ "morphologique" définis dans les spécifications de Hunspell. Ce sera un jour potentiellement utile pour un correcteur grammatical.

Vous êtes bien doctoral, mon cher.
Quand après un lemme/(avec ou sans drapeaux) et une tabulation je tape # c'est bien un commentaire actuellement. Peu m'importe ce que cela pourrait devenir par après. Ces commentaires ne sont que temporaires, utiles pour mes mises au point.
Dans mon fichier de travail, je laisse en effet une trace de mes corrections, ajouts et suppressions sous cette forme:
lemme/drapeaux #+ pour l'ajout d'un nouveau lemme
lemme2/drapeau2 #* lemme1|drapeau1 pour une modification que je teste
lemme/Mjnmtlu #-LS pour indiquer que j'ai seulement supprimé ces drapeaux LS inutiles ici

J'ai vu que des gens s'amusent à vouloir mettre au point un correcteur grammatical, mais c'est mettre la charrue avant les boeufs si le dictionnaire n'est pas fiable.
Savez-vous pourquoi personne n'a, à ma connaissance, jamais corrigé le dictionnaire que vous utilisez depuis le début sans en avoir changé une seul lemme ? Parce que c'est presque "Mission impossible", que ça n'amuse pas les développeurs qui bien souvent maltraitent le français. Regardez les fautes grossières d'orthographe qui traînent encore dans les fichiers README_fr-FR.txt qui accompagnent tous les dictionnaires français depuis 2003 au moins.

J'ai lu en partie des documentations d'ASpell, ISpell, MySpell et HunSpell : désolé, c'est trop chiant à lire et quand on vient du monde Windows on y pige que dalle à ce jargon de linuxiens anglophone de surcroît. A 62 balais, je n'ai pas envie de continuer à me pourrir la vie, enfin le peu qu'il me reste...
Pour connaître les déclinaisons engendrées par les drapeaux, vous trouverez peut-être cette page utile :
http://dico.savant.free.fr/affixestest.php

Là, je pense que vous n'avez plus rien à m'apprendre. Le Dico savant est en belle démonstration, mais cela ne fera guère avancer le schmilblick si vous devez ensuite contrôler chaque suggestion une par une.
Je n'ai pas encore déclaré le site publiquement, parce que je n'ai pas fini d'écrire mes outils de gestion des dictionnaires (et j'ai un peu la flemme en ce moment, alors j'avance lentement).

Vos outils de gestion ne remplaceront jamais un personne douée en français, ne vous faites pas trop d'illusion.
Il ne suffit pas que l'application d'une règle soit correcte, sans redondance et incompatibilité pour que les formes obtenues figurent dans un dictionnaire.
Il y a encore dans mon dictionnaire des mots que je ne trouve même pas trace dans le TLFi. Mais je n'ai pas la patience d'aller vérifier un par un tous les mots que je ne connais pas ou qui me paraissent bizarres.
La meilleure manière de tester la conjugaison d'un verbe rare et irrégulier, c'est encore de commencer par voir s'il existe au Larousse, sinon au TLFi.
Ensuite, si je pense qu'il en vaut la peine, je lance un des deux conjugueurs à ma disposition c-à-d Conjugaison et Le Conjugueur de Brewalan, je copie la conjugaison dans un fichier texte et je le colle dans OOo Writer pour voir s'il me souligne quelque chose.
J'ai aussi testé mon dictionnaire avec de longues listes de jusqu'à 250.000 mots déclinés.
Pour les mots composés, il faut lire à nouveau les spécifications de Hunspell, car il y a désormais un attribut WORDCHARS, qui permet de définir les caractères spéciaux reconnus par le correcteur :
http://sourceforge.net/docman/display_d ... _id=143754

J'utilise beaucoup plus Firefox (ouvert en permanence) que OOo Writer qui me sert juste à taper de temps à autre une rare lettre et m'a servi à corriger des bouquins pour ELG, il y a de cela un an. Pour l'instant il me sert surtout de testeur de dictionnaire pour Firefox.
Les attributs de Hunspell ne m'intéresse plus du tout à ce stade de mon travail. Si quelqu'un veut réintroduire les mots composés dans le dictionnaire, et modifier le fichier des affixes, cela lui sera facile puisque les mots isolé s'y trouvent déjà.

Plutôt que d'ajouter les mots composés au dictionnaire, je préférerais personnellement en sortir les mots rares et exotiques pour les placer dans des dictionnaires spécialisés que seuls les littéraires, les scientifiques (et les correcteurs fous dans mon genre) fusionneraient avec le dictionnaire de base à leur convenance.
Comme vous, j'ai aussi supprimé les drapeaux inutiles (et trop complexes de surcroît pour jamais l'être), les mêmes que vous : ABEHIJKYZ abefik

J'ai aussi ajouté les lignes

WORDCHARS '-.

MAP 12
MAP aàâä
MAP eéèêë
MAP iîï
...

REP 18
REP f ph
REP ph f
REP c qu
REP qu c
...

REP æ ae
REP ae æ

Un membre d'Assiste qui semblait s'y connaître m'a aussi proposé des sections MAP et REP. Je n'ai vu aucun effet positif et je les ai retirées pour ne garder qu'une section REP de 4 lignes dont je ne sais même pas si c'est utile.
Je me méfie de ces remplacements automatiques.
Mais je vais tester les vôtres sur mon dico.
Il a aussi été proposé d'autres modifications dans le fichier des affixes.
ce serait bien que vous postiez les vôtres sur la mailing-list dic.

Il suffit de parcourir mon fichier d'affixes actuel et de le comparer au vôtre. Vous ne verrez probablement pas de grosses différences.
Désolé, je ne pourrais refaire l'historique de tous les essais que j'ai effectués en un an.
J'ai seulement étoffé certaines conditions en ajoutant des voyelles (parfois les majuscules) dont je trouvais l'absence bizarre

Pour contre (et contr), j'utilise le PFX V (lettre qui était libre) et non B, comme vous, parce qu'au départ, je ne savais pas si les PFX A B et C seraient utiles ou pas.
Ne comptez pas que je vais maintenant encore modifier mes drapeaux pour vous faire plaisir, alors qu'il y a un an que je travaille là-dessus et que ce dictionnaire me sort vraiment par les oreilles.

Mon plus cher désir maintenant est de m'en débarrasser et le plus tôt sera le mieux.
Vous pouvez le reprendre tout de suite tel qu'il est et le modifier encore, si nécessaire.
Moi, j'estime ma mission terminée.


Il y aurait beaucoup à dire sur l'utilité réelle de certaines règles.
J'ai compté les occurrences des divers drapeaux dans mon dictionnaire :

Aff. + N°Ordre + fréq.
-----------------------
PFX U 13 4
PFX W 09 5
SFX d 28 12
PFX P 05 18
PFX O 07 23
SFX z 32 52
PFX N 04 63
SFX q 34 75
PFX V 02 96
SFX g 25 111
PFX D 03 215
PFX Q 12 264
PFX T 08 280
SFX X 23 326
PFX R 06 430
SFX c 27 663
PFX C 01 750
PFX s 19 802
SFX G 21 1078
SFX p 33 1312
SFX y 32 4172
PFX t 17 4832
PFX m 16 4844
SFX F 20 6083
PFX j 14 6104
SFX u 24 6315
SFX w 29 6402
SFX v 26 6403
SFX x 30 6445
PFX l 18 7216
PFX n 15 7711
PFX L 10 8676
PFX M 11 10635
SFX S 22 26771

L'utilisation de certains préfixes est tellement faible qu'il faut se demander s'il est nécessaire de le garder.
Et les règles les plus utilisées ne devraient-elles pas être en début de liste ?

La multiplication des préfixes dont "venir" est un bel exemple, est peut-être efficace, mais ça manque de clarté et ce n'est pas facile à gérer.
venais/VPRTWv
venants (Pourquoi est-il là, au fait ?)
venir/VPRTWz
viendrai/VPRTWx
viens/VPRTWu
venir/VPRTWz
Il faut ensuite aller vérifier toutes les variantes complètes pour lesquelles il a fallu tenir compte des limitations des affixes.
Voir ailleurs dans la liste si les dérivés ajoutés sont bien corrects et supprimer les doublons éventuels
contreven* -> contrevenante/F
préven* -> prévenance/S et prévenante/F
reven* -> revenante/F
surven* -> survenance/S
subven* -> [rien]
Et ne pas oublier les éventuelles formes avec article et pronoms élidés.

@+
Dernière édition par Vazkor le 14 Juil 2007 06:33, édité 1 fois.
OOo 3.0.0 sous Windows 2000
Avatar de l’utilisateur
Vazkor
Membre OOrganisé
Membre OOrganisé
 
Message(s) : 74
Inscrit le : 28 Juin 2007 20:03
Localisation : Belgique, Liège + 5 Km

Messagepar OlivierR » 05 Juil 2007 22:55

Même dans votre message, c'est bien ½ qui s'affiche dans la section REP et ce avec Firefox qui comprend bien l'iso-8859-15.

Oui, je m'explique mal. Le fichier est sauvegardé en ANSI apparemment, et le oe correspond à 1/2 dans ce format. Quand on change le codage du fichier, c'est bien oe qui apparaît. (Bon, ça dépend aussi comment les éditeurs gèrent la chose. Je vois ça avec avec Kate ou Kwrite.)

Vous êtes bien doctoral, mon cher.

Doctoral?
Pardonnez-moi dans ce cas. Ce n'était pas mon intention.
Pour les "commentaires", il est vrai que je ne connais que Hunspell et j'ignore quel correcteur emploie Firefox, ne m'y étant jamais intéressé.

Savez-vous pourquoi personne n'a, à ma connaissance, jamais corrigé le dictionnaire que vous utilisez depuis le début sans en avoir changé une seul lemme ? Parce que c'est presque "Mission impossible", que ça n'amuse pas les développeurs qui bien souvent maltraitent le français. Regardez les fautes grossières d'orthographe qui traînent encore dans les fichiers README_fr-FR.txt qui accompagnent tous les dictionnaires français depuis 2003 au moins.

Je crois que pas mal de gens, dont moi-même, ont fait des corrections dans leur coin, mais il manque tout simplement une centralisation.

J'ai lu en partie des documentations d'ASpell, ISpell, MySpell et HunSpell : désolé, c'est trop chiant à lire et quand on vient du monde Windows on y pige que dalle à ce jargon de linuxiens anglophone de surcroît. A 62 balais, je n'ai pas envie de continuer à me pourrir la vie, enfin le peu qu'il me reste...

Je comprends que ça puisse être chiant, ça l'est sûrement d'ailleurs :), mais ça n'a pas lié avec Linux ou Windows.

Là, je pense que vous n'avez plus rien à m'apprendre. Le Dico savant est en belle démonstration, mais cela ne fera guère avancer le schmilblick si vous devez ensuite contrôler chaque suggestion une par une.

Pardonnez-moi encore, si j'ai pu prendre un ton professoral. Ce n'était que pour aider. Oui, chaque proposition doit être vérifiée, mais c'est normal, et ce ne sera pas la tâche d'un seul. Le but de ce site, c'est précisément de centraliser les petits efforts de chacun. Que cela fonctionne ou pas, on verra.

Vos outils de gestion ne remplaceront jamais un personne douée en français, ne vous faites pas trop d'illusion.

Bien sûr. Les outils ne sont là que pour aider.

Il ne suffit pas que l'application d'une règle soit correcte, sans redondance et incompatibilité pour que les formes obtenues figurent dans un dictionnaire.

C'est effectivement un point sur lequel il y a à discuter. Et on peut avoir des visions différentes. Je m'étonne par exemple que vous ayez ôté abacule.

Plutôt que d'ajouter les mots composés au dictionnaire, je préférerais personnellement en sortir les mots rares et exotiques pour les placer dans des dictionnaires spécialisés que seuls les littéraires, les scientifiques (et les correcteurs fous dans mon genre) fusionneraient avec le dictionnaire de base à leur convenance.
Encore une tâche de titan, car elle se base uniquement sur un jugement de valeur que la machine ne pourra pas accomplir.
Et la suppression d'entrées rares n'est pas mon choix.


Un membre d'Assiste qui semblait s'y connaître m'a aussi proposé des sections MAP et REP. Je n'ai vu aucun effet positif et je les ai retirées pour ne garder qu'une section REP de 4 lignes dont je ne sais même pas si c'est utile.

Oui, je n'ai pas toujours vu des masses de différences, mais il y en a parfois. Le problème, c'est que je ne sais pas quelle version de Hunspell est implémentée dans OOo, sans doute pas la dernière, et il faudra peut-être attendre avant d'en voir les bénéfices.
Ces lignes, quoi qu'il en soit, ne semblent pas nuire.

Pour contre (et contr), j'utilise le PFX V (lettre qui était libre) et non B, comme vous, parce qu'au départ, je ne savais pas si les PFX A B et C seraient utiles ou pas.
Ne comptez pas que je vais maintenant encore modifier mes drapeaux pour vous faire plaisir, alors qu'il y a un an que je travaille là-dessus et que ce dictionnaire me sort vraiment par les oreilles.

:) Pas de souci. Un tel changement se fera en un clin d'oeil.
En fait, j'ai dû accorder les affixes du dictionnaire classique et de celui de la réforme de 1990.

Mon plus cher désir maintenant est de m'en débarrasser et le plus tôt sera le mieux. Vous pouvez le reprendre tout de suite tel qu'il est et le modifier encore, si nécessaire. Moi, j'estime ma mission terminée.
J'attendrai que votre dernière version du 14 pour y regarder de plus près. De toute façon, je n'en aurais guère l'occasion avant.

L'utilisation de certains préfixes est tellement faible qu'il faut se demander s'il est nécessaire de le garder.

En effet.

Et les règles les plus utilisées ne devraient-elles pas être en début de liste?

Ce n'est qu'un fichier texte. C'est sans importance.

La multiplication des préfixes dont "venir" est un bel exemple, est peut-être efficace, mais ça manque de clarté et ce n'est pas facile à gérer. [...] Il faut ensuite aller vérifier toutes les variantes complètes pour lesquelles il a fallu tenir compte des limitations des affixes.

Vous avez dû y passer vraiment beaucoup de temps. Une comparaison hâtive me dit qu'il y a plusieurs milliers de modifications. Rassurez-moi, vous n'avez pas fait tout ça manuellement? Parce qu'à vous entendre, on le dirait.

cordialement,
OR
LibreOffice 7.0Windows 10Grammalecte, correcteur grammatical et orthotypographique
OlivierR
SuppOOrter
SuppOOrter
 
Message(s) : 1036
Inscrit le : 24 Mai 2006 21:34
Localisation : Lorraine, France

Messagepar Vazkor » 05 Juil 2007 23:50

Salut,

Firefox utilise le correcteur MySpell dont HunSpell n'est qu'une évolution.
Le dictionnaires sont compatibles mais je doute fort que les dernières nouveautés implémentées dans Hunspell le soient. Les auteurs de dictionnaires pour Mozilla se contentent de piquer ceux de OOo et de les emballer dans un xpi avec un fichier install.rdf et un install.js pour automatiser leur installation.

Pour corriger le dico j'ai bien testé des scripts awk sous Undows, mais c'était décevant.

J'ai pratiquement tout fait à la main avec UltraEdit qui m'a permis avec ses énormes possibilité de recherche, de remplacement et de tri de mettre de l'ordre dans tout cela. Cela fait près d'un an que je teste les différentes versions en les utilisant sur les forums et sur Wikipedia. Tout dernièrement j'ai fait des test complets sur de longues listes de mots disponibles sur le web telles que celle de Ward Grady de 130.000 mots puis celle d'ABU-CNAM de 250.000 mots. J'ai ensuite corrigé ce qui était souligné à juste titre et j'ai fait l'impasse sur des verbes trop rares pour qu'on s'amuse à les conjuguer.

J'ai supprimé "abacule" parce que je ne sais pas du tout ce que c'est. Il est inconnu sur le TLFi (à moins qu'il ne figure en bas de page dans une note).

Pour mon dico, je vais tester rapidement les propositions de modification d'affixes en ajoutant ta section REP et ta section MAP, je le mets sur mon site et je n'y touche plus.

A vous de jouer ! Je vous passe mon bébé avec un grand soupir de soulagement.

J'espère bientôt ne plus rêver que je suis en train de corriger cette liste de mots toutes les nuits, enfin quand il m'arrive de dormir quelques heures.

@+
OOo 3.0.0 sous Windows 2000
Avatar de l’utilisateur
Vazkor
Membre OOrganisé
Membre OOrganisé
 
Message(s) : 74
Inscrit le : 28 Juin 2007 20:03
Localisation : Belgique, Liège + 5 Km

Messagepar Vazkor » 06 Juil 2007 08:38

Salut,

Mise à jour définitive du dictionnaire français classique sur mon site à 01:20 GMT.
J'ai retiré du dictionnaire les lemmes avec "oe" remplacé par la ligature et mes commentaires. Le nombre de lemmes est maintenant de 80902 exactement.

J'ai aussi ajouté à l'archive une copie du fichier acor_fr-FR.dat à placer dans share\autocorr\ pour l'autocorrection : ce fichier est rigoureusement identique à celui qui vous est proposé dans l'archive
http://fr.openoffice.org/files/document ... atures.zip
sur le forum.
Cfr. http://user.services.openoffice.org/fr/ ... html#15783
Taille 6,90 Ko (7 073 octets)
MD5 9D8FCD8E9975D7ACD494F025E848D4BF
SHA1 5237F5D3EAF73BAA50747579B7FA67DBDC7D1485

Je vous le mets pour vous éviter de télécharger inutilement une archive de 1,90 Mo (1 996 843 octets) pour récupérer un malheureux fichier de 7 Ko.

J'ai constaté en effet que mon fichier "thesaurus" th_fr_FR_v2.dat est plus récent que celui qui vous est proposé ici dans l'archive.
Seul le fichier acor_fr-FR.dat devrait donc vous intéresser.

Cordialement,

Vazkor
Dernière édition par Vazkor le 09 Juil 2007 13:33, édité 3 fois.
OOo 3.0.0 sous Windows 2000
Avatar de l’utilisateur
Vazkor
Membre OOrganisé
Membre OOrganisé
 
Message(s) : 74
Inscrit le : 28 Juin 2007 20:03
Localisation : Belgique, Liège + 5 Km

Messagepar vinc-mai » 06 Juil 2007 09:29

Vazkor a écrit:Salut,
vinc-mai a écrit:Après tout ce travail pour lequel je te félicite vivement :bravo: , il ne te reste plus qu'à attaquer le dico de grammaire :lol: :marto: :aie:.

Encore un grand BRAVO!

Certainement pas, j'ai déjà passé bien trop de temps sur le dictionnaire, bien plus utile qu'un correcteur grammatical qui ne fait que lancer de fausses alertes.
Je n'en ai personnellement pas besoin et quand j'ai testé celui de MS Office pourtant assez performant il m'énervait au plus haut point en me demandant à tout bout de champ "si j'avais bien fait l'accord du participe passé avec le complément d'objet direct placé avant"...

Je me suis vite empressé de désactiver cette option.

@+


Il ne fallait pas le prendre au sérieux. Votre travail est considérable.
Je renouvelle mes félicitations et en profite pour donner l'adresse de votre site:
http://perso.latribu.com/rocky2/
(Ooo 2.3 sur windows XP)
OOo 2.3 sur Ubuntu 7.10
Avatar de l’utilisateur
vinc-mai
PassiOOnné
PassiOOnné
 
Message(s) : 540
Inscrit le : 22 Déc 2005 15:13
Localisation : Rhône-Alpes

Messagepar Vazkor » 06 Juil 2007 10:10

Salut,

Merci !

Mon "site" (un bien grand mot) est accessible en cliquant sur le bouton "www" visible au bas de tous mes messages.

C'est Rocky qui va être content d'avoir de la visite...

Je vais enfin pouvoir m'occuper d'améliorer ce site resté à l'état de projet depuis des mois, parce que pour l'instant il n'y a pas encore grand chose à y découvrir.

@+

Image
OOo 3.0.0 sous Windows 2000
Avatar de l’utilisateur
Vazkor
Membre OOrganisé
Membre OOrganisé
 
Message(s) : 74
Inscrit le : 28 Juin 2007 20:03
Localisation : Belgique, Liège + 5 Km

Suivant

Retour vers Installation et configuration

Qui est en ligne ?

Utilisateur(s) parcourant ce forum : Aucun utilisateur inscrit et 6 invité(s)