Page 1 sur 1

[Résolu] Importation PDF : texte superposé

MessagePublié: 02 Oct 2013 10:25
par lelion1975
Bonjour,

J'utilisai auparavant la version 3.4 de OpenOffice afin de grouper plusieurs documents scannés et enregistrés au format
PDF en un seul fichier.
Hors depuis que l'ai installé la version 4 avec l'extension PDF Import, mes PDF apparaissent avec une sorte de correction en texte superposé sur l'image de mes PDF, ce qui les rend quasi illisibles.
Je suis donc obligé de faire tout un tas de manipulation pour supprimer ces zones de textes page après page afin de redonner à mes documents leurs affichage normal.
Y a t'il un moyen dans la configuration afin que lorsque j'ouvre un de ces documents il s'ouvre directement et normalement sans cette sorte de correction texte superposé.
Pour illustré mon problème, je vous joint 2 impressions écran d'un document scanné et enregistré au format PDF tel qu'il s'affiche lorsque je l'ouvre avec OpenOffice et tel qu'il devrait être normalement.
Merci d'avance.
Salutations.

Re: Problème importation de BDF

MessagePublié: 02 Oct 2013 10:33
par Bidouille
Bonjour,

Un titre clair et correctement orthographié permet d'effectuer des recherches efficaces.
On ne sait pas ce qu'est un BDF ?
Veuillez corriger en évitant le terme "problème" qui est implicite.

lelion1975 a écrit: je vous joint 2 impressions écran d'un document scanné et enregistré au format PDF

Plutôt que des copies écran, fournissez directement le PDF que l'on puisse faire des essais.

Re: Problème importation de BDF

MessagePublié: 02 Oct 2013 10:41
par Ravioli
Bonjour,
lelion1975 a écrit:depuis que l'ai installé la version 4 avec l'extension PDF Import


Quelle version de l'extension PDF Import utilisez-vous ?

Avec AOO 4, il faut désinstaller l'ancienne version et installer celle-ci :
Création et lecture des PDF hybrides AOO 4 aoo-pdf-import

A+

Re: Problème importation de PDF

MessagePublié: 02 Oct 2013 12:56
par Sharo Lley
Bonjour,


lelion1975 a écrit:...mes PDF apparaissent avec une sorte de correction en texte superposé sur l'image de mes PDF, ce qui les rend quasi illisibles


Lorsque un PDF est créé à partir d'un scan, le fichier obtenu n'est qu'une image dans un PDF.
Aucun texte n'est présent dans ce fichier ... ce n'est qu'une photo.
... à moins que le scanner intègre une fonctionnalité OCR (reconnaissance de caractère).
Dans ce cas, le texte reconnu est ajouté en tant que couche "invisible" au dessus de l'image dans le PDF.
NB : il est possible d'obtenir le même résultat en traitant un PDF scanné dans des logiciels spécifiquement dédié à l'océrisation.

La première copie écran indique clairement que le texte obtenu est le le résultat d'une océrisation (au niveau du RIB, .. on constate l'échec de la reconnaissance des caractères)

L'extension PDF import reprend les images en tant que tel et récupère le "vrai" texte dans des zones spécifiques (une zone texte par ligne)

Le problème ne vient donc pas du changement de version d'AOO puisqu'il n'intégre pas l'OCR.

Si vous n'avez pas changé de scanner (... ou photocopieur) dernièrement, c'est sans doute que la fonctionnalité d'océrisation intégrée a été activée récemment.
Il suffit de désactiver l'OCR sur le scanner.

Re: Problème importation de PDF

MessagePublié: 02 Oct 2013 16:19
par lelion1975
Un grand merci à Sharo Lley,
effectivement il a eu changement de scanner et le mode OCR était activé.
Problème résolu.
Encore merci.

Re: Problème importation de PDF

MessagePublié: 02 Oct 2013 16:26
par micmac
Bonjour,
lelion1975 a écrit:Problème résolu.

Alors, veuillez le signaler.
Comment baliser [Résolu] Image