Estimados, soy nuevo aquí, y he leído que también aclaran dudas de LibreOffice Writer (instalado en Ubuntu), de ahí que consulto. He buscado además en el foro y no he visto esta pregunta antes... ¿Me equivoco? Al grano. Es el caso que al hacer un OCR de un libro, todas las palabras que a fin de línea venían en éste divididas por un guión, me han quedado en mi LibreOffice Writer igualmente divididas pero dentro de la línea. Un párrafo de ejemplo es el siguiente:
"Si existe en realidad un pensamiento (y no una casual asociación de ideas), se deter-mina por el hecho de tener conciencia objetiva de las relaciones objetivas, las cuales dan la solución de una tarea. Pero si las relaciones llevadas a la conciencia en el correspondien-te proceso psíquico son una auténtica solución de la tarea, esto queda demostrado y com-probado a base de dicha solución. La sensación subjetiva de la comprensión es un síntoma que puede ser engañoso. Incluye la hipó-tesis de posibles acciones del sujeto. Esta hipótesis se comprueba por la acción. La comprensión de la solución de una tarea se deter-mina por la facultad de resolverla, y la facultad de resolverla queda demostrada por la solución."
De manera que las palabras: deter-mina, correspondien-te, com-probado, hipó-tesis y deter-mina, requieren de arreglo pero, hacerlas de a una es tremendo trabajo (el libro tiene casi 300 páginas) y, por supuesto, las palabras que sufren de este defecto a lo largo del texto son múltiples y variadas, de modo que programar la no-separación de una o varias palabras específicas (recurso que existe) no me sirve. Entonces mi pregunta es:
¿Existirá alguna forma de hacer esta corrección en forma masiva?
De antemano, muchísimas gracias.
(Me pareció curioso que, cuando aquí en el foro hice un copy-paste del párrafo del ejemplo, no me apareció ninguna de las líneas divisorias de las 5 palabras, así que tuve que agregarlas a mano. También en el LibreOffice Writer el guión me aparece marcado con gris, con lo que interpreto que, en ambos casos, el programa detecta lo extraño del guión. ¿Ayudará este detalle a pensar una solución...?)
Saludos
Quitar guión de división de palabra en LibreOffice Writer
Quitar guión de división de palabra en LibreOffice Writer
OpenOffice 2.4 en Ubuntu 9.04
Re: Quitar guión de división de palabra en LibreOffice Write
Bienvenido
Busca (está en el foro y en la wiki) como hacerlo con expresiones regulares, así prodrás conseguir
- Eliminar los guiones precedidos y seguidos por minúsculas exclusivamente.
- Aprovechar lo que aprendas de las Expresiones Regulares ya que se pueden usar en otras aplicaciones de edición de texto, de html, de epub,calibre, sigil...
Como dices el problema está en el origen, en el OCR.
Si tienes acceso al archivo "en bruto" y todos esos guiones están (debieran) al final de línea, podrías sustituir/eliminar «-¶»(guión+final de párrafo o final de linea)
Hay una extensión «AltSearch» (también hay temas en el foro) que puede serte de utilidad.
Busca (está en el foro y en la wiki) como hacerlo con expresiones regulares, así prodrás conseguir
- Eliminar los guiones precedidos y seguidos por minúsculas exclusivamente.
- Aprovechar lo que aprendas de las Expresiones Regulares ya que se pueden usar en otras aplicaciones de edición de texto, de html, de epub,calibre, sigil...
Como dices el problema está en el origen, en el OCR.
Si tienes acceso al archivo "en bruto" y todos esos guiones están (debieran) al final de línea, podrías sustituir/eliminar «-¶»(guión+final de párrafo o final de linea)
Hay una extensión «AltSearch» (también hay temas en el foro) que puede serte de utilidad.
Todo es mejorable, estamos dispuestos a mejorar. ¿Yo? ... poco a poco.
Nunca hay acritud en mis comentarios, si lo pareciera, seguro que me he expresado mal.
Nunca hay acritud en mis comentarios, si lo pareciera, seguro que me he expresado mal.
Re: Quitar guión de división de palabra en LibreOffice Write
Muchas gracias xiseme pero, no he podido hallar el hilo que comentas y, lamentablemente, no cuento con el archivo "en bruto". Por lo demás, el concepto "caracteres regulares", según revisé, no aparece en LibreOffice, aunque quizás sí en OpenOffice pero, el que uso es el 1°, lo que le agrega dificultad a mi búsqueda. Seguiré intentando. Saludos.
OpenOffice 2.4 en Ubuntu 9.04
Re: Quitar guión de división de palabra en LibreOffice Write
No es «Caracteres regulares» sino «Expresiones regulares».
Por supuesto que en LibreOffice es posible usarlas: https://wiki.openoffice.org/wiki/ES/Man ... dos/RegExp
https://forum.openoffice.org/es/forum/s ... +regulares
https://forum.openoffice.org/es/forum/s ... =altsearch
Por supuesto que en LibreOffice es posible usarlas: https://wiki.openoffice.org/wiki/ES/Man ... dos/RegExp
https://forum.openoffice.org/es/forum/s ... +regulares
https://forum.openoffice.org/es/forum/s ... =altsearch
Todo es mejorable, estamos dispuestos a mejorar. ¿Yo? ... poco a poco.
Nunca hay acritud en mis comentarios, si lo pareciera, seguro que me he expresado mal.
Nunca hay acritud en mis comentarios, si lo pareciera, seguro que me he expresado mal.
Re: Quitar guión de división de palabra en LibreOffice Write
Ok. Gracias, reviso y luego cuento. Saludos.
OpenOffice 2.4 en Ubuntu 9.04