Oldal: 1 / 1

Egységes margó beállítása Abby-alapú dokumentumban

Elküldve: 2019. június 9., vasárnap 20:07
Szerző: Antolion
Üdv!
Meglehetősen speciális gondom van: ocr-el feldolgozott szövegek (könyv) korrektúrázását végezném. Az anyag minden oldala más-más margóval jelenik meg. A kérdésem, hogy egyszerű és gyors módszerrel hogyan lehet a teljes dokumentumra érvényesen egységes margót beállítani?
(Softmakernél egyszerűen lehet. A Libre O.-nál nehézkesen, kijelölöm az összes oldalstílust, majd törlöm, s az első oldal lesz a mérvadó. Itt ez nem működik, egyenként pedig nem szeretném... , Winwordben teljes kijelölés, majd jobb-bal-csúszka)
Köszönöm!

Re: Egységes margó beállítása Abby-alapú dokumentumban

Elküldve: 2019. június 9., vasárnap 21:23
Szerző: Zizi64
(Softmakernél egyszerűen lehet. A Libre O.-nál nehézkesen, kijelölöm az összes oldalstílust, majd törlöm, s az első oldal lesz a mérvadó. Itt ez nem működik, egyenként pedig nem szeretném... , Winwordben teljes kijelölés, majd jobb-bal-csúszka)
Ezek szerint te még OpenOffice-t használsz. Javaslom, használd a LibreOffice-t.

Az OpenOffice/LibreOffice esetén az oldalbeállítás-tulajdonságok az oldalstílus részei. Emiatt oldalanként eltérő, különféle tulajdonságot csak akkor lehet beállítani, ha több különböző oldalstílust használ a program.

És mivel az OCR programod valószínűleg csak a régi bináris, soha nem szabványosított MS formátumba képes exportálni, ezért "megengedi magának", hogy össze-vissza mindenféle oldalbeállítást (margó értéket) használjon, annak a függvényében, hogy a szkennerbe jól-rosszul behelyezett lapon mekkora margót "mért". Ezt megteheti, mert a bináris .doc formátum esetében semmiféle szabvány nem kötelezi a logikusabb működésre.

Ezt az összevisszaságot a logikus stílus-struktúrával bíró Open/LibreOffice csak úgy tudja átvenni, hogy minden egyes eltérő tulajdonságú oldalra más és más dedikált oldalstílust alkalmaz. És mivel az alap felbontási egység 0,01 cm, gyakorlatilag van esély rá, hogy MINDEN EGYES oldalt más ás más oldalstílussal kell kezelni - hiszen erre a négy margó érték elegendő kombinációs lehetőséget ad (hol ez lesz kisebb, hol az nagyobb a négy margó közül).

Ezt a mérhetetlenül bután megvalósított OCR/MS formátum viselkedést csakis úgy tudod korrigálni az Open/LibreOffice-ban, hogy te magad felülbírálod a sok-sok alkalmazott különböző oldalstílust. (Ezt még az OCR programban kéne megtenni: azaz ott egységesíteni a margókat valamilyen "intervallum beállítással", amin belül egy azonos margó értéket exportálna a program.)
Hogy ezt a LibreOffice-szal sok gyakorlattal a hátad mögött kézzel is gyorsan meg tudod tenni, vagy képes vagy makrót írni rá, ez a te dolgod.

A lényeg az, hogy eszedbe se jusson MS formátumba menteni a nehezen, sok munkával megkapott eredményt - ha Open/LibreOffice-szal dolgozol.
Tárold a dokumentumaidat a nemzetközi szabvány, hosszú távú kompatibilitást biztosító ODF fájlformátumokban, szerkeszd tovább abban a formátumban, és - csak ha nagyon muszáj - a szerkesztés befejezése után exportálj egy másolatot a idegen, nem szabványos, elavult bináris .doc, vagy éppen a félresikerült, elcseszett OOXML formátumba.

Re: Egységes margó beállítása Abby-alapú dokumentumban

Elküldve: 2019. június 9., vasárnap 21:25
Szerző: Zizi64
OpenOffice 3.1 a Windows Vista -??n
De ezzel a régi OpenOffice verzióval egyébként se tudok mit kezdeni még javaslat szintjén se... Ilyen verzióban még kipróbálni sem tudnám a javaslataimat...
Winwordben teljes kijelölés, majd jobb-bal-csúszka)
...ami ugyanúgy kézi (direkt) beállítási értékeket hagy a különböző stílusúra OCR-ezett oldalakon, tehát csak látszatmegoldás...
Hiszen az Open/LibrOffice-ban ettől még ugyanúgy "ezer" különböző nevű oldalstílus maradna a dokumentumban. Csak éppen egységessé válnának a jobb/bal makró értékek az összes alkalmazott oldalstílusban... De mi van az alsó/felső margókkal? Azt csúszkával semelyik programban sem tudod beállítani...

Re: Egységes margó beállítása Abby-alapú dokumentumban

Elküldve: 2019. június 10., hétfő 9:21
Szerző: Zizi64
Úgy látom, a régebbi témáidból, hozzászólásaidból, hogy nem igazán akarod elfogadni, hogy az idegen fájlformátumokat az Open/LibreOffice soha nem fogja pontosan ugyanúgy kezelni, mint a saját natív, nemzetközi szabványon alapuló formátumait. És nem azért, mert a program "gyenge" lenne ezen a téren: egész egyszerűen LEHETETLEN pontosan ugyanúgy kezelni. mert olyannyira mások a "szabályok" az eltérő formátumok esetében, hogy azokat nem lehet pontosan lekövetni a másik szabályrendszerben. Főleg akkor nem, ha az a másik szabályrendszer sohe nem volt szabványosítva, és a létrehozója folyamatosan foldozgatta, javítgatta - minden MSOffice-csomag kiadásához újabb és újabb verziókat kiötölve.


Ha nincs meg a lehetőséged, hogy MS programcsomagot vásárolj, (és azt 2-3 évente gyakorlatilag újra kifizesd a frissítések kapcsán), akkor legalább ne csinálj magadnak többletmunkát az idegen fájlformátumok használatával az Open/LibreOffice használata során.

Több, mint egy évtizede használjuk az Open/Libreoffice-t és az ODF formátumokat a cégnél, és az egyetlen igazi, nehezen áthidalható problémaforrás a régi "MSO" megszokások levetkőzése volt - ami a mai napig nem sikerült tökéletesen, de azért van jelentős haladás benne.

Re: Egységes margó beállítása Abby-alapú dokumentumban

Elküldve: 2019. június 10., hétfő 16:03
Szerző: Antolion
Köszönöm szépen, értem én, meg újat sem kaptam. Az Abby-n nem tudok változtatni, egy társtud. e-könyvtár anyagáról van szó, 2003-ban indult, anno abby 4-el, most 14-nél tart. Az odf/doc stb. formátum átmeneti, abban korrektúrázom az anyagot, (ICR), majd azt mentem pdf-be. Egyéni hisztim, hogy a portable programokra álltam rá. Tudjon magyarul (spelling checker), semmi extra. Open O., Libre, Kingsoft/WP, Ashampoo, Softmaker eddigi kísérleti nyulaim. (Volt még "portablesített" Microsoft O., 2 változatban is, de win7 után +haltak...) Amúgy van Microsoft O.-m, csak nem portable... Ami minidg is dühített, az inkompatibilitás hiánya (meg hogy hazudnak róla), a programozók nagyképűsége és trehánysága — általában egyenesen arányos. A "legújabb" 2007 utáni formátumot a WP után tudja csak a Microsoft O. korrekten megnyitni. A softmakernél az intenet-hivatkozások a gond. Ugyanazt Libre OpenO jól kezeli. A margó kérdés inkább hiúsági kérdés: Softmaker/Ashampoo stb. igen szoros kapcsolatot mutat az OpenO, Libre O-val: ott egy generálkijelölés után alsó-felső-margó, oldalmargó egy menetben állítható, logikus egyértelmű és egyszerű módon. Egyszerűen nem akartam megérteni, hogy az máshol mitől nem ennyire egyszerű, vulgo, nem én vagyok a hülye. Ha ennyit nem lehet megtenni ennyire egyszerűen Libre/OpenO-ban, akkor nem bírálok, ez nem az a színvonal, ami számomra tolerálható, ezek nem az én programjaim... Köszönöm a gyors reagálást!

Re: Egységes margó beállítása Abby-alapú dokumentumban

Elküldve: 2019. június 10., hétfő 17:03
Szerző: Zizi64
Egyszerűen nem akartam megérteni, hogy az máshol mitől nem ennyire egyszerű, vulgo, nem én vagyok a hülye. Ha ennyit nem lehet megtenni ennyire egyszerűen Libre/OpenO-ban, akkor nem bírálok, ez nem az a színvonal, ami számomra tolerálható, ezek nem az én programjaim...
Máshol sem egyszerű, és máshol nem logikus. Az OpenOffice-ban legalább logikusan működik. cserébe viszont el kell felejteni az MS Office-be exportált szörnyetegeket.
Pont neked volt itt megosztva olyan dokumentumod, amit MS formátumban hoztál létre, és ami ODF-be konvertálva a lapok és egyéb dolgok direkt formázása miatt több, mint 1000 különböző stílust tartalmazott. Majd' félszáz oldalstílust és egyebeket. No, hát ez a nonszensz, nem a az OpenOffice/LibreOffice működési logikája.

Eben a topikodban szerepelt az a rettenet, amit említettem:
https://forum.openoffice.org/hu/forum/v ... ilit=+1000

És ennyi különböző stílus volt benne:
Abban a "szűz"-nek nevezett dokumentumban a következő szövegszerkesztési egységek találhatók az Word (vagy az Abby által) automatikusan beleszerkesztve - javarészt teljesen fölöslegesen:

- 1, azaz egy darab Bekezdésstílus (no ebből kellene több; a több mint 1000 Bekezdésstílust nem képes átvenni - valószínűleg kompatibilitási gondok miatt.)

- 2 darab közvetlenül alkalmazott Karakterstílus (ez rendben van), de van 38 darab közvetlenül nem alkalmazott, "WW" = WinWord névkezdettel rendelkező további Karakterstílus is. Ezeket a többi stílus használja valószínűleg.

- 2 darab Keretstílus (ez is rendben van)

- 460 darab, azaz négyszázhatvan (!) Oldalstílus. No ez egy "kicsit" sok! Ennyiféle különböző tulajdonságú oldalra nem lehet szükséged! Az oldalak többsége AZONOS nagyságú, azonos margójú, stb... KELL hogy legyen. AZONOS tulajdonságú oldalak számára meg NEM KELL különálló Stílus!

- 36 darab, azaz harminchat Felsorolásstílus (ez is sok!)

van továbbá:

- 15 darab Táblázat (végignéztem, ez nagyjából indokoltnak látszik.)

- 87 darab, azaz nyolcvanhét Szövegkeret (egy részük valójában képet tartalmaz).

- 70 darab Kép, egy részük Szövegkeretben (!)

- 536 darab, azaz ötszázharminchat Szakasz (teljesen fölöslegesen)



Neked a 460 darab helyett nagyjából és összesen szükséged lenne a következő nevű, megfelelően beállított Oldalstílusokra:

- Címoldal
- Előzéklap
- Bevezető
- Tartalomjegyzék
- Főszöveg
- Melléklet

És a többi féle Stílusok számát is drasztikusan kellene csökkenteni...
Ezt az állapotot pedig egyszerűbb úgy elérni, hogy a szkennelés/OCR folyamattal csupán formázatlan szöveget hozol létre, azt importálod a LibreOffice Writer-be, és stílusok (esetleg már egy erre a célra készített sablonban létrehozott stílusok segítségével) te magad formázod azt néhány perc alatt.


A LibreOffice-t és az OpenOffice-t NEM ÉRDEMES úgy használni, mintha az MS Office lenne. Nincs értelme, rengeteg többletmunkát okoz.
Az inkompatibilitásból eredő hátrányok helyett használd ki inkább az ELŐNYEIT a stílusoknak, és hagyd a fenébe az MS Office formátumot! Bemeneti (konvertálandó) formátumként SE használd!

De ezt már sokszor leírtam neked, és még mindig ugyanott tartasz.
Nyilvánvaló, hogy kész, step-by-step receptet nem tudok neked adni, mert nem használom ezt a bizonyos Abby-t, sőt nem is ismerem (és MS Office-om sincs már nagyon régen se itthon, se a cégnél). De nem tudom elképzelni, hogy egyszerű .txt kimentet ne tudna létrehozni a Abby az MS Office formátum helyett. Azt pedig importálhatod egy jól előkészített .ott sablonba, amit - ha többször is szükséged van rá - máskor is felhasználhatsz majd (minimális változtatással).

Re: Egységes margó beállítása Abby-alapú dokumentumban

Elküldve: 2019. június 11., kedd 2:10
Szerző: Zizi64
Segítségképpen itt egy makró, ami minden felhasználó által (ez esetben az Abby által) kreált oldalstílust kiirt az .odt dokumentumból. Nem bántja viszont az erőltetett oldaltöréseket, tehát a későbbiekben egyszerűen ráhúzhatod az első oldalra a kívánt első oldal stílust, a tartalomjegyzékre a kívánt tartalomjegyzék oldalstílusát, stb., stb...

Kód: Egész kijelölése

REM  *****  BASIC  *****
Option Explicit
    
Sub OldalStilusEgysegesites

 Dim oStyleFamilies as object
 Dim oPageStyles as object
 Dim oPageStyle as object 
 Dim i as integer
 Dim sStyleName as string
	
	oStyleFamilies = thiscomponent.StyleFamilies
	oPageStyles = oStyleFamilies.PageStyles
	For i = oPageStyles.Count-1 to 0 step -1
		oPageStyle = oPageStyles(i)
		sStyleName = oPageStyle.name
		If oPageStyle.isUserDefined then
			oPageStyles.removeByname(sStyleName)
		end if
	next i	
end sub   
A te régebben megosztott sokstílusú "Déryné"-s dokumentumodon próbáltam ki!
Szépen kidobálta, törölte az "1 átalakítása" - "194 átalakítása" nevű oldalstílusokat, és minden oldal "Alapértelmezett" oldalstílusú lett, de természetesen úgy, hogy a lapok között lévő erőltetett oldaltörések megmaradtak, azaz a könyv nem tördelődött újra, minden maradt azon az oldalon, amelyiken volt a szkennelés és .doc-ba konvertálás után.
LibreOffice6.1.6-ban próbáltam, de működnie kell Apache OpenOffice-ban is.

Re: Egységes margó beállítása Abby-alapú dokumentumban

Elküldve: 2019. június 11., kedd 9:06
Szerző: Antolion
Köszönöm szépen a segítséget. Az Abby, nos olyan, amilyen, a piacon 1 OCR progriról tudok, ami "ért magyarul" (Rediris), sokkal rosszabb, mint az Abby. Ez talán a 9-verziótól teljesen összebonyolódott, addig érdemben csak .doc-ba ,mentett. A formázás nélküli opció nem játszik, mert fontos dolgokat hagy ki vastag/dőlt betű stb. Sajnos, a mostani Abbyk lényegesen agyrémebbek, a stílusokon kívül fáradságos munkában kell lebutítani őket, hogy ne keverjenek be lábjegyzetekkel, automatikus oldalszámokkal stb., sajnos, rosszul. Egy átlag dok.-ba olykor 9-10 féle betűtípust értelmeznek, nem feltétlenül azonos mréretben. A makróért csodállak, agyi képességeim erre nem terjednének ki... Nekem a progi egyszerű szerszám, ami ha nem teljesíti az elvárásaimat, félredobom.
Egy szadista tesztet végeztem: van egy erre a célra fenntartott 1100 oldal (sic!) művészettörténeti album-szkenn, .doc, kb 460, részben szövegközi képpel.
1. Libre O.: 47 másodperc darálás után kiírja, ez nem MS office dokumentum, majd leáll/kifagy
2. Apache O. 42 sec után rendben megnyitja.
3. Softmaker Office 21 sec után megnyitja. (Microsoft O. 2007-es változata: 14 sec) Ezt követően (ez minden doksira érvényes) ctrl+A, minden kijelölni. Bemegyek a margóbeállításokhoz, ott 4 számot írok be, alsó, felső margó, jobb és ball-margó. Ennyi. (Az Abby rohadt stílusai tt is jelen vannak, de semmit gondot nem okoznak.) Softmakerrel az objektumokkal van gond, a keretbe-olvasott oldalszámok, képek stb. esetén. Csak a 2016-os TMD formátuma jó, a legújabb, TMDX ill. a docx problémás. Táblázatait a legújabb MSO formában az MSOffice nem tudja megnyitni, a Libre, az Apache igen. Itt az internetes hivatkozásokkal van gond. Ugyanezt a táblázatot a legújabb formátumban a WP office kezeli a legjobban, csak annak nincs magyar spellinge-je) Amúgy nem akarnék a "szabad-szoftver-fejlesztők-közössége lelkébe gázolni, de ez a progi — free változatban is — csaknem tökéletesen működő holmi (kompatibilitási gondoktól eltekintve viszont átkozottul hasonlít a Libre-re, Apache-ra, nyilván nem véletlenül...
Még egyszer köszönöm a fáradságod!

Re: Egységes margó beállítása Abby-alapú dokumentumban

Elküldve: 2019. június 11., kedd 17:38
Szerző: Zizi64
Egy szadista tesztet végeztem: van egy erre a célra fenntartott 1100 oldal (sic!) művészettörténeti album-szkenn, .doc, kb 460, részben szövegközi képpel.
Andrew Pitonyak makró programozásról szóló könyvei hasonló formátumúak és terjedelműek, de gond nélkül megnyílnak nálam, MERT JÓL VANNAK STRUKTURÁLVA, és A KÉPEK MEGFELELŐEN VANNAK OPTIMALIZÁLVA, és persze az elejétől a végéig ODF formátumban voltak szerkesztve.
http://www.pitonyak.org/OOME_4_0.odt
http://www.pitonyak.org/OOME_3_0.odt

Érdemes - már csak próbaképpen is - letöltés után megnyitni ezeket.