Keresés a blogban és máshol

2012. október 23., kedd

2012. október 19., péntek

calibre - ebook - OCR - X. - (gyorsabb javítás)

A könyv-fájl javítgatása nem valami lélekmelengető feladat. Azonban van rá mód, hogy bizonyos dolgokat gyorsabban vagy épp automatizálva végrehajtsunk – de változatlanul érvényes, hogy meló nélkül nem ússzuk azért meg. És természetesen azt se feledd, hogy ezeknél a megoldásoknál alkalmasint másnak lehet jobb ötlete, módszere is.
Igaz, hogy az abbyy –t (ABBYY FineReader) is lehet tanítani, de ha figyelmesen megnézed a leírását, ott eleve utalnak rá, hogy a saját minta csak az épp aktuális betűtípus (satöbbi) esetén működik. Márpedig – a sorozatokat esetleg leszámítva – vajmi kevés az esélye annak, hogy a következő könyv olyan legyen, mint az előző. Ezért én ezzel nem is kísérleteztem.
Viszont  ami minden könyvben közös, az az, hogy előbb-utóbb a Word-ben végzi, meglehet szkennelés után rögvest.
totalszoveg

Valahogy olyan módon, mint fentebb láthatod. Az abbyy A/4-ben dolgozik, az elrendezés tartására van utasítva (de a szerkeszthető másolat vagy formázott szöveg olykor jobban megteszi) . A Word alapból szintén A/4-ben végzi a dolgát. Ez egyelőre jó is így. Nem kell és nem is szabad az oldalméretezésre vetődni, egyrészt mert égetőbb problémák is vannak, másrészt, ha az oldalméret változtatásával szórakozol előbb, azzal csak plusz hibákat generálsz - az esély nagy rá.
Az abbyy-t ráveheted arra is, hogy ne tartsa az elrendezést. Akkor olyan rtf formájú dokumentum-féleséget hoz létre, aminek a formába rázása –szerintem -, macerásabb. Ráadásul, ha véletlenül keresni kell a könyvben hibajavításhoz, sokkal gyorsabb, ha látod az eredeti tördelést.  Az eredeti oldalszámozást szinte mindig száműzöm. Teljesen feleslegesnek tartom. A könyvolvasók számtalan lehetőséget kínálnak, hogy megjegyezz, vagy megkeress valamit.
Mielőtt a Word-ben melózni kezdenél, pár dolgot el kell tüntetni.(És az sem árt, ha a betűtípusokat ellenőrzöd, képes-e a helyes megjelenítésre.) A könyvek elején van pár oldal, ahol mindenféle információk vannak: kiadásokról, fordításról, nyomda-technikai megjegyzések, isbn szám, esetleg van ajánlás – idézőjeles -, a könyv címe finom kalligrafikus kivitelben satöbbi. Ezeket a dolgokat vágd ki onnan és tedd félre valahová. Azért, mert a következőkben végrehajtandó ügyeskedéseinket zavarja. Ez igaz a dokumentumban lévő képekre is. Amíg a fájl nincs kipofozva, nem kívánatosak benne a képek. Természetesen ez csak az én meglátásom.
Ne feledd: ha valami nem sikerül, akkor a Word-ben nem össze-vissza kattogtatással, hanem az utolsó parancs(ok) visszavonásával a legcélszerűbb rendet tenni.
Nézzük meg közelebbről a dokumentumot.
Kpkivgs

Az első fő probléma, hogy minden oldal szakasztöréssel végződik. Ez nagyon nem jó. Első lépésként orvosoljuk ezt. Azért kezdjük ezzel, mert a dokumentum egész képére (stílusára, tördelésére) ráhatása van.
Nyisd meg a Word „csere” paneljét. A felső sorba kerüljön „felnyil b” (^b), az alsóba „felnyil p” (^p). Légy körültekintő! Semmi egyéb nem kerülhet a sorokba, az elején és végén véletlenül se maradjon szóköz (amit nem is látsz ráadásul) vagy bármi! Tehát ezt kell látnod:
oldaltrscsere

A nyilakat megtalálod a billentyűzeten, de a csere panel speciális menüjében is rátalálsz. Azt magától értetődőnek vettem, hogy elsőre csak pár oldal szöveget tégy magad elé a Wordben, gyakorolni, próbálgatni tökéletes.
Ha „az összes cseréje” gombra kattintasz, a Word végigsöpör a dokumentumon és végrehajtja a megszabottakat. Vagy ha a „következő” gombra kattintasz, akkor rááll a következő találatra, és ezt kiemelve meg is mutatja. Ha a „cserére” kattintasz, akkor végrehajtja. És így tovább.
csereutn

Azután a fentihez hasonlóra vált a kinézet. Egy fokkal egységesebb a dolog.
Most, vagy a végén, törődjünk kicsit az elválasztásokkal. A csere panelbe írd:
Felülre ^p- alulra pedig semmit. (A „semmi” nem szóköz, hanem teljesen üres sor.)
Felülre - alulra semmi és a szó eleje/végi egyezést jelöld be.
Ezeket egyesével kell végignézni. Különben minden gondolatjelet eltüntet. Ráadásként azt is figyelni kell például, hogy a „visz-sza” szóból, ne „viszsza”, hanem „vissza” legyen. Az automatikus helyesírás javítás egy könyv fájl esetén nem biztos, hogy bölcs választás.

Most végezzük ki  a gondolatjelekből született felsorolásokat.
lista
A fenti képen láthatod, mire gondoltam. Ha a kurzorral a (fenti példa szerint) a Renault szó elé állsz, és jobb egérgombbal kattintasz, megnyílik egy helyi menü. Ott válaszd a „listabehúzás igazítása” sort. Ez az egész dokumentumra hatni fog, attól függetlenül, hogy nincs az egész kijelölve.
lista vlt

A „Tab karakter” helyére görgesd a „semmi” vagy "szóköz"szót és okézd le. Eredmény:(ha a semmit választottad.)
semmi

(Amennyiben biztosan nincsen szükséged a felsorolásra, akkor természetesen valóságosan is eltüntetheted. Mind az ABBYY-ban, mind a Word cserepaneljén megszabhatod, hogy a felsorolást cserélje, illetve szüntesse meg. A vonalzókon utána tetszésed szerint állíthatsz a sorok kezdetén, de ügyelj rá, hogy ha stílust szabtál a bekezdésnek, szakasznak akkor ne nagyon kutyulj bele.))

A kötő- és gondolatjelekről írtam már máshol. A szabályok szerint a párbeszéd gondolatjelét szóköznek kell követni. Ha ezt szeretnéd, akkor a semmi helyére szóközt görgess. Azt tudnod kell, hogy itt most csaltunk. Csak látványilag változtattuk meg a dolgokat. Igazából a felsorolás megmaradt. (Ha megszüntetnék, nagyon sok javítanivalót generálnánk, és ahogy észrevettem, a látványilag kiigazított felsorolás a végeredményben (konvertálás) nem zavar majd.)

Következő lépésként irtsuk ki a felesleges sortöréseket.
Mivel az írásjelek utáni sortöréssel nincs gond, ezért azokat meg kellene menteni. Első lépésként azokat helyezzük biztonságba (egyszerűen ideiglenesen írjuk át másra.) A csere panelba a következőt pötyögjük  be: felső sorba ^p az alsó sorba @& majd az összes cseréje.
Az eredménye a következő lesz:
elscsere

Ne törődj vele, mint mondtam, biztonságba helyeztük azt, ami  nagyjából jó. A végén visszafordítjuk a dolgot.
Megeshet, hogy a fenti akció végrehajtása után nem látsz semmit, vagy esetleg néhány sor marad a dokumentumból. Nem kell kapkodni, menüsorban vissza kell vonni az utolsó parancsot. Az ok ilyenkor feltehetőleg az, hogy valami nem helyénvaló maradt a dokumentumban. Említettem, hogy pár dolog nem kívánatos a fájlban, javítgatás közben. A képek. Ez sajnálatos módon lehet egy képnek értelmezett fejezet cím, oldalszám vagy iniciálé is, amin átsiklottál. A könyvek végén is előfordulnak hasonló oldalak, mint az elején, amelyek tele vannak írásjelekkel, a törzs-szöveghez nem illő tördelésekkel, írásjelekkel. Ezektől meg kell szabadulni. Akkor újra meg lehet próbálni a fenti manővert.
Ezután a többi sortörést cseréljük át szóközre. A következő lépésekben írásjelek utáni dolgokat piszkálunk, tehát nagyon ügyelj a beírt karakterekre.
felülre !^p alulra !@&
(utána próbáld újra úgy, hogy a felkiáltó jel helyére ":" majd "..." azután "?" jeleket írsz. Az idézőjeles változatot -felülre “^p alulra “@&  - meggondolandónak tartom, legalábbis célszerűnek az egyenkénti végignézését)
Azután még ezt is csináld meg:
felülre @&^p alulra @&@&
felülre ^p alulra szóköz   (a szóközt nem fogod látni, állj a sor elejére és „space” billentyű - egyszer!)

Ha ezek meg vannak –nem feltétlenül lesz találat -, akkor a biztonságba helyezett sortöréseket, igazítsuk vissza: felülre @& alulra ^p

Nagyjából ez lesz az eredmény:
eredmny

Viszont, ahogyan fenti képen látod is, a kézi sortörések tömkelege hemzseg a sorok végén. Ezeket is irtsuk ki.
kezisotrs

A felső sorba, a speciális fül segítségével keresd meg a „kézi sortörés” –t, az alsó sorba pedig ne írj semmit. Az eredményt a fenti kép bal oldalán láthatod. Ha összeírásos hibák keletkeztek, akkor vond vissza a feladatot, és ismételd úgy, hogy az alsó sorba szóközt üss.

Most jött el az ideje, a méretezésnek. Jelöld ki az egész dokumentumot ( menüsorban a csere alatt megtalálod a kijelölés panelt), majd a margót (laprendezés/margó) állítsd „normálra”.
 marg
(Amennyiben túl sok az egybeírásos hiba (mint itt fentebb is), akkor vond vissza a megfelelő lépésig a parancsokat, és mint már említettem, próbáld a felső sorba "kézi sortörés" alsóba szóköz. De megpróbálhatod azt is, hogy először  a margót változtatod és utána a kézi sortörést. És egyébként is bátran variálj, ha ötleted támad.)
(Azt, hogy a dokumentum balra tartson, automatikus elválasztással működjön, legyen sorkizárt esetleg, majd eldöntöd. A stílusoknál az ilyesmiről már volt szó.)

Ezután igazítsd az oldalt az általad favorizált méretre vagy az olvasód ismert méretét legjobban megközelítő oldalarányra (alább 14,8 X 21 cm méretezésben látod):
 mret

Ha eddig nem törődtél az elválasztó jelekkel, akkor most itt az ideje. Fentebb már írtam.

Ha a stílusok között van beállított sajátod, akkor hajrá. Annak hatására egységes behúzások, megjelölt betűtípusok és méretek – minden oda áll, ahová megszabtad. Ha szkennelés vagy bármi miatt a fejezet címek eltűntek, akkor azt kézzel kell pótolni. Ha megvannak, akkor a sorukba való kattintás után csak a besorolását kell kijelölni. A fejezet címeket H1 vagy H2 besorolásra állítani célszerű.
 fejezet

Ha a stílusokban nem szabtad meg, akkor a címsorok elé kézzel vigyél szakasztörést annak érdekében, hogy minden fejezet tutira új oldalon kezdődjön. Mint a sárga csíknál láthatod, a Word a helyesen besorolt fejezetcímekből tartalomjegyzéket generál.
A dokumentumban számtalan hiba lehet még, az átnézését nem lehet megúszni. Nem csak helyesírás, hanem mondjuk simára változott vastag- vagy dőltbetűs részek satöbbi.
A fájl mehet a kedvenc konvertáló programba. Azt se feledve, hogy a Word számos formába le tudja menteni a kész dokumentumot.

Meglehet, lesz ötleted még tipizált hiba hasonló javítására. Vagy esetleg praktikusabb sorrendre jössz rá. Az remek. De ennek a sok kriksz-kraksznak a beirkálása azért irritáló. Ezért javasolom, vess egy pillantást a Word makró funkciójára. (fejlesztő eszközök/makrók).
Ott láthatsz egy olyat, hogy makró rögzítése. Ha azt elindítod, akkor a Word elkezdi megjegyezni a végrehajtott feladatokat . A cseréket is, minden kriksz-kraksszal együtt.(Az itt közömbös, hogy ténylegesen cserélt-e valamit) Egészen addig, míg a rögzítést ki nem kapcsolod. Akkor a makrónak ad egy nevet és egy ikont. Ha legközelebb a következő dokumentumodban az ikonra kattintasz, akkor automatikusan lefuttatja a makróban lévő feladatokat. De csak akkor, ha rögzítésnél a minden dokumentumra való vonatkozást bejelölted – ezt ne feledd. Ez egy szimpatikus dolognak tűnik… (Elismerem, ezzel kicsit majd kell küzdeni, de rá lehet jönni, ha az ember odafigyel. Arra is ügyelj, hogy vannak olyan feladatok, amihez ki kell jelölni előbb az egész dokumentumot, egyébként csak az aktuális oldalra vagy az első oldalra fog vonatkozni satöbbi. És persze ne akarj túl sokat egyszerre.)
Jó javítgatást. Remélem segítettem, azért pedig elnézést, ha a csereberénél elgépeltem valami jelet vagy nem jól jelent meg (a html szüttyögéshez most nem volt humorom) – úgyis rájössz.

Word keresés


I. VII. VIII. IX. XI. e.I.

2012. október 13., szombat

черный ворон (black raven) - Яхонт (Yahont)

Yahont - Яхонт - (Yakhont)- (album:)Черный ворон,1996
02 Черный ворон (Chyornyi voron) - Fekete holló - (Black raven)


"Fekete holló, fekete holló,
miért keringsz hát felettem?
Zsákmányra hiába vársz,
én tiéd nem lettem."

Vagy ha így jobban tetszik:
"Zúg a Volga, sír a Volga..."









jeremy (duett) - hevesi tamás

2012. augusztus 30., csütörtök

ebook fájlok III. - javítások - betűk és írásjelek

A Windows rendelkezik bizonyos alap betűkészlettel, amihez a használat során - például telepített alkalmazások miatt - alkalmasint újabb készletek is hozzáadódnak. Ha a Windows-t vagy a Word-öt több nyelven használod - vagy használtad valaha -, ez esetben is újabb betűkészletek települnek a gépedre. A gépen található betűkészlet (betűkatalógus) és a telepített betűkészlet nem ugyanaz.

Egy dokumentum nagyon könnyen tartalmazhat eltérő betűfajtákat. Példának okáért, ha nem a magad által definiált stílusokat használod vagy azokat nem körültekintően hoztad létre, abban az esetben esélyes, hogy a címsorok és egyebek a törzs–szövegtől eltérő betűtípusra váltsanak. De abban az esetben is van esély a betűtípusok keveredésére, ha munka közben másfelé kalandoztál, esetleg vágólappal kapcsolatos műveleteket végeztél.
A máshonnan kapott dokumentumoknál pedig nem kell magyarázni, mekkora az esély arra, hogy bizonyos értelemeben kavarodás legyen bennük.

Különböző írások más–más célra valók, eltérő okból készültek. Egy könyvnél természetesen van létjogosultsága, hogy ne egy kaptafára hömpölyögjön az egész szöveg. Ám bizonyos dolgokon célszerű eltűnődni.
A törzs–szöveg, a fejezetek vagy alfejezetek, megjegyzések és lábjegyzetek miért is ne kaphatnának eltérő betűtípusokat? Ez az értelmezésben is segítség. De ennél tovább nem célszerű variálni. Azt viszont ne feledd, hogy ha így kezdesz neki a munkának, akkor azt logikusan végig kell vinni az egész terjedelmen.
A betűtípus választásánál szerintem az elsődleges az olvashatóság. Ezzel el is érkeztünk a talpas (serif) és talpatlan (sans–serif), vastagított és díszítő betűfajtákhoz. (Persze ez a téma ennél kicsit hosszabb.)
Ha egy megfelelő betűnavigátor programmal belenézel a gépeden lévő betűkészletbe, alapvetően mindent látsz egy betűfajtáról, ami számít. (Az alsó ű betűn rögtön láthatod, hogy azt a betűfajtát kerülnöd tanácsos, ha olvasóra szánod a könyvet.)



Általában azt tartják, hogy nyomtatott vagy hosszabb szöveget kényelmesebb talpas betűkkel olvasni, míg az elektronikus megjelenítőkre célszerűbb a talpatlan betűfajta. Annyit még megjegyeznék, hogy a talpas betűk megkönnyítik a szemnek a sor tartását.

Megfontolandó, hogy egy dokumentum egészét átállítod adott betűfajtára és ahol szükséges belejavítasz -, illetve a stílusok és egyéb beállítások (fejezet, lábjegyzet) úgyis átjavítják. Vagy toldani–foldani–javítgatni kezded.
(A számítógépre nem telepíthetsz számolatlanul betűfajtákat, mert abból előbb–utóbb komoly problémák adódnak!)
Az elektronikus könyvek közül bizonyos kiterjesztésűekbe beágyazhatod a betűkészletet. Ami annyit jelent, hogy készítéskor a könyv–fájlba becsomagolódik a megfelelő betűkészlet, így bárki letölti és megnyitja a könyvet, a betűkészlet a rendelkezésére áll. Magától értetődően, ez növeli a kész fájl méretét. Csak azok az olvasók tudják ezt kihasználni, amelyek a szóban forgó kiterjesztéseket kezelni képesek.

Kissé meguntam a gondolatjel problémákat. A magyar szövegben kettő fajta "gondolatjelnek" van helye. A többi előcibálása jól hangzik, de allűr kategóriás probléma...
Tehát: gondolatjel (-rövid) és kötőjel (–hosszú). Ez utóbbi kétszer hosszabb. A gondolatjelet mindig szóköz előzi meg és követi, kivéve soreleji párbeszéd, illetve írásjel követheti és úgy szóköz.
Ami a tartalmi dolgot illeti: a gondolatjel önálló mondatok, mondatrészek összekapcsolására szolgál, a kötőjel szavak és szókapcsolatok összefűzésére szolgál. És jelez még egyéb dolgokat is:
Az "1567-rövid1589" azt jelenti nagyjából akkortájt, az "1567–hosszú1589" pedig azt jelenti, hogy pontosan abban az időtartományban. A "Kovács-rövidTóth" azt jelenti, hogy egy Kovács-Tóth nevű személy, a "Kovács–hosszúTóth" pedig azt, hogy Kovács és Tóth nevű személyek. És még sorolhatnám.
(A fenti két "gondolatjelet" nagykötőjelnek hívjuk. A "sima" kötőjel - amelyből több fajta létezik: feltételes, nem törhető -, a szavak, szórészek összetartozására utal, vagy ha így érthetőbb, az összetartozás alternatívája.)
A Windows alkalmazások eltérően kezelik a bevitelüket, illetve annak szándékát.
A gondolatjellel nincs probléma, mert megtalálod a billentyűzeten. A nagykötőjel macerásabb. A nagykötőjelet (–hosszú) például a Wordben be tudod írni a "ctrl" és "minusz" jel - számbillentyűzeten - lenyomásával. Illetve, ha a Word be van állítva, akkor két gondolatjel (--) utáni szóközre a Word átváltja azokat nagykötőjellé –hosszú. Viszont például itt a böngészőben, a "ctrl" és "minuszjel" kombinációra a böngésző nagy eséllyel az ablakméret változtatásával reagál. Itt a megoldás az "alt" (bal oldali) nyomvatartása mellett a "0150" billentyűzése. Azt "alt" billentyű felengedése után megjelenik a nagykötőjel. (Legalábbis neked, amikor írod, mert a böngészők megjelenítése másképp működik. A böngészők működése miatt,  mindenhol csak "-" jelet látsz a szövegben, ezért írtam mögé: hosszú vagy rövid. Egyébként html kódolásban épp megoldható lenne; a nagykötőjel kódja: "&#8211" vagy "&andash". Ezt egyébként a böngésződ oldalelemzésében meg is tudod nézni. De ha kinyitod a Word-öt, ott kipróbálhatod, amit olvastál.)
Illetve természetesen alkalmasint a speciális karakter bevitel is használható.
Elméletileg még a szóköz milyensége is számít a jelek előtt–után, de ezt most hanyagolnám.
(Azt pedig ne feledd, hogy az angolban   hosszabb gondolatjel van és ott a mondatokat sem egy sima szóközzel zárják.)

Mindenféle bántó szándék nélkül, lenne még megjegyzésem.
Aki nekifeszül egy könyvvel való szórakozásnak a gépén, az minden bizonnyal ismeri a google-t. Hát használni kéne. Ha egyéb nyalánkságok helyett beírod a keresőbe: "nagykötőjel" vagy épp "hosszú gondolatjel"  furcsa módon arra is működésbe lendül. És sokkal többet megtudhatsz róluk, mint amit én most ideírtam.
A Word helyesírási javítója tanácsokat ad és általában nem megoldásokat!
A szöveggel való babráláshoz elkél a gép mellett (vagy program szinten, esetleg beépülő modulként) helyesírási tanácsadó vagy szabálygyűjtemény.
Azt pedig mindannyian tudjuk, hogy egy érdekes regény olvasása közben nincs az az ember, aki ilyen gondolatjel meg hasonló problémákra figyelne. A konvertáló programok viszont figyelik. Tehát ismét oda jutottunk: jó alapanyag - jó ebook.



I. II. IV. X.