Pli-malpli frue ĉiuj, kiuj ofte laboras kun oficejaj programoj, frontas tipan taskon - skani la tekston de libro, revuo, ĵurnalo, simple flugfolioj, kaj poste traduki ĉi tiujn bildojn en tekstan formaton, ekzemple en dokumento Word.
Por fari tion vi bezonas skanilon kaj specialan programon por rekono de teksto. Ĉi tiu artikolo diskutos la liberan analogon de FineReader -Cuneiformo (pri rekono en FineReader - vidu ĉi tiun artikolon).
Ni komencu ...
La enhavo
- 1. Ecoj de la CuneiForm-programo, ecoj
- 2. Ekzemplo de teksto-rekono
- 3. Rekte rekoni tekston
- 4. Konkludoj
1. Ecoj de la CuneiForm-programo, ecoj
Cuneiformo
Vi povas elŝuti el la retejo de la ellaboranto: //cognitiveforms.com/
Softvaro de malferma fonta rekono. Krome ĝi funkcias en ĉiuj versioj de Vindozo: XP, Vista, 7, 8, kio plaĉas. Plus, aldonu la plenan rusan tradukon de la programo!
Avantaĝoj:
- teksto-rekono en la 20 plej popularaj lingvoj de la mondo (la angla kaj la rusa mem inkluzivas en ĉi tiu numero);
- granda subteno por diversaj presaj tiparoj;
- Kontrolu la vortaran tekston;
- la kapablo savi la rezultojn de laboro laŭ pluraj manieroj;
- konservi la strukturon de la dokumento;
- Bonegaj tabloj de subteno kaj rekono.
Trompoj:
- ne subtenas troajn dokumentojn kaj dosierojn (pli ol 400 dpi);
- ne subtenas iujn specojn de skaniloj rekte (nu, tio ne timigas, speciala skanilo estas inkluzivita kun la skanilaj ŝoforoj);
- la dezajno ne brilas (sed kiu bezonas ĝin se la programo plene solvas la problemon).
2. Ekzemplo de teksto-rekono
Ni supozas, ke vi jam ricevis la necesajn bildojn por rekono (skanita tie aŭ elŝutis la libron en pdf / djvu-formato en la interreto kaj ricevis la necesajn bildojn de ili. Kiel fari tion - vidu ĉi tiun artikolon).
1) Malfermu la bezonatan bildon en la programo CuineForm (dosiero / malfermita aŭ "Cntrl + O").
2) Por komenci rekonon - vi unue devas elekti malsamajn areojn: teksto, bildoj, tabeloj, ktp. En la kojnodimensia programo, ĉi tio povas esti farita ne nur mane, sed ankaŭ aŭtomate! Por fari tion, alklaku la butonon "markado" en la supra panelo de la fenestro.
3) Post 10-15 sekundoj. la programo aŭtomate elstarigos ĉiujn areojn kun malsamaj koloroj. Ekzemple, teksta areo estas markita en blua koloro. Parenteze, ŝi emfazis ĉiujn areojn ĝuste kaj iom rapide. Honeste, mi ne atendis tian rapidan kaj ĝustan respondon de ŝi ...
4) Por tiuj, kiuj ne fidas la aŭtomatan markadon, vi povas uzi la manlibron unu. Por ĉi tio estas ilobreto (vidu bildon sube), per kiu vi povas elekti: tekston, tablon, bildon. Movu, pliigu / malpliigu la komencan bildon, tajpu la randojn. Enerale bona grupo.
5) Post kiam ĉiuj areoj estas markitaj, vi povas iri al rekono. Por fari tion, simple alklaku la butonon kun la sama nomo, kiel en la suba bildo.
6) Laŭvorte en 10-20 sekundoj. Vi vidos dokumenton en Microsoft Word kun la agnoskita teksto. Interese, en la teksto por ĉi tiu ekzemplo, kompreneble estis eraroj, sed estas tre malmultaj el ili! Precipe, konsiderante la simplecon de la originala materialo - la bildo.
La rapideco kaj kvalito estas sufiĉe kompareblaj kun FineReader!
3. Rekte rekoni tekston
Ĉi tiu funkcio de la programo povas esti utila kiam vi devas agnoski ne unu bildon, sed plurajn samtempe. La fulmoklavo por lanĉi agnoskon de bakaĵoj kutime kaŝiĝas en la komenco menuo.
1) Post malfermo de la programo, vi devas krei novan pakaĵon aŭ malfermi antaŭe konservitan. En nia ekzemplo - krei novan.
2) En la sekva paŝo ni donas al ĝi nomon, prefere tia, ke ses monatojn poste ni memoros, kio estas en ĝi konservita.
3) Poste elektu la dokumentolingvon (rusa-angla), indiku ĉu estas bildoj kaj tabeloj en via skanita materialo.
4) Nun vi bezonas specifi la dosierujon en kiu troviĝas la dosieroj por rekono. Cetere, estas interesa, ke la programo mem trovos ĉiujn bildojn kaj aliajn grafikajn dosierojn, kiujn ĝi povas rekoni kaj aldoni al la projekto. Vi ankaŭ bezonas forigi la ekstraĵon.
5) La sekva paŝo ne gravas - elektu kion fari kun la fontaj dosieroj, post rekono. Mi rekomendas elekti la markobutonon "Ne faru nenion".
6) Nur restas elekti la formaton, en kiu la agnoskita dokumento estos konservita. Estas pluraj ebloj:
- RTF - la dosiero de la vorto dokumento estas malfermita de ĉiuj popularaj oficoj (inkluzive de senpagaj, ligilo al programoj);
- txt - Teksta formato, vi povas konservi nur tekston, bildojn kaj tabelojn en ĝi;
- htm - Hiperteksta paĝo, konvena se vi skanas kaj rekonas dosierojn por la retejo. Lia kaj elektu en nia ekzemplo.
7) Post klako sur la butono "Fini", la prilaborado de via projekto komenciĝos.
8) La programo funkcias sufiĉe rapide. Post rekono, vi vidos langeton kun htm-dosieroj. Se vi alklakas tian dosieron, retumilo komenciĝas kie vi povas vidi la rezultojn. Parenteze, la pako povas esti konservita por plua laboro kun ĝi.
9) Kiel vi povas vidi la rezultoj laboro estas tre impona. La programo facile rekonis la bildon, kaj facile rekonis la tekston sub ĝi. Dum la programo estas senpaga, ĝi estas ĝenerale bonega!
4. Konkludoj
Se vi ofte ne skanas kaj rekonas dokumentojn, aĉetado de FineReader probable ne havas sencon. CuneiForm facile pritraktas plej multajn taskojn.
Aliflanke ŝi ankaŭ havas malavantaĝojn.
Unue estas tro malmultaj iloj por redaktado kaj kontrolado de la rezulto. Due, kiam vi devas agnoski multajn bildojn, tiam en FineReader estas pli bone vidi tuj ĉiun aldonitan al la projekto en la kolumno dekstre: rapide forigi nenecesajn, fari redaktojn ktp. Kaj trion, ĉe dokumentoj de absolute malbona kvalito, CuneiForm perdas rekonon: vi devas memori la dokumenton - korekti erarojn, meti interpunkciojn, citaĵojn, ktp
Jen ĉio. Ĉu vi konas iun alian decan liberan rekonan softvaron?