Tähelepanu! Artikkel on enam kui 5 aastat vana ning kuulub väljaande digitaalsesse arhiivi. Väljaanne ei uuenda ega kaasajasta arhiveeritud sisu, mistõttu võib olla vajalik kaasaegsete allikatega tutvumine.
Tööks dokumentidega piisab must-valgest skannerist
Skannerid hinnaga ligi tuhat krooni pole universaalsed ega sobi nii dokumentide kui ka piltide jaoks. Selline skanner sobib kodukasutajale, kel pole erilisi nõudmisi skanneri töökindlusele ja kiirusele. Mõned kallimad ? hinnaga üle 4000 kr ? sisaldavad ka dokumendisöötjat. Selline lahendus ongi sobiv neile, kelle skaneeritavate dokumentide vajadus on kümmekond tükki päevas. Kui meil on aga rohkem dokumente, on ainumõeldavaks lahenduseks korraliku dokumendiskanneri hankimine.
Kas skanner peaks olema värviline või mitte? Kui oleme harjunud, et skannerid on alati värvilised, võib põhjustada hämmastust see, et dokumentide skaneerimiseks kasutatakse valdavalt must-valget re?iimi. Alles viimasel ajal on turule ilmunud värviskaneerimist võimaldavad dokumendiskannerid. Must-valge skaneerimise põhjus on lihtne ? faili suurus. A4-formaadis dokumendi must-valgelt skaneeritud pakkimata faili suurus on ca üks megabait, pakitult on keskmiseks faili suuruseks 40 kilobaiti. Värviliselt skaneeritud sama dokument on sõltuvalt värvisügavusest 24?36 korda suurem ehk üks A4 dokumendileht on suurusega 36 megabaiti. Lisaks on värvilistel dokumentidel üks probleem ? nimelt ei sobi dokumentide pakkimiseks samad algoritmid mis piltide jaoks. Dokumentide pakkimiseks tuleb kasutada kadudeta algoritme, mis ei riku skaneeritud teksti ära. JPG-formaadis muutub pilt ruuduliseks ja selle protsessi käigus kaob olulist informatsiooni. Must-valgete piltide pakkimisel kasutatav algoritm on kaovaba ja tänu sellele ei hävine dokumendilt oluline informatsioon.
Dokumendiskannerite puhul torkab silma, et neil kõigil on dokumendisöötja, mis võimaldab üldjuhul kahepoolset skaneerimist. Mõnel skanneril on lisana olemas ka lameskanner. Suurim erinevus dokumendi- ja laiatarbeskan-nerite vahel on nende eluiga. Laiatarbeskannerite eluiga on tuhatkond lehte, dokumendiskanneritel on see miljonites. Erinevalt dokumendiskanneritest ei ole enamikul dokumendisöötjaga laiatarbeskanneritel dokumendisöötja hooldatav. Kui mõni osa läbi kulub, tuleb skanner välja vahetada, kulunud osa pole võimalik parandada või asendada. Teine põhjus dokumendiskannerite eelistamiseks on kiirus. Laiatarbeskannerite töökiirus on üldjuhul paar lehte minutis, samas kui dokumendiskannerite kiirus algab 12?15 lehest minutis, ulatudes suurte skannerite puhul paarisaja leheni minutis. Sageli on vaja skaneerida sada lehte päevas ja siis küsitakse, miks peaks kasutama kiiret skannerit, kui olemasolevaga saab ka töö tehtud. Siinkohal küsin vastu, kas skaneerimine on ühe inimese põhitöö ja kas poleks mõistlik skaneerimise aega millegi muu jaoks kasutada. Sajaleheküljelise dokumendi skaneerimiseks kulub aeglast laiatarbeskannerit kasutades 30?50 minutit. Ka kõige lihtsam dokumendiskanner teeb selle töö ära seitsme minutiga. Kiireimad dokumendiskannerid saavad sellise kogusega hakkama vähem kui minutiga.
Ka kõige pisematel dokumendiskanneritel mahutab dokumendisöötja kuni 50 lehte. Suured skannerid võtavad korraga ette tuhat lehte. Lisaks on olemas skannereid, millele võib pidevalt dokumente ette anda, hoides skanneri kogu aeg töös. Dokumendiskanneritel on olemas ka topeltsöödu tuvastamiseks andurid, mis mõõdavad dokumendi paksust, pikkust ja läbipaistvust. Need välistavad kahe kokkukleepunud dokumendi koos läbi skanneri minemise. Kiiremad dokumendiskannerid suudavad töö käigus ennast automaatselt häälestada skaneeritavate dokumentide paksusele, tagades nii optimaalse veojõu dokumentide üksteisest eraldamiseks ja veatuks skaneerimiseks.
Milline peaks olema skanneri lahutusvõime? Lahutusvõime on dokumendiskanneritel reeglina kuni 600 dpi-d, mis tundub olematu uuemate laiatarbeskannerite 1200?4800 dpi kõrval. Miks on dokumendiskanneritel nii madal lahutusvõime? Asi on selles, et suuremal tihedusel kui 300 dpi-d ei ole dokumendi skaneerimisel mõtet. Seda põhjusel, et lahutusvõime suurendamisel suureneb ainsana fail ise. Dokumentide skaneerimisel kasutatakse tavaliselt lahutusvõimet 200?300 dpi-d must-valgetele dokumentidele ja 150?200 dpi-d värvilistele dokumentidele. Suurema lahutusvõimega skaneerimisel ei lisandu faili suuruse kasvu kõrval mingit muud kasulikku informatsiooni.
Tavalise A4-dokumendi suurus must-valgelt skaneerituna on keskmiselt 30?60 kb. Kui tekstile lisandub taust, võib faili suuruseks kujuneda 300?500 kb. Kui lahutusvõime on kõrge, võib dokumendifail saavutada suuruse üle ühe megabaidi, samas aga skaneeritud info hulk ei suurene.q
Skanneri efektiivseks kasutamiseks on vaja tema võimalusi ära kasutavat tarkvara. Laiatarbeskanneritele lisatakse kaasa harilikult hulgaliselt tarkvara ? piltide skaneerimiseks ja haldamiseks, dokumentide jaoks tekstituvastuse tarkvara jms. Selline pakett on väga hea kodukasutajale, kes soovib enamiku ajast skaneerida pilte ja aeg-ajalt paar lehte teksti, millele on vaja teha ka tekstituvastust. Suuremate dokumendihulkade skaneerimisel tekib vajadus lisada dokumendi kujutisele ka lisainformatsiooni ehk metainfot dokumendi kohta. Seda võib teha mõnes dokumendihalduse programmis, sisestades iga dokumendi sinna käsitsi ja varustades ta samal ajal vajalike metaandmetega. Oluliselt efektiivsem on aga kasutada spetsiaalset skaneerimistarkvara, mis sisaldab endas kõike vajalikku, nii skaneerimist, täistekstituvastust, vormitöötlust, arvete töötlust, määratud info väljalugemist dokumendist, metaandmete lisamist ning automaatset väljastamist vastavalt vajadusele nii dokumendihaldusesse kui ka majandustarkvarasse.
Autor: Hando Penu