ARTIKKELI

Laadukas ja monikäyttöinen PDF-dokumentti

Tiedonhallinnan tehokkuus vaikuttaa hyvin paljon toimistotyön arkeen. Asiakirjat ovat tärkeässä roolissa eri prosesseissa ja niiden löydettävyys ja uudelleenkäyttö on tärkeää. On väitetty, että asiakirjojen etsimiseen ja tekstien uudelleen kirjoittamiseen saattaa tuhrautua jopa seitsemän tuntia työaikaa viikossa. Ei siis ole yhdentekevää, millaisia sähköisiä dokumentteja monitoimilaitteet, skannerit ja järjestelmät tuottavat.

PDF on laadukas ja monikäyttöinen sähköinen dokumentti

Tekstintunnistuksessa, kuvan parantamisessa ja tiedostokoossa saattaa olla suuriakin eroja, jotka vaikuttavat sähköisen asiakirjan jatkokäyttöön, ja huonolaatuinen tekstintunnistus voi vaikuttaa tiedon löytymiseen, jos juuri kriittinen sana on tunnistettu väärin.

Millainen tiedosto olisi siis helposti luettavissa, jaettavissa ja tulostettavissa laitteista ja käyttöympäristöistä riippumatta? PDF:stä voidaan puhua universaalina tiedostomuotona ja se on tänä päivänä standardoitu tiedostomuoto. Siitä saadaan muodostettua arkistointikelpoinen ja virallisesti hyväksytty tallennusmuoto. Erilaisilla editointiohjelmistoilla voidaan luoda olemassa olevista erityyppisistä asiakirjoista yhtenäinen PDF-asiakirja, mutta tiedosto voidaan halutessa myös lukita niin, ettei sitä voida muokata.

Hakukelpoinen PDF helpottaa löytämistä ja lisää uusien asiakirjojen tehoa

Liiketoiminnassa tärkein PDF-formaatti on niin kutsuttu sisältöhakukelpoinen PDF. Hakukelpoinen PDF on luotu tekstintunnistusta eli OCR:ää (Optical Character Recognition) hyväksikäyttäen, jolloin asiakirjan teksti on eroteltu ikään kuin omaksi tasoksi, jolloin siitä on hyötyä monellakin tapaa. Arkistoitu hakukelpoinen PDF löytyy helposti, sillä haku ulottuu asiakirjan sisältöön saakka. Asiakirjan sisällä on helppoa ja nopeaa etsiä suuresta dokumentista, vaikkapa käyttöoppaasta, juuri ne kohdat, jossa käsitellään haluttua asiaa. Hakukelpoisesta PDF:stä saadaan myös kopioitua niin tekstiä kuin kuvaa ja vietyä toiseen asiakirjaan, jolloin säästetään aikaa, kun kaikkea ei tarvitse kirjoittaa uudelleen.

Laadukas tekstintunnistus pitää sisällään niin sanottuja sanakirjoja, joissa ei tunnisteta pelkästään merkkejä vaan sanayhteyksiä. Siksi on hyvä myös varmistaa, että laitteen tai ohjelmiston OCR-moottori tukee suomen kieltä, jotta ääkköset tulkitaan oikein ja kirjaimet löytävät paikkansa sanayhteyksiin nähden. Skannatessa kannattaa aina tuottaa sisältöhakukelpoinen asiakirja. Lisäksi on olemassa työasemaohjelmistoja, joissa voidaan sähköiselle asiakirjalle tehdä tekstintunnistus ja editoida ja luoda uusi yhdistetty asiakirja useasta eri asiakirjasta.

Laatua ja tarkkuutta – nopeutta unohtamatta

Jotta skannattu asiakirja on laadukas ja skannaustyö tehokasta, on skannaavan laitteen – monitoimilaitteen tai skannerin – teknologialla suuri merkitys. Uusin skannausteknologia sisältää monia työtä helpottavia ominaisuuksia, minkä lisäksi skannausnopeuksia on lisätty ja mahdollistettu asiakirjan luku molemmilta puolilta paperia samanaikaisesti, jolloin skannaus on todella nopeaa. Likaa hylkivällä lasilla ja kuvasensoreilla varmistetaan skannatun asiakirjan tasaisen hyvä laatu.

Useimmat monitoimilaitteet, skannerit ja digitointiohjelmistot mahdollistavat kattavan valikoiman erilaisia kuvanparannustoimintoja. Niitä ovat esimerkiksi sivun suoristaminen tai kääntäminen sen tekstisuunnan mukaan, taustakuvioinnin tai värien poisto, ylimääräisten pisteiden, viivojen, rei’itysjälkien ja tummien reunojen poisto. Nämä toiminnot todella säästävät aikaa, etenkin kun siirretään mapeista asiakirjoja sähköisiin arkistoihin tai kun skannataan nippuja. Myös tekstintunnistus onnistuu siivotusta asiakirjasta parhaiten. Jos jatkokäsittelyssä poimitaan asiakirjasta metatietoa, kuten laskunnumero tai asiakasnumero, on ensiarvoisen tärkeää, että numerot tulkitaan täysin oikein.

Asiakirjan koolla on merkitystä

Asiakirjoja skannatessa on hyvä huomioida, kuinka suuri PDF-tiedosto asiakirjasta syntyy. Tiedoston koko tuplaantuu helposti, jos käytetään mustan tekstin lisäksi harmaasävyjä – värejä käyttämällä koko saattaa jopa moninkertaistua. Värillä on kuitenkin tärkeä merkitys asiakirjassa, sillä se lisää huomioarvoa, korostaa ja elävöittää sitä, joten värillinen asiakirja kannattaa aina skannata värillisenä. Asiakirjoilla luodaan myös mielikuvia, siksi ne ovat myös bränditekijöitä.

Tehokas tiedon pakkaaminen säästää levytilaa ja helpottaa tiedon siirtämistä. Käsiteltävä dokumentti voidaan kuitenkin pakata merkittävästi pienempään kokoon, mutta silti laadukkaana ja sisältöhakukelpoisena. Pakkaamiseen löytyy automatiikkaa niin monitoimilaitteiden kuin skannausohjelmistojen teknologiasta.

Hyvä sähköinen asiakirja on selkeä ja laadultaan moitteeton jatkokäyttöä varten. Se on helppo arkistoida ja jakaa pienen kokonsa ansiosta, sekä helppo vastaanottaa ja lukea.


Kirjoittaja

Riitta Mölsä

tuotepäällikkö, Canon Oy

Leo Wikholm

asiantuntija, Canon Oy

Haluatko kuulla, miten Canon voi auttaa teidän yritystänne?

Ota yhteyttä

Aiheeseen liittyvät ratkaisut

Lue lisää