HowTo

Breve guida alla scansione

Pubblicato il

Rispetto a dieci anni fa, l’utente medio è oggi in grado di svolgere autonomamente moltissime operazioni al computer, e questo anche grazie a programmi che nascondono sempre di più la complessità di tali operazioni, richiedendo una interazione elementare con poche semplici scelte. Questo ovviamente presuppone l’uso di molti valori di default nascosti, che però per molte operazioni sono validi (o accettabili) più del 90% dei casi.

Esistono però delle operazioni dove nascondere la complessità non fa che peggiorare le cose, ed i programmi con l’unico grande bottone “Fai tu” in realtà frustrano l’utente con risultati scarsi e non adatti alle sue esigenze. E’ il caso ad esempio dell’editing video e dei fogli elettronici, ma anche della scansione di documenti, di cui ci occuperemo in questa breve guida.

La pigrizia mentale degli utenti (e la poca chiarezza delle informazioni a disposizione) però spesso li blocca dall’istruirsi sulla “teoria” a monte di tali operazioni. Tanto più che ormai (a causa di ciò che si diceva all’inizio) c’è la pretesa di premere un pulsante e far fare tutto al pc.

Ho premesso questo, per dire che è essenziale, in certi settori (e la scansione è uno di questi), prima di passare alla pratica, conoscere un po’ di teoria. Ecco il perché di questo articolo.

I formati immagine

Esistono due grandi famiglie di tipi di file grafici (anzi, meglio, di formati immagine): quelli vettoriali e quelli raster. La differenza è gigantesca: i formati vettoriali contengono solo una descrizione delle linee ed aree di cui è composta l’immagine. Questo permette loro di essere ingranditi a piacimento senza sfocarsi. Tuttavia questi formati sono raramente usati nella vita di tutti i giorni (l’utente medio non ha mai sentito parlare di file ai, svg, wmf, eps, …), anche perché devono essere disegnati appositamente.

I formati raster sono invece quelli più comuni, e contengono i singoli pixel che compongono l’immagine. Le fotografie e le scansioni sono evidentemente in formato raster, e perciò oltre un certo ingrandimento sgranano. Ogni pixel contiene il valore del colore di cui è composto, e di fatto le immagini raster sono una griglia di numeri che indicano il colore di ciascun pixel.

E’ perciò fondamentale decidere prima di scansionare (o di scattare la fotografia) quanti dettagli vogliamo acquisire (cioè quanto grande sarà l’immagine in pixel), in quanto se ne abbiamo acquisiti pochi, non sarà possibile ricavare magicamente i pixel mancanti (a meno di ri-scansionare lo stesso foglio).

Quando sentite parlare di megapixel (o gigapixel, ormai capita), non è altro che la quantità di “celle” nella griglia dell’immagine. Se ad esempio abbiamo una immagine di 3000×2000 pixel, sarà una griglia contenente 3000 colonne e 2000 righe, ed ogni cella sarà un numero indicante il colore, per un totale di 6 milioni di celle, ovvero 6 megapixel. Se considerate che in genere si usa un byte per ogni colore (e i colori fondamentali sono 3), tale immagine raster non compressa occupa 18 megabyte. E’ poi possibile comprimere le informazioni per occupare meno spazio, ma dei formati dei file e della compressione parleremo dopo.

Risoluzione

Il primo scoglio contro cui si scontrano gli utenti medi è il concetto di “risoluzione”. Eppure è fondamentale per decidere quanti pixel acquisire (perché come si diceva prima, se ne acquisiamo pochi, poi non ci sono miracoli che tengano).

La risoluzione è strettamente legata al mezzo fisico su cui era (o sarà) stampata l’immagine.

Per una immagine che è stata scansionata e/o che andrà stampata, non ha senso parlare solo di grandezza in pixel (ad es. 2000×1500 pixel), in quanto tale grandezza è “assoluta” e non ci dice quanto era/sarà grande tale immagine sulla carta.

Ma non ha neanche senso parlare solo di grandezza in cm (o mm, o pollici, etc.) in quanto come sappiamo di fatto le immagini raster sono composte di tanti singoli pixel.

Per legare le due misure, si usa la risoluzione, che altro non è che un numero che ci dice quanti pixel sono stati acquisiti per ogni cm fisico del foglio originale (in genere, poiché l’informatica è nata in America, si usano però i pollici, in inglese “inch”). La misura standard si chiama dpi, ovvero “dots per inch” (punti per pollice).

Quando diciamo perciò 150 dpi, indichiamo che per ogni pollice fisico sono stati acquisiti 150 pixel. Poiché un foglio A4 è grande 11.69 x 8.27 pollici, se scansionato a 150 dpi risulta in una immagine di 1754 x 1240 pixel.

E’ fondamentale mantenere (ed eventualmente trasformare, se si ridimensiona l’immagine) le informazioni sulla risoluzione, poiché sono fondamentali per poi ristampare nella dimensione fisica corretta l’immagine acquisita.

Si tenga presente che le stampanti da ufficio raramente possono stampare a più di 300 dpi, perciò è un inutile spreco di disco acquisire immagini a risoluzioni superiori (a meno che non sia per il fotoritocco, ovviamente). Come regola generale, a meno che non ci siano scritte molto piccole o grafici molto precisi, si può scansionare a 200 o anche a 150 dpi. A meno i caratteri cominciano ad essere sgranati e poco leggibili.

Colore

L’altra scelta da fare quando si scansiona è se acquisire a colori o in bianco e nero. In teoria, il discorso sarebbe anche più complicato, ma raramente gli scanner permettono una scelta al di fuori della triade “colore/scala di grigio/bianco e nero”. Se “colore” è chiaro a tutti ciò che vuol dire, molti si interrogano sulla differenza tra “scala di grigio” e “bianco e nero”, e spesso fanno la scelta sbagliata (cioè, nel 99% dei casi, bianco e nero). Ma se ricordiamo che ogni pixel altro non è che un numero, è facile capire che per ogni pixel possiamo decidere quante informazioni salvare.

Colori vuol dire che ogni pixel memorizza tre numeri (da 0 a 255) che indicano quantità di rosso, verde e blu. Scala di grigio significa che ogni pixel memorizza un solo numero (da 0 a 255) che indica solo la luminosità. Bianco e nero è il più compatto, perché ogni pixel può essere uno 0 o un 1, che indicano se è bianco o se è nero. E’ il formato usato dai fax e dalle vecchie fotocopiatrici.

Come regola generale, i documenti raramente contengono del colore, perciò conviene scansionarli in scala di grigio, riducendo di 2/3 lo spazio su disco.

Compressione

La scelta della risoluzione è solo il primo problema da affrontare (insieme alla decisione sul colore/scala di grigio), poiché l’altra grande scelta riguarda il formato in cui salvare l’immagine scansionata. I programmi col pulsante “Fai tu” in genere salvano in jpg o pdf, ma ciò vuol dire tutto e nulla, se non si conosce un minimo il funzionamento della compressione delle immagini (niente paura, dei formati file parleremo più sotto).

Come detto, una immagine a colori di 3000×2000 pixel occuperebbe, non compressa, 18 megabyte. Tuttavia contiene un enorme numero di informazioni ridondanti (ad es. tanti pixel dello stesso colore). I computer possono facilmente individuare tali informazioni e trasformarle in un formato più compatto.

Esistono due grandi famiglie di compressione: lossless e lossy. E’ essenziale capire la differenza. “Lossless” si può tradurre come “senza perdita di informazione”, “Lossy”, di contro, è “con perdita di informazione”. In altri termini, se comprimo con un algoritmo lossless, l’immagine decompressa sarà identica a quella originale. Un algoritmo lossy comprime (in genere) di più, perché scarta informazioni che in genere non vengono notate dall’occhio umano. Tuttavia l’immagine decompressa sarà diversa (e con una qualità inferiore) di quella originale. Tipico esempio di algoritmo lossy è il jpeg (attenzione, sto parlando di algoritmo, non di formato immagine).

Gli algoritmi lossy sono utilissimi per le fotografie, ma sono disastrosi per i documenti, i grafici, e tutto ciò che ha  grandi aree omogenee (il bianco dello sfondo) e tanti piccoli particolari importanti (i caratteri). In tali casi, è meglio scegliere un algoritmo lossless.

C’è anche da aggiungere che se si vuole modificare a più riprese una foto, conviene usare come file di lavoro un formato lossless, altrimenti ad ogni salvataggio si perdono informazioni, e si finisce con un guazzabuglio impressionista.

E’ anche essenziale sapere che gli algoritmi lossy permettono in genere di specificare la qualità a cui salvare, ovvero quante informazioni scartare (anzi, non scartare). E’ il caso del jpeg (di fatto l’algoritmo lossy universalmente usato), che permette di scegliere (se il programma ce lo permette e non ce lo nasconde) un numero da 0 a 100 che indica la qualità. Maggiore la qualità, maggiore lo spazio su disco. Meno di 60 è da evitare, più di 90 si hanno file molto grandi.

Per dovere di cronaca (poiché su qualche programma vi capiterà di vederlo tra le scelte), l’algoritmo lossless più usato è il LZW, che è lo stesso dei file zip.

Formati file

Di fatto, gli algoritmi sono una cosa che l’utente non vede mai. Ciò con cui ha a che fare sono i formati dei file, cioè pdf, tif, jpg, gif, png, bmp, …

Il più blasonato (ed a ragione, ma ne parleremo dopo) è il pdf, inventato da Acrobat su basi e per fini totalmente diversi. Per ora basti dire che non è un formato immagine.

Iniziamo invece dai formati più semplici, ed il più semplice di tutti è il bmp. E’ stato creato da Microsoft, ed originariamente serviva per le immagini in bianco e nero (che se avete letto sopra, non sono in scala di grigio). Per ogni pixel memorizzava solo uno zero o un uno, e come sappiamo le immagini sono una griglia: da qui il nome di bitmap (mappa di bit, cioè di 0 ed 1). La versione a colori memorizza tre byte per ogni pixel, ma sempre in un formato griglia non compresso. Perciò, la nostra immagine di 3000×2000 pixel, salvata in bmp occupa davvero 18 megabyte. E se la aprite in formato binario, vedrete che davvero contiene tre byte per ogni pixel, uno dopo l’altro.

L’altro formato più famoso è il jpg, che è la versione più semplice per contenere immagini compresse con l’algoritmo jpeg. Ovvero: tutti i file jpg contengono immagini compresse con jpeg, l’algoritmo lossy più famoso, di cui abbiamo discusso sopra. Sappiamo già che essendo lossy scarta delle informazioni, e che perciò va bene per scambiarsi fotografie ma non per salvare documenti e grafici.

Il gif è un formato curioso, utile per il web, ma su cui non ci soffermeremo perché nel frattempo è stato creato di meglio.

Mi riferisco al formato png, che in genere usa una (buona) compressione lossless, e che è perciò ottimo per salvare documenti e grafici. E’ in genere poco preso in considerazione per le scansioni per due motivi: è nato per il web, e non può contenere più di una pagina per file (ma questo è vero anche per il jpg). Il primo motivo è invece in genere legato al discorso che si faceva sulla risoluzione: le immagini sul web vengono usate “assolute” (500 pixel di immagine corrispondono esattamente a 500 pixel sullo schermo, indipendentemente se è un tablet o un videoproiettore) e perciò non c’è l’informazione sulla risoluzione. Tuttavia png permette di salvare la risoluzione, e perciò unisce il meglio di due mondi, essendo anche lossless.

Veniamo ora ai due formati più famosi, tif e pdf, che in realtà possono essere tutto e nulla.

Tif è un contenitore di immagini. In genere, ogni file contiene una sola immagine. Tuttavia è possibile inserirne più d’una in un singolo file (cosa impossibile per jpg, bmp, gif, png, …), anche con formati/compressioni diversi (ed anche con risoluzioni e dimensioni diverse). Questo è stato in passato ampiamente usato per memorizzare i fax, tuttavia poiché i visualizzatori di file tif hanno vari problemi, ormai lo standard è diventato il pdf. E’ però importante sapere che quando si salva una immagine nel formato tif, di fatto non si sta ancora scegliendo il formato di compressione. I programmi più seri infatti chiedono in che formato comprimere, a scelta tra vari (ad es. bmp, cioè non compresso; jpeg, specificando la qualità; lzw, ovvero zip; etc.). I programmi meno seri decidono come gli pare, in genere optando per jpeg, che come abbiamo visto non è la scelta migliore per i documenti. Per questo motivo, nonostante il formato tif con la compressione lzw sia uno tra i migliori formati esistenti, in genere è difficile riuscire ad usarlo. Meglio optare per png.

Il pdf è un formato nato per contenere del testo impaginato, ed è ancora ampiamente usato in questa funzione originale. La differenza con una immagine scansionata è palese: invece di essere una griglia di pixel, contiene i singoli caratteri, la descrizione del font da usare e quanto deve essere grande, esattamente come fa Word. Ben presto tuttavia fu necessario dover inserire delle immagini nei documenti, e quindi fu inventato il modo di incorporare nel file pdf dei “sottofile” di immagini (specificando il punto nella pagina in cui andavano messe). Per questo motivo, di fatto i pdf possono contenere qualsiasi tipo di immagine con qualsiasi compressione. “Salvare in pdf” è quindi un concetto senza senso per una immagine, in quanto, come per tif, occorre prima decidere il formato di compressione. Il problema è che i programmi “Fai tu” scelgono per noi, e come per il tif, spesso decidono di comprimere le immagini in jpeg, e magari visto che ci stanno ridurre la risoluzione a 100dpi, con risultati piuttosto deludenti. Da quanto detto è poi chiaro cosa accade quando si “salva in pdf” una scansione: di fatto vengono create N pagine, ciascuna contenente solo una singola grande immagine. E’ come creare un documento word ed invece di scriverci dentro del testo, incollarci un’immagine su ogni pagina. Tuttavia è innegabile l’utilità di avere un singolo file che riproduce l’intero documento, e che è leggibile da chiunque.

Ricapitolando

Dopo questa carrellata di teoria, cosa possiamo portare a casa di utile? Innanzitutto, che occorre scegliere la risoluzione a cui scansionare, e che in genere 150/200dpi vanno bene, e se il documento non contiene colori, possiamo scansionarlo in scala di grigio. Purché però si salvi in un formato lossless, e perciò evitare jpeg, e diffidare da tif e pdf, a meno che il programma non permetta di scegliere il formato (in tal caso scegliere lzw/zip).

Altrimenti una buona alternativa è salvare in png (specificando di comprimerlo, sennò tanto vale il bmp), cosa che però creerà un file per ogni pagina, e che renderà complesso aprire (e soprattutto ristampare) i file poiché i visualizzatori spesso non tengono in considerazione la risoluzione originale.

Nessuno però ci vieta, dai file png, di creare un pdf con un qualche buon programma (è pieno di buoni programmi open source – diffidate sempre dai freeware!) che ci permetta di specificare anche la compressione da usare dentro al pdf. Consiglio comunque di non cancellare mai i png originali.

Ultimo caveat riguarda il ridimensionamento delle immagini. Se avete scansionato a 600dpi e vi rendete conto che le immagini occupano inutilmente tanto spazio su disco, le potete ridimensionare (con uno dei tanti programmi open source). Ricordatevi però la storia della risoluzione! Ad es, l’immagine scansionata a 600dpi vi occuperà 7016 x 4960 pixel, se la dimezzate (3508 x 2480) ma non impostate la risoluzione a 300dpi, quando la andrete a stampare vi verrà un A6!

Spero di esservi stato utile, per qualsiasi dubbio lasciate un commento!