sabato 22 ottobre 2016

È tutta colpa dell'OCR !

Chiedo scusa ai pochi ma affezionati lettori di questo blog per la vergognosa diluizione delle nuove uscite. Il fatto è che ho ormai pubblicato tutti i brani brevi inediti che ho trovato sul computer di Remo. Restano parecchie centinaia di racconti usciti su Stampa Sera a partire dal 1953, più qualcos'altro su altre testate, ma sono tutti in formato cartaceo.

Mi sono dotato di uno dei più rinomati programmi di OCR (Optical Character Recognition, per estrarre il testo da una scansione) ma, vuoi perché la colla ha fatto increspare i ritagli che Remo aveva raccolto, vuoi perché la carta negli anni è ingiallita, vuoi perché i caratteri sono sbiaditi, i risultati sono deludenti. L'interpretazione del testo risulta così scadente che, in pratica, non c'è nessun vantaggio a correggerla rispetto a ribattere completamente il testo a mano; e questo, ovviamente, richiede parecchio tempo.

Daniele Lugli

Nessun commento:

Posta un commento

Dimmi la tua opinione: