Apocalipsi de l¡¯escaneig
Sempre he volgut enganyar les intel¡¤lig¨¨ncies artificials i per aix¨° he estat rumiant com ho faria per obligar la intervenci¨® humana en un proc¨¦s de digitalitzaci¨®
Amb la intenci¨® d¡¯evitar perdre informaci¨® per la degradaci¨® del paper i per estalviar espai, la humanitat ha estat digitalitzant el seu saber, acumulat durant segles en la tecnologia del llibre, de manera que qualsevol obra impresa est¨¤ essent arxivada i conservada en el n¨²vol, i esdev¨¦ m¨¦s accessible i analitzable, i ¨¦s editable i transformable a diversos formats (fins i tot ¨¤udio), i podem compatibilitzar-la amb les eines de la nostra vida d¡¯Homo digitalis.
Per¨° la tasca d¡¯escanejar les produccions escrites ha topat amb algunes dificultats, com la impossibilitat de les computadores per identificar determinats car¨¤cters, no nom¨¦s de llibres antics sin¨® tamb¨¦ d¡¯edicions posteriors a 1850. Durant una llarga temporada, els usuaris d¡¯internet vam fer-los la feina bruta, resolent la comprovaci¨® de car¨¤cters torts i rebregats gr¨¤cies als captchas on ens afirm¨¤vem com a ¡°no-robots¡±.
Malgrat tot, les lletres d¡¯impremta sempre han tingut aquella bellesa imperfecta, per osques o deformacions dels tipus m¨°bils, per taques, enfosquiments... Aix¨° fa que els motors de reconeixement ¨°ptic de car¨¤cters (coneguts com OCR), que substitueixen aquest tipus d¡¯errors, encara tinguin escletxes per on s¡¯esmuny la perfecta transcripci¨® digital. Hi ha una vida que afecta les condicions de la font: la qualitat i color del paper, la resoluci¨® de la imatge, les mides, l¡¯espaiat, les lligadures... I hi ha errades en ajuntar o separar lletres que s¨®n molt semblants, com n i ri. En aquests casos, el cervellet de l¡¯aparell, si ¨¦s capa? de detectar una possible substituci¨®, resol el problema cercant en diccionaris un mot que li quadri, de manera que entre canari i cariari, opta pel primer.
Tot i aix¨°, en alguns casos cal un rep¨¤s de l¡¯ull hum¨¤ per poder assegurar quin ¨¦s el mot en q¨¹esti¨®, ja sigui perqu¨¨ la paraula no est¨¤ inventariada, ja sigui perqu¨¨ es produeix una ambig¨¹itat. Seguint l¡¯exemple precedent, qu¨¨ passaria si la m¨¤quina dubt¨¦s entre nota i riota?
Sempre he volgut enganyar les intel¡¤lig¨¨ncies artificials (no per complex d¡¯inferioritat ni per misoneisme, sin¨® per trapelleria del meu temps) i per aix¨° he estat rumiant com ho faria per obligar la intervenci¨® humana en un proc¨¦s d¡¯aquests: estamparia el text amb tampons de pl¨¤stic barats, amb un d¨¨ficit o un exc¨¦s de tinta, pensant unes frases on la combinaci¨® de lletres fos part dels errors de substituci¨® m¨¦s freq¨¹ents (l-i, h-li, rn-m, d-cl, etc.) i provocant que les paraules resultants tinguessin sentit en una i altra versi¨® de l¡¯agrupaci¨® (modern-modem). Fins i tot aix¨ª, no estic segur que la m¨¤quina no vei¨¦s com li estic donant gat per llebre: dava tema a toies o clava l¡¯eina a totes?
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.