El IEC concluye el Corpus Textual, una inmensa base de 52 millones de palabras
Han sido necesarios 13 a?os y 900 millones de pesetas para realizar una de las obras m¨¢s fara¨®nicas emprendidas por la ling¨¹¨ªstica europea: una base de datos que recoja todas las palabras existentes y que han existido en la lengua catalana. La finalizaci¨®n del Corpus Textual Informatitzat de la Llengua Catalana, para el que el IEC ha empleado a dos centenares de personas al mando de Joaquim Rafel, tambi¨¦n significa el punto de partida de la segunda parte del proyecto: la elaboraci¨®n del Diccionari del catal¨¤ contemporani.
El Corpus, como lo conocen en el IEC, es una inmensa base de datos construida a partir del vaciado de 3.300 textos catalanes, tanto literarios como de cualquier otro tipo: tratados cient¨ªficos, disposiciones administrativas, peri¨®dicos, correspondencia, ensayos filos¨®ficos e incluso ejemplares del Diari Oficial de la Generalitat. En total, 52.250.000 unidades ling¨¹¨ªsticas, o tambi¨¦n 148.000 palabras distintas combinadas en infinidad de frases y p¨¢rrafos. Los textos seleccionados fueron publicados entre 1833 (a?o de aparici¨®n de la oda La p¨¤tria, de Aribau) y 1988. Es decir, desde la recuperaci¨®n del catal¨¢n como lengua de cultura, tras el largo periodo de decadencia, hasta la actualidad. Algo comparable al magno Diccionari etimol¨°gic de Joan Coromines, pero con cables y pantallas en vez de chirucas y papel. "En realidad, como tarea profesional no tiene mucho que ver", se?ala Joaquim Rafel, catedr¨¢tico de Filolog¨ªa Catalana de la Universidad de Barcelona y director del Corpus, "porque el trabajo de Coromines depend¨ªa mucho de factores ajenos a la lexicograf¨ªa. Los avances tecnol¨®gicos permiten un estudio menos intuitivo y m¨¢s objetivo, y ah¨ª est¨¢ el gran valor del Corpus: superar las limitaciones de las antiguas t¨¦cnicas de confecci¨®n de diccionarios, que perpetuaban los errores de los precedentes ya que sol¨ªan basarse en ellos". Tanto por sus caracter¨ªsticas como por el soporte (exclusivamente electr¨®nico, sin versi¨®n en papel), el Corpus Textual es un instrumento de trabajo sobre todo para estudiosos y universidades, que pueden consultarlo a trav¨¦s de la red del propio IEC o bien por Internet con cualquier navegador convencional. Para Rafel, "es obvio que los m¨¢s interesados ser¨¢n los departamentos de catal¨¢n de todas las c¨¢tedras del mundo, aunque a nadie se le impedir¨¢ el acceso. A cualquier persona que solicite una clave a la Secci¨®n Filol¨®gica se le dar¨¢ acceso a toda la informaci¨®n". El Corpus, que por sus dimensiones s¨®lo tiene, seg¨²n Rafel, un equivalente en toda Europa (realizado en Francia), se ha llevado a cabo en tres fases: de 1985 a 1988, definici¨®n y puesta en marcha del proyecto con presupuesto exclusivamente a cargo del IEC; del 88 al 91, convenio con el Ministerio de Universidades e Investigaci¨®n, que permiti¨® la informatizaci¨®n total y la contrataci¨®n de los primeros 60 becarios, procedentes de la Universidad de Barcelona y de la Aut¨®noma, y del 94 al 97, un segundo convenio, esta vez con el Ministerio de Educaci¨®n y Cultura, m¨¢s la Generalitat, con el cual se ha concluido la obra. Manuel Castellet, presidente del IEC, anunci¨® ayer, en el acto de presentaci¨®n del trabajo, que ya est¨¢ a punto de firma un tercer convenio con ambas instituciones para llevar adelante la redacci¨®n del citado Diccionari del catal¨¤ contemporani. Este diccionario, de car¨¢cter descriptivo (no fija normas sino, que describe la realidad ling¨¹¨ªstica), est¨¢ previsto para el 2004. En el horizonte, la Secci¨®n Filol¨®gica ya entrev¨¦ la sombra de la definitiva culminaci¨®n de todos estos trabajos, que no es otra que un diccionario normativo que podr¨ªa poner fin a las c¨ªclicas pol¨¦micas sobre la autoridad del IEC en este campo. Joaquim Rafel aventura la fecha del a?o 2010 y asegura que, "en cualquier caso, ser¨¢ un diccionario de nueva planta, sin nada que ver con el de Fabra ni con ning¨²n otro".
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.