La ling¨¹¨ªstica computacional, el campo donde se unen las ciencias y las letras
Cuando imaginamos laboratorios donde se desarrollan sistemas de inteligencia artificial pensamos en ingenieros y cient¨ªficos. Pero pocas veces pensamos en los ling¨¹istas, los psic¨®logos o incluso los fil¨®sofos. As¨ª colaboran
La inteligencia artificial esconde a un gran n¨²mero de investigadores que diariamente trabaja por continuar avanzando en este campo y a?adir nuevas funciones y utilidades. Cuando pensamos en IA y Big Data, imaginamos que detr¨¢s de todos estos avances hay ingenieros, matem¨¢ticos, cient¨ªficos, inform¨¢ticos o programadores. Y los hay. Pero, en realidad, tambi¨¦n son necesarios otros profesionales como los ling¨¹istas, los psic¨®logos o incluso los fil¨®sofos.
Estos perfiles, que aparentemente poco tienen que ver entre s¨ª, conforman los equipos multidisciplinares que salen a relucir al profundizar en el d¨ªa a d¨ªa del trabajo y la investigaci¨®n de la inteligencia artificial.
Para crear instrumentos y herramientas inteligentes es imprescindible que puedan comunicarse, y es en este punto donde aparece la figura del ling¨¹ista computacional, clave en la investigaci¨®n de las tecnolog¨ªas del lenguaje. Seg¨²n Wikipedia, la ling¨¹¨ªstica computacional es un campo interdisciplinar que se ocupa del desarrollo de formalismos que describen el funcionamiento del lenguaje natural, tales que puedan ser transformados en programas ejecutables por un ordenador. De este modo, el ling¨¹ista y los ingenieros especialistas deben transformar la informaci¨®n existente, tanto en voz como en texto, a un lenguaje estructurado que la inteligencia artificial pueda entender y procesar, y para el que pueda generar una respuesta. Una funci¨®n en la que no solo son necesarias profesiones eminentemente relacionadas con la ciencia, sino que tambi¨¦n resultan imprescindibles expertos en el lenguaje o el comportamiento.
Realizar la tarea de conversi¨®n de toda esa informaci¨®n no estructurada a datos que se puedan procesar es el gran reto del procesamiento del lenguaje natural, una de las actividades m¨¢s desarrolladas de la IA. Actualmente, el PLN es una de las aplicaciones m¨¢s demandadas por las empresas que necesitan procesar y sacar partido de toda la informaci¨®n que manejan en su d¨ªa a d¨ªa o que almacenan en sus archivos hist¨®ricos. Tareas como la traducci¨®n autom¨¢tica, la detecci¨®n de entidades, la recuperaci¨®n de informaci¨®n, el an¨¢lisis autom¨¢tico del sentimiento, la extracci¨®n de ideas principales de un texto, la detecci¨®n de tendencias o el desarrollo de chatbots son de vital importancia para muchas compa?¨ªas, porque les permiten escuchar y aprender de sus usuarios y su comportamiento.
Es a partir de la detecci¨®n de estas necesidades cuando el ling¨¹ista, junto al resto del equipo, comienza con el proceso de transformaci¨®n. El punto de partida de cualquier proyecto de PLN es el corpus, un conjunto de textos, ordenados o no, que sirven de base para cualquier an¨¢lisis ling¨¹¨ªstico o estad¨ªstico. Una de las principales tareas de los ling¨¹istas es la anotaci¨®n, sistem¨¢tica y exhaustiva, que convierte el conjunto de textos en un corpus anotado. Para ello, el ling¨¹ista debe realizar sobre el texto un etiquetado preciso de cada t¨¦rmino. Es una tarea costosa, pero imprescindible para que la IA pueda comenzar a actuar sobre esa informaci¨®n.
A continuaci¨®n, este corpus se introduce en motores ling¨¹¨ªsticos donde se analiza a nivel morfol¨®gico, sint¨¢ctico y sem¨¢ntico mediante reglas ling¨¹¨ªsticas de distinto nivel. Por ¨²ltimo, en una fase m¨¢s avanzada, se aplican modelos de machine learning que ofrecen como resultado los textos enriquecidos de manera autom¨¢tica con las etiquetas correctas. Estos procedimientos permiten realizar todas esas tareas de PLN que ofrecen multitud de posibilidades a empresas, instituciones o administraci¨®n p¨²blica en funci¨®n de sus necesidades y sus caracter¨ªsticas.
La enorme variedad de clientes permite a los ling¨¹istas embarcarse en proyectos de PLN muy diferentes unos de otros. Desde la creaci¨®n de algoritmos para entrenar a chatbots, que resuelven dudas e incidencias, a la detecci¨®n de neologismos en una lengua, como es el caso del proyecto de localizaci¨®n de anglicismos en el uso del espa?ol en EEUU en redes sociales, llevado a cabo por el Instituto Cervantes de la Universidad de Harvard en colaboraci¨®n con el Instituto de Ingenier¨ªa del Conocimiento (IIC).
Ciencia y letras, a pesar de la concepci¨®n generalizada de que son t¨¦rminos opuestos, avanzan mucho m¨¢s r¨¢pido si trabajan en equipo. La ling¨¹¨ªstica computacional es el campo donde se ejemplifica a la perfecci¨®n esta conjugaci¨®n de perfiles a priori antag¨®nicos. La IA es una tecnolog¨ªa imparable, que se reinventa constantemente y que trae consigo grandes avances en todos los campos. Una de las claves de este ¨¦xito es que combina equipos multidisciplinares en el que todas las ramas suman y se complementan.
Carmen Torrijos es ling¨¹ista Computacional en el IIC.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.