Teknika hitzen mesedetan
Eleka enpresak euskara eta ordenagailuen arteko harremanak errazteko tresna informatikoak sortzen ditu
Euskara hizkuntza zaharra da, baina ez zaharkitua. Ez luke izan behar, behintzat, ordenagailuen aro honetan ere. Egia da konputagailu pertsonalak ezinbesteko baliabide bihurtu direla, etxean nahiz lanean, dokumentazioa bildu eta testuak irakurri eta idazteko. Teknologia berrietan euskaldunek euskara erabiltzen jarrai dezaten, ezinbesteko baldintza da informatikaren arazoei aurre egingo dieten baliabide berriak sortzea. Horrexetan dihardu, duela bi urtez geroztik, Eleka enpresa gipuzkoarrak. Hamar langile ditu, gehienak ingeniari informatikoak edo Euskal Filologian lizentziatutakoak. Guztien artean, infoingeniaritza linguistikoa izeneko alorrean murgildu dira produktu eta zerbitzu berriak abiarazteko, hau da: abangoardiako teknologiaz baliatu dira euskararen mesedetan.
Infoingenieritza linguistikoa teknologia berriez baliatzen da hizkuntzen mesedetan
Programek memorian gordetako terminoak erabiltzen dituzte itzulpena errazteko
Proiektua Ixa ikerkuntza-taldearen eskutik sortu zen, Euskal Herriko Unibertsitateko (EHU) Informatika Fakultatean. Infoingeniaritza linguistikoaren sekretuak arakatu ondoren, ekimenaren bultzaileek Elhuyar Fundazioarengana jo zuten. Eleka enpresa Ixa eta Elhuyarren arteko lankidetzatik sortu zen 2002 urtean, euskararen aldeko baliabide informatiko berriak erakunde eta pertsona guztiengana zabaltzeko asmoz.
"Teknologia linguistikoak munta handiko inbertsioak eskatzen ditu, baina gure enpresaren tamaina ikusita, argi dago gu ez gaudela diru-premia horiei erantzuteko moduan", azaldu dute Elekako proiektu-koordinatzaile eta marketing zuzendari Ibon Aizpuruak eta I?aki Arantzabalek. Proiektuaren mugak kontuan hartuta, "Elekaren helburua unibertsitatea eta gizartearen arteko zubi-lana egitea da, ikerkuntzaren emaitzak hiritar guztiengana irits daitezen", gaineratu dute. Ildo honetan, lankidetza hitzarmenak sinatu dituzte Deustuko Unibertsitateko eta EHUko ikerketa-taldeekin.
Ikerkuntza, garapena eta berrikuntza uztartuz -I+D+I siglez ezagutzen dena-, Elekak euskara eta teknologia berrien arteko harremanak erraztu dituzten hainbat baliabide plazaratu ditu. Ezagunena, Xuxen izeneko zuzentzaile ortografikoa da, sarean erabiltzeko bertsioa -Xuxennet- duena. Ondoren, Elhuyar-Word hiztegia garatu dute. Aplikazio informatiko hau Word 2000 testu-prozesagailuari erants dakioke, eta deklinatutako edozein hitzetatik abiatuz, hitz horri dagozkion itzulpen guztiak ematen ditu, euskaraz nahiz erdaraz. Itzulpenak adiera eta kategoria gramatikal guztiak bilduta agertzen dira, hizkuntza batetik besterako baliokideak barne.
Oso bestelakoa da Xerlok-en betebeharra. Internet osoan edo intranet jakin batean erabil daitekeen zainketa sistema honi esker, bezeroen beharrizanei egokitutako xehetasunak aurki daitezke, ziztu bizian aurkitu ere: argitalpen periodikoetan agertutako erreferentziak, webgune desberdinetan azaldutako informazioak, erabilera eta maiztasunaren araberako xehetasun estatistikoak eta abar. Hitz gakoak sartuz gero, Xerlok-ek sarean diren webguneak arakatu eta informazio-buletin bat osa-tzen du, hitz horiei dagozkien aurkikuntza guztiak bilduz.
Elekako kideak OCR programaren euskarazko egokitzapenean ari dira lanean. Programa horrek prozesa daitezkeen testuak bilakatzen ditu liburu, egunkari, aldizkari eta bestelako agiriak eskaneatuz sortzen diren agiriak.
Itzulpengintzarako lanabesak ere diseinatu dituzte. Horretarako sortu duten programak egindako itzulpen guztiak gordetzen ditu memorian, "itzultzaileari memorizatutako termino edo egitura egokiak proposatzeko", azaldu du Arantzabalek.
Hainbat enpresa, erakunde eta ikastetxe daude Elekaren bezeroen artean. Enpresa honek sortutako erremintek helburu garbia dute: euskaraz lan egiten dutenen jarduera erraztea.
Izaera "aglutinatzailea"
Hizkuntzaren teknologiak euskararen alorrari aplikatzeko garaian sortzen den zailtasunetako bat hizkuntza honen izaera "aglutinatzailea" da. Gaztelania eta ingelesez ez bezala, euskaraz terminoak atzizkiz osatu ohi dira. Horren erakusgarri dira preposizioak, gehienak hitzekin fusionatzen baitira, jatorrizkoaren aldean desberdinak diren terminoak sortuz. Hori arazo gehigarria da programa informatikoarentzat.
"Ohiko zuzentzaile ortografikoentzat nahikoa izaten da 50.000en bat hitz sartzea; euskararen kasuan, aldiz, horietako bakoitzaren flexio guztiak sartu beharko lirateke eta hori eromena izango litzateke", argudiatzen dute Ibon Aizpurua eta I?aki Arantzabalek. Oztopo horretarako konponbidea "lematizazioa" izeneko teknika da. Horren bidez, batetik terminoaren erroan definitzen da eta, bestetik, flexio posibleak. Horrela bilaketa arinagoa eta zehatzagoa lortzen da, zuzentzailean, hiztegietan eta sarean.
Elekak aurkitzen duen beste zailtasun nagusia euskarazko testuen urritasuna da. Gabezia hori are larriagoa da euskalkien kasuan. Horietan arau garbirik ez dagoenez ia-ia euskara batuarekin soilik lan egitea erabaki dute. Halere, erakundeek bizkaiera sustatzeko duten interesa ikusita, programen bertsio espezifikoak sortzeko ari dira lanean.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.