Zientzia alorreko lehen corpusa osatu dute EHUk eta Elhuyarrek
Zientzia eta teknologiaren alorreko euskara ikertzeko tresna ahal-tsua abian jarri dute Elhuyar Fundazioak eta EHUko Ixa Taldeak, jakintzaren esparru horretako lehen corpus berezi edo espezializatua hain zuzen ere. Tresna berriak 1990tik 2002ra bitartean argitaratutako obretako testuak ditu oinarri, eta Interneten kontsultagai dago www.ztcorpusa.net helbidearen bidez iragan asteko ostegunaz geroztik, egun horretan aurkeztu baitzuten ofizialki fundazioak Usurbilen duen egoitzan.
Corpusa zortzi milioi hitzez osatuta dago, horietatik 1,6 eskuz berrikusi, desanbiguatu eta zuzenduak. Datu basea etiketatuta dago, bai testuaren egiturari eta formatuari dagokionez, bai linguistikoki, eta testuko hitz bakoitzaren lema eta kategoria etiketatu dituzte proiektua garatu duten teknikariek.
Erabiltzaileek era askotako bilaketa bakunak eta konplexuak egiteko aukera dute, hala nola lemaren, testu-formaren, kategoriaren, eremuaren eta generoaren arabera.
Emaitzak bi eratakoak dira, batetik, kontsultagaiaren testuinguruak, bai laburrak eta bai hedatuak. Bestetik, egindako gaiari buruzko informazio kuantitatiboa eskaintzan du interfazeak, taula eta grafikoen bidez, adibidez, lemen eta formen agerraldien maiztasuna, horien aurretik edo ondoren agertzen diren lemen eta formen maiztasunak eta eremu edo generoaren araberako banaketa.
Internautek bildutako informazio guztia kontsulta dezakete aipatutako webgunearen bidez. Horrez gain, ikerkuntzarako hi-tzarmen bidezko dohaintza aurreikusi dute Ehuyarrek eta EHUk. Hortaz, ikerkuntzan ari diren erakunde edo ikertzaile-taldeek doan eskura dezakete. Horrez gain, ustiapen komertziala (hiztegigintza eta hizkuntza-teknologietako aplikazioak, beste aukera batzuen artean) lizentzia bidez egin daiteke..
Fidagarritasuna
Horri lotuta, bildutako informazioaren fidagarritasuna nabarmendu dute proiektuaren arduradunek. "Corpusean biltzen diren datuak errealak dira. Norbaitek erabaki bat hartu behar badu, adibidez nola erabili den orain arte hitz jakin bat zientziaren eta teknologiaren esparruan, orain arte ez zuen lanabesa izango du aurrerantzean", azaldu du Elhuyarreko teknikari Antton Gurrutxagak.
Mota honetako corpus berezien bidez, erabilera-eremu espezifiko baten edo aldaera jakin baten ezaugarriak hobeto azter-tzeko aukera dago. Corpuseko datuak aztertuz, hizkuntzaren aztertzaileek ondorioak atera ditzakete eta proposamenak egin ere bai, dagokion alorreko adituek erabili beharreko hizkuntza-ereduari buruzko argibideak izan ditzaten, baita erakunde arau-emaileek espezialitate-alorreko ebazpenak eman ahal izan ditzaten ere, egitasmoaren bultzatzaileen arabera.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.