Teknologia albisteak
3

Azterketa estatistiko baten arabera, euskara munduko hizkuntza arrunt eta korrienteenetakoa da

Erabiltzailearen aurpegia
Sustatu
2013-07-08 : 10:54
Silicon Valleyko datu-zientzialari batzuek azterketa estatistikoa egin dute munduko ehundaka hizkuntza konparatuz, eta bitxitasunaren arabera sailkatu dituzte; hizkuntza arraroenak zerrendaren goialdean eta arruntenak behean. Emaitzetan, akaso batzuentzat sorpresa dena agertzen da: euskara munduko hizkuntza arrunt eta korrienteenetakoa da. 239 hizkuntzako sailkapenean, 230.a da euskara (!!). Aldiz, gure erdarak, gaztelania eta frantsesa, hizkuntza arraroenetakoak dira, eta baita ingelesa ere.
Azterketa Idibon enpresak egin du, eta emaitzen azalpen originala ingelesez hemen daukazue. Baina metodoa eta emaitzak apur bat azaltzeak merezi du, eta saiatuko gara.

Azken urteotan osatzen joan den atlas linguistiko estatistiko bat erabili dute, WALS delakoa. Munduko hizkuntzen datubase bat da, azterketa honetatik kanpokoa, hizkuntzen ezaugarri estatistiko eta filogenetikoak biltzen dituena. (Euskara WALS horretan nola ageri den ere bitxia egin zaigu, bide batez, hizkuntza-familia baten gisara...). Dozenaka ezaugarri linguistiko aztertzen ditu WALSek, munduko hizkuntzen artean. Adibidez, 83A ezaugarria, aditz eta objektu zuzenaren arteko ordena.

Faktore hori eta beste batzuk, 21 guztira, aztertu ditu Idibon-ek, hizkuntzen *weirdness* (arrarotasun) fatkorea neurtzeko. Esate baterako, esku/beso dikotomia, 129A faktorea, adibidez, ea eskua eta besoa adierazteko berba bi ala bat erabiltzen diren hizkuntzetan. Hizkuntza gehiagok (389) dute bi hitz bat bakarra baino (228 hizkuntza). Euskara, bi hitzeko talde nagusian dago; beraz, beste hizkuntzek irabazten dute puntuazio arrarotasun eskalan. Faktore honen ponderazioa, hala ere, txikia da, berba bateko eta biko taldeen artean aldea ez baita hain handia.

Hau da aztertutako faktoreen zerrenda:

Emaitza guztiekin, kalkulu-orri bat egin dute (beraz, faktore matematikoak ere aurkituko dituzue bertan, interesa baduzue). Sailkapen orokorrean 239 hizkuntza zerrendatu dituzten arren, kalkulu-orrian askoz gehiago ageri dira, baina sailkapen orokorretik kanpo geratu dira gehienak, ez daudelako dokumentatuak ezaugarri gehienetan. 21 ezaugarri zehatzak ondoen aztertuta dituzten hizkuntzen artean da, beraz, sailkapena.

Eta, horra, ba, emaitza. Munduko hizkuntza arraroena Mexikoko mintzaira indigena bat da,  Chalcatongoko Mixteka, 0.972-eko arrarotasun faktore batekin. Arruntena, berriz, hindiera (Indiako hizkuntza hedatuena), 0.087. Euskara, hindieratik gertu, 0.189eko arrarotasunarekin. Gure gertuko erdarak, gaztelania eta frantsesa, biak weird samarrak, 0,789 eta 0,754eko faktoreekin.



Azkenean, arrarotasunaren banaketa geografikoa (ikus itsatsitako mapa), soziolinguistikoa eta filogenetikoa, oso zabala da. Hizkuntza gutxitu zein oso hedatuak aurki daitezke arraroenen artean, edo arruntenen artean. Mexikoko beste hizkuntza indigena bat, Purepecha, da munduko 2. arruntena, Mixtekarekin kontraste eginez. Hindiera eta gaztelania, biak milioika hiztuneko hizkuntzak dira, indoeuroparrak, baina bata ezaugarri komunez betea dago, eta bestea (espainola), ez. Hindieraren doinua euskaraz dastatu nahi baduzue, Azpitituluak.com webgunean badaude hindierazko film pare batentzako azpidatziak euskaraz: Dhobi Ghat eta Zindagi Na Milegi Dobara. Azken honetan Euskal Herria ere agertzen da, Sanferminak zehazki, horra irudi bat:



Idibon enpresak beste azterketa linguistiko/estatistiko batzuk ere egin ditu, eta datuen erabilpen eta bisualizazioan berezitua dago Kalifornian. Lantalde interesgarri bat dauka, eta aholkularien artean Louis Monier dago adibidez, Altavista bilatzailearen sortzailea (hemengo zaharrenek gogoratuko duzue). Azterketa hau gidatu duena Tyler Schnoebelen da eta Twitterren aurkituko duzue: (@TSchnoebelen)



Erantzunak

2013-07-08 : 11:52

Bitxiak erabat datuak. Ikerketak egiterakoan zeintzu datu ikertzen diren, emaitzak halakoak direla erakusten dute emaitza hauek. Inkestekin ere gauza bera gertatzen da, ezer ez da egia borobila, galdera nola egiten dugun, zein datu ikertzen ditugun, nolako edo halako emaitza lortuko dugu...

2013-07-08 : 15:07

Hizkuntzen "arrarotasuna" neurtu nahi duen beste ikerketa bat. Ariketa polita, baina, nire iritziz, bi arazo ditu gutxienez:

(1) oso ezaugarri gutxi erabili dituzte (21 ezaugarri 165tik), eta, larriagoa dena,

(2) ezaugarri guztiei balio berbera eman diete, hizkuntzen izaeran batzuek eta besteek duten pisua kontuan hartu gabe. Ezin da berdin balioetsi, nik uste, OV ala VO hurrenkera izatea eta "esku" eta "beso" adierazteko hitz bakarra al bi izatea, kasu.

2013-07-10 : 09:25

Ricardo Gomezek bere blogean ere iruzkindu du kontu hau, eta erantzunetan azterketaren egilea azaldu da, Tyler Schnoebelen, puntu batzuk argitzeko. Bereziki, Schnoebelenek dio 21 ezaugarri hautatuak ez dituztela ausa hutsez aukeratu, elkarren artean desberdinak direlako baizik. WALSeko beste ezaugarri batzuk elkarrekin lotuago daude, eta bat aukeratuz, besteetan ere joera bera errepika zitekeen arrarotasunaren edo komuntasunaren alde, eta horrek estatistika gehiago hondatuko luke.

http://filoblogia.blogariak.net/2013/07/azterketa-estatistiko-baten-arabera-euskara-munduko-hizkuntza-arrunt-eta-korrienteenetakoa-da-sustatu-interneteko-albistegia/comment-page-1/

Dena den, Ricardok eszeptiko jarraitzen du, hurrengo erantzunean azaldu duenez. Beste blog batean ere Mark Liberman hizkuntzalaria ere ez dago oso komentzitua azterketaren balio estatistikoarekin:

http://languagelog.ldc.upenn.edu/nll/?p=5006

Buberren orrian ere agertu da aipua: http://buber.net/Basque/?p=938

Erantzun

Sartu