Lost in (Google) Translation

“Mia kuzo kaj mia amiko aĉetas jupojn”

Eble ili estas el skotujo, mi ne volas juĝas ilin. La reala problemo estis uzi Google tradukisto de la hispana al Esperanto, kaj sen scias tra la angla. 

Kiel la Google tradukisto funkcias? (Laŭ la Google-Blogo verkita de Peter Norvig, direktoro de esplorado).

Por pli bone kompreni la uzatajn metodojn hodiaŭ, ni faru paŝon malantaŭen kaj iru laŭ la vojo, kiu venigis nin ĉi tien. La programistoj de la malnovaj sistemoj provis instrui al la sistemo regulojn pri gramatiko kaj vortprovizo, kiel: “Ĉi tio estas substantivo, ĉi tio estas verbo, kaj tiel ili devas kune iri en ĉi tiuj du lingvoj.” Tamen la lingvo estas tiel flua kaj ampleksa, ke la programistoj ne povis trakti la milionojn da vortoj kaj la trilionoj da kombinaĵoj, kiuj povas okazi inter ili, kaj kiel ili ŝanĝiĝas laŭ la tempo …

Por ĉio ĉi, la nova aliro estas datuma. La unua defio estis havi sufiĉe da ekzemploj por kovri tiom da reguloj kaj esceptoj por ĉiu lingvo, sed kie vi ricevas tiom da specimenoj? Tiam ni faris la sekvan paŝon kaj programis niajn komputilojn por serĉi en la retejo milionojn da ekzemploj de real-mondaj tradukoj, kaj analizi ĉiujn tiujn datumojn por trovi ŝablonojn pri kiel tutaj frazoj estas tradukitaj en aliajn frazojn. Ni uzis maŝinlernadon por serĉi ripetajn ŝablonojn, ŝablonojn kiel: “ĉi tiu frazo en la angla ŝajnas traduki ĉi tiun alian frazon en la hispanan, sed nur se ĝi estas proksima al ĉi tiu alia vorto.” Alivorte, la traduko ne limiĝas al ĉiu el la vortoj en frazo, sed al la tuto, konsiderante la kuntekston.

“A bird in the hand is worth two in the bush”

Birdo en la mano estas pli valora du en la arbusto

Populara diraĵo en la angla estas tradukita kiel alia en la hispana kun malsamaj vortoj sed la sama senco.

“Más vale pájaro en mano que cien volando”

Pli bona birdo en la mano ol cent flugado

Sed ni revenu al la Skotujo…

“Mi prima y mi amiga compran faldas”. Simpla frazo en la hispana lingvo

“Mia kuzino kaj mia amikino aĉetas jupojn” Simpla frazo en la internacia lingvo (Esperanto).

Kio mesis? 

Ne estis du lingvoj en la traduko sed tri, inter la hispana kaj Esperanto estis la angla, nevidebla.

Mi prima (virino) -> My cousin (neŭtrala sekso) -> Mia kuzo (eraro)

Mi amiga (virino) -> My friend (neŭtrala sekso) -> Mia amiko (eraro)

Alia ekzemplo:

Él comió el sándwich de él. -> Li manĝis lian sandviĉon. (ĝuste)

Él comió el sándwich de él -> He ate his sandwich -> Li manĝis sian sandviĉon.

Mirinda refleksiva pronomo en Esperanto, en la hispana estis necesa pli vorto per klarigi la ideon. 

Kaj alia ekzemplo:

Esta máquina puede empacar hasta diez kilogramos. -> Ĉi tiu maŝino povas paki ĝis dek kilogramojn. ĜUSTE

Esta máquina puede enlatar hasta diez kilogramos. -> Ĉi tiu maŝino povas ĝis dek kilogramoj. MALĜUSTE

En la dua frazo mankas unu vorto, povus esti LADSKATOLI (mi ne certas). En la angla ni havas:

This machine CAN CAN up to 10 kg.

eble la duplikata vorto CAN konfuzi la algoritmon kaj forigi unu.

Nun, mia opinio:

La ideo de tiu algoritmo estas absolute mirinda, sed la problemo estas la angla, kiu ne estas la plibona lingvo por esti kiel ponto inter pluraj lingvoj.

Mi pensas ke la dominio de la angla lingvo sur la komputila teĥnologio prokrasti dek jaroj la disvolviĝo de la naturlingva programado kaj voĉaj sintetiziloj.

3 Comments

  1. Ja estas rekta traduko inter kelkaj lingvo-paroj, kiel la hispana kaj la kataluna, aŭ la japana kaj la korea. Parte temas pri tio, ke estas pli da datenoj inter iuj lingvo-paroj- kiom ekzistas inter ekzemple la islanda kaj la zulua? Cetere, “amiko” ja povas temi ankaŭ pri virino kvankam “kuzo” ne.

Leave a Comment

Retpoŝtadreso ne estos publikigita. Devigaj kampoj estas markitaj *