<<< [=]

4 Ekzemploj

4 Beispiele

4.2 Systran / Babelfish

Babelfiŝo

SYSTRAN estas sufiĉe aĝa sistemo; ĝiaj radikoj reiras ĝis fine de la jaroj 1960-aj, kiam la unua versio de la sistemo tradukis Rusajn tekstojn Anglen por la Usona Aer-Armeo. Tiu aĝo ja estas avantaĝo; estis multe da tempo por trovi erarojn kaj enmeti plibonigojn.

SYSTRAN ist ein ziemlich altes System; seine Wurzeln reichen bis Ende der 1960er Jahre zurück, in die Zeit, als die erste Version des Systems russische Texte für die US-Luftwaffe ins Englische übersetzte. Dieses Alter ist durchaus ein Vorzug; es war viel Zeit, Fehler zu finden und Verbesserungen einzubauen.

4.2.1 La lingvo-paroj

4.2.1 Die Sprachenpaare

SYSTRAN estas simetria pri siaj lingvo-paroj; t. e. se ĝi povas traduki de lingvo A al lingvo B, ĝi povas ankaŭ traduki de B al A. Ni rigardu, kiujn lingvo-parojn ĝi (laŭ siaj TTT-informoj) subtenas:

SYSTRAN ist symmetrisch bezüglich seiner Sprachenpaare; d. h. wenn es von Sprache A nach Sprache B übersetzen kann, kann es auch von B nach A übersetzen. Betrachten wir, welche Sprachenpaare es (nach den Informationen im WWW) unterstützt:

de en es fr it ja ko nl po ru zh
de x x
en x x x x x x + + + x
es x +
fr x x + + + +
it x +
ja x
ko x
nl + +
po + +
ru +
zh x

(La paroj markitaj per "x" estas disponeblaj ankaŭ por Babelfiŝo.)

(Die mit "x" markierten Paare sind auch für Babelfisch verfügbar.)

Ni konstatas koncentriĝon je malmultaj lingvoj: En ĉiu paro estas aŭ la Angla aŭ la Franca lingvo, plej ofte la Angla, kiu pariĝas kun ĉiu alia lingvo. Tio estas eco de sistemoj sen pontolingvo; la traduk-matrico por pontolingva sistemo estas komplete plena (se ĝi ne enhavas lingvojn tute ne subtenatajn).

Wir stellen eine Konzentration auf wenige Sprachen fest: Jedes Paar enthät entweder Englisch oder Französisch, meistens Englisch, das mit jeder anderen Sprache gepaart ist. Das ist eine Eigenschaft von Systemen ohne Brückensprache; die Übersetzungsmatrix für ein System mit Brückensprache ist ganz gefüllt (wenn sie keine Sprachen enthält, die überhaupt nicht unterstützt werden).

Por la "persona" programversio SYSTRANet oni anoncas 36 lingvo-parojn, sed la koncentriĝo je kelkaj lingvoj estas simila.

Für die "persönliche" Programmversion SYSTRANet werden 36 Sprachenpaare angekündigt, aber die Konzentration auf einige Sprachen ist ähnlich.

4.2.2 Evoluo kaj strukturo

4.2.2 Entwicklung und Struktur

Laŭ Hutchins SYSTRAN evoluis dum longa tempo laŭ la principo, kiu provis teni la modifojn simplaj kaj malgrandaj; tial la sistemo ne posedas tre klaran kaj unuecan strukturon:

Nach Hutchins hat sich SYSTRAN über längere Zeit nach dem Prinzip entwickelt, die Änderungen am System möglichst einfach und klein zu halten; daher besitzt das System keine sehr klare und einheitliche Struktur:

"When the designers want to improve some unsatisfactory feature they look for the simplest manipulation of syntactic or semantic coding, irrespective of the procedures in other parts of the program...

[These examples] illustrate the essentially empirical approach: there is no question of an underlying linguistic theory, no attempt at a consistent methodology; problems are tackled as they arise and improvements are made if proposed solutions seem to work in most cases."

Hutchins, machine translation and machine-aided translation.

"Kiam la planantoj volas plibonigi iun nekontentigan econ, ili serĉas la plej simplan manipuladon de sintaksa aŭ semantika kodaĵo, senkonsidere de la proceduroj en aliaj partoj de la programo...

[Tiuj ĉi ekzemploj] ilustras la esence empirian aliron: ne gravas iu subtena lingvistika teorio, ne estas provo apliki koheran metodaron; problemoj estas traktataj, kiam ili aperas, kaj plibonigoj estas farataj, se porponataj solvoj ŝajnas funkcii en la plej multaj kazoj.

"Wenn die Designer ein unbefriedigendes Verhalten verbessern wollen, suchen sie nach der einfachsten Manipulation syntaktischen oder semantischen Kodes und lassen die Prozeduren in anderen Teilen des Programms außer Acht...

[Diese Beispiele] veranschaulichen den im Wesentlichen empirischen Ansatz: es kommt nicht auf eine zugrundeliegende linguistische Theorie oder auf die Anwendung eines konsistenten Methodensatzes an; Probleme werden behandelt, wie sie auftauchen, und Verbesserungen finden statt, wenn die vorgeschlagenen Lösungen in den meisten Fällen zu funktionieren scheinen.

Tiuj du ecoj, la manko de ponto-lingvo kaj la empiria evoluo, kondukas al ne-unueca konduto de la sistemo en pluraj rilatoj:

  • La sama fonto-lingva teksto estas traktata malsame ĉe traduko al diversaj cellingvoj.
  • Similaj strukturoj de fontolingvo estas traktataj malsama ĉe traduko al la sama cellingvo.

Diese beiden Eigenschaften, das Fehlen einer Brückensprache und die empirische Entwicklung, führen in verschiedener Hinsicht zu einem uneinheitlichen Verhalten des Systems:

  • Derselbe Quelltext wird bei der Übersetzung in verschiedene Zielsprachen unterschiedlich behandelt.
  • Ähnliche oder analoge Strukturen der Quellsprache werden bei der Übersetzung in dieselbe Zielsprache unterschiedlich behandelt.

Ekzemploj

Beispiele

it Il professore insegna tedesco.
eo La profesoro instruas la Germanan.
de Der Professor unterrichtet Deutsch.
fr Le professeur enseigne l'allemand.
en The professor teaches German.

Tiu ĉi ekzemplo, al kiu instigis min artikolo ĉe www.supereva.it, havas en la Itala fontoteksto problemon: la vorto "insegna" estas ambigua kaj povas signifi "instruas" aŭ "insigno, emblemo; principo". Kun la dua signifo la frazo estus gramatike malĝusta, ĉar ĝi ne havus predikaton; restas do la unua signifo, kiun subtenas ankaŭ la semantika parenceco inter "profesoro" kaj "instrui". SYSTRAN tradukas tiun frazon jene al la Angla kaj la Franca:

Dieses Beispiel, angeregt durch einen Artikel bei www.supereva.it, enthält im italienischen Quelltext ein Problem: Das Wort "insegna" ist mehrdeutig und kann einerseits "(er/sie) unterrichtet" bedeuten, andererseits "Abzeichen; Prinzip". Mit der zweiten Bedeutung wäre der Satz grammatikalisch falsch, da er kein Prädikat hätte; es bleibt also nur die erste Bedeutung, die auch durch die semantische Nähe von "Professor" und "unterrichten" gestützt wird. SYSTRAN übersetzt diesen Satz folgendermaßen ins Englische und ins Französische:

it Il professore insegna tedesco.
en The German university professor standard.
fr Le professeur enseigne allemand.

Dum la Franca traduko estas sufiĉe bona, la Itala/Angla sistemo evidente malĝuste solvis la ambiguecon. Ĝi tradukis "insegna" per la substantivo "standard" kaj tial fuŝis la strukturon de la frazo. Ŝajne ĝi rimarkis, ke laŭ la gramatika genro la vortoj "professore" kaj "tedesco" kongruas, sed ignoris la fakton, ke la vort-ordo en la Itala teksto preskaŭ malebligas, ke tiuj du vortoj estu en la sama substantiva sintagmo.

Während die französische Übersetzung ziemlich gut ist, hat das italienisch-englische System offenbar die Mehrdeutigkeit falsch aufgelöst. Es hat "insegna" mit dem Hauptwort "standard" übersetzt und damit die Struktur des Satzes durcheinander gebracht. Offenbar hat es bemerkt, dass die Wörter "professore" und "tedesco" im grammatikalischen Geschlecht übereinstimmen, aber die Tatsache übersehen, dass die Wortstellung im Italienischen beinahe ausschließt, dass diese beiden Wörter zum selben Substantiv-Ausdruck gehören.

Tiu ekzemplo demonstras la empirie evoluintan strukturon de la sistemo. La gramatika analizo de la Itala frazo ne dependas de la cellingvo; sed la sub-sistemo Itala-Angla ne povas profiti de la analiza kapablo de la sub-sistemo Itala-Franca. En ponto-lingva sistemo la analizo estus tute sendependa de la cellingvo; sed ankaŭ en miksa transiga-analiza sistemo oni povus uzi komunajn modjulojn. SYSTRAN tie ĉi evidente ne faras tion. Eble la pure romida lingvoparo Itala-Franca uzas pli da transigo ol paroj el malpli similaj lingvoj.

Dieses Beispiel demonstriert die empirisch gewachsene Struktur des Systems. Die grammatikalische Analyse des italienischen Satzes hängt nicht von der Zielsprache ab; aber das Subsystem Italienisch-Englisch kann trotzdem nicht die analytischen Fähigkeiten des Subsystems Italienisch-Französisch nutzen. In einem System mit Brückensprache wäre die Analyse völlig unabhängig von der Zielsprache; aber auch in einem gemischten Transfer-Analyse-System könnte man gemeinsame Module benutzen. SYSTRAN tut das hier offenbar nicht. Möglich ist, dass das Modul für das romanische Sprachenpaar Italienisch-Französisch mehr Transfer benutzt als Paare mit unterschiedlicheren Sprachen.

Ekzemplo pri la Babelfiŝo

Ein Beispiel zum Babelfisch

La retpaĝejo infotektur.com ofertas interesan ekzemplon de tute artikolo tradukita diverslingven per Babelfiŝo. La artikolo temas pri la Babelfiŝo mem, kaj la traduko estas prezentata "por demonstri ĝian temon" [to demonstrate its subject matter].

La originala artikolo estas en la Angla lingvo, do la traduko bone prezentas la malfacilaĵojn pro la ambiguecoj, kiuj ekestas pro la malriĉa fleksio de tiu lingvo. Mi prezentas la unuan alineojn de la artikolo en la Itala kaj la Germana versioj kaj markas la tekstpartojn per koloroj, kiuj indikas la kompreneblecon:

  • blanka koloro indikas, ke la traduko estas tre bona aŭ almenaŭ akceptebla.
  • blua koloro indikas, ke la traduko estas gramatike malĝusta, sed komprenebla.
  • flava koloro indikas, ke la teksto ne estis tradukita; restis la originala esprimo.
  • ruĝa koloro indikas, ke la traduko estas absolute fuŝa kaj nekomprenebla.

In den WWW-Seiten von infotektur.com steht das Beispiel eines ganzen Artikels, der mit Babelfisch in verschiedene Sprachen übersetzt wurde. In dem Artikel geht es um den Babelfisch selbst, und das Ziel der Übersetzungen ist, "sein Thema zu veranschaulichen" [to demonstrate its subject matter].

Der Artikel ist im Original auf Englisch, daher stellt die Übersetzung sehr gut die Schwierigkeiten aufgrund der Mehrdeutigkeiten dar, die durch die Flexions-Armut des Englischen entstehen. Ich gebe hier den ersten Absatz der italienischen und der deutschen Fassung wieder und markiere die Textteile mit Farben, die die Verständlichkeit anzeigen:

  • Weiß zeigt an, dass die Übersetzung gut oder zumindest annehmbar ist.
  • Blau zeigt an, dass die Übersetzung grammatikalisch falsch, aber verständlich ist.
  • Gelb zeigt an, dass der Text nicht übersetzt wurde; es steht der Originaltext.
  • Rot zeigt an, dass die Übersetzung absolut falsch und unverständlich ist.
enitde

Surfing versus fishing

In his ironic fiction thriller, "The Hitchhiker's Guide to the Galaxy", Douglas Adams describes a cyborganic translation device, called a Babel fish, that enables humans to understand and speak any language on earth. You simply stick the device in your ear and -- voila! -- you're multilingual. No more need for flash cards, language labs, or grammar books. Just plug and play the fish.

Ready or not, Adams' fictional earpiece just made its virtual debut on the Internet. Time to stop surfing and start fishing.

Surfing contro la pesca.

Nel suo racconto eccitante ironico della fantascienza, "la guida del Hitchhiker alla galassia," Douglas Adams descrive un dispositivo cyborganic di traduzione, denominato un pesce de Babele, che permette agli esseri umani di capire e parlare tutta la lingua su terra. Attaccate semplicemente il dispositivo in vostro orecchio e -- voila! -- siete multilingue. Nient'altro hanno bisogno di per le schede, i laboratori di lingua, o i libri instatanei di grammatica. La spina giusta e gioca i pesci.

Pronto o non, il ricevitore telefonico del Adams ha fatto appena il relativo debutto virtuale sul Internet. Tempo di smettere di surfing e pesca di inizio.

Surfenen gegen Fischen

In seinem ironischen Zukunftsromanthriller "die Anleitung des Trampers zur Galaxie," Douglas Adams beschreibt eine cyborganic Umsetzungseinheit, genannt einen Babelfisch, der Menschen aktiviert, jede mögliche Sprache auf Masse zu verstehen und zu sprechen. Sie haften einfach die Einheit in Ihrem Ohr und -- voila! -- Sie sind mehrsprachig. Keine mehr Notwendigkeit an den grellen Karten, an den Sprachlabors oder an den Grammatikbüchern. Gerader Stecker und spielen die Fische.

Betriebsbereit oder nicht, Adam bildete fictional Hörmuschel gerade seinen virtuellen Anfang auf dem Internet. Zeit zu surfenen zu stoppen und Anfangsfischen.

Ankaŭ la blanke markita teksto parte estas pro sia stilo malfacile komprenebla. Certe la Babelfiŝo estas pli bona ol nenio, sed oni komprenas, kial la iniciatintoj de UNL opiniis, ke necesas pli bona kvalito.

Auch die weiß markierten Teile sind zum Teil aus stilistischen Gründen schwer zu verstehen. Sicherlich ist der Babelfisch besser als nichts, aber man versteht, warum die Initiatoren von UNL zu der Ansicht gelangten, dass bessere Qualität notwendig ist.

>>>