<<< [=]

3 Principoj de maŝina tradukado

3 Grundlagen der maschinellen Übersetzung

3.1 Ambigueco

3.1 Mehrdeutigkeit

La grandeco kaj komplekseco de la nura vortaro de naturaj lingvoj, kiu ankoraŭ timigis la pionirojn de MT, ne plu estas problemo; tiun problemon solvis la kapacito kaj rapideco de modernaj komputiloj. La vera problemo de MT estas la ambigueco, la fakto, ke unu teksto aŭ tekst-parto en natura lingvo povas havi pli ol unu signifon.

Die Größe und Komplexität des bloßen Wortschatzes der natürlichen Sprachen, die den Pionieren der MÜ noch Sorgen bereitete, ist kein Problem mehr; dieses Problem ist durch die Kapazität und Geschwindigkeit der modernen Rechner gelöst. Das wirkliche Problem der MÜ liegt in der Mehrdeutigkeit, in der Tatsache, dass ein Text oder Textstück in natürlicher Sprache mehr als eine Bedeutung haben kann.

La ekzemplo pri la sistemo de Oettinger, kiun ni vidis, instruas tri faktojn pri ambigueco:

  • Ambigueco ekzistas jam sur la vorta nivelo.
  • Tiu ambigueco forte grandigas la kompleksecon sur la fraza nivelo; en la ekzemplo naŭ ambiguaj vortoj kondukis al 6*6*2*3*3*3*2*2*2 = 15552 signifoj por la frazo.
  • Por homo, kiu bone komprenas la koncernan lingvon, la plej granda parto de tiu ambigueco ne ekzistas; la frazo havas por li unu tute klaran signifon.

Das oben betrachtete Beispiel zum System von Oettinger zeigt drei wichtige Tatsachen über Mehrdeutigkeit:

  • Mehrdeutigkeit existiert bereits auf der Ebene der Wörter.
  • Diese Mehrdeutigkeit erhöht die Komplexität auf der Ebene der Sätze sehr stark: Im Beispiel führen neun mehrdeutige Wörter zu 6*6*2*3*3*3*2*2*2 = 15552 Bedeutungen für den Satz.
  • Für einen Menschen, der die betreffende Sprache gut versteht, existiert der größte Teil dieser Mehrdeutigkeit nicht; der Satz hat für ihn eine völlig klare Bedeutung.

La ambigueco estas tute malsama en diversaj lingvoj. Tial necesas distingi inter ambigueco en la fonto-lingvo kaj la cel-lingvo de tradukado.

Plie ekzistas tekstoj, kiuj estas ambiguaj ne nur por maŝinoj, sed ankaŭ por homoj. Ofte tiu ambigueco estas en la intenco de la parolanto aŭ skribanto, precipe ĉe spritaĵoj aŭ vort-ludoj; sed ekzistas ankaŭ senvola ambigueco. Por distingi tian ambiguecon ni nomu ĝin vera ambigueco, kontraste al la ŝajna ambigueco, kiu ne ekzistas por spertulo pri la lingvo. (Tiuj du terminoj ne estas ĝenerale uzataj; mi enkondukas ilin por tiu ĉi kurso.)

Die Mehrdeutigkeit ist in verschiedenen Sprachen ganz unterschiedlich. Daher müssen wir zwischen Mehrdeutigkeit in der Ausgangssprache und der Zielsprache der Übersetzung unterscheiden.

Außerdem gibt es auch Texte, die nicht nur für Maschinen, sondern auch für Menschen mehrdeutig sind. (Oft ist diese Mehrdeutigkeit vom Sprecher oder Schreiber gewollt, vor allem in Witzen und Wortspielen; es gibt jedoch auch ungewollte Mehrdeutigkeit.) Diese Art von Mehrdeutigkeit wollen wir echte Mehrdeutigkeit nennen, im Unterschied zur scheinbaren Mehrdeutigkeit, die für den guten Kenner der Sprache nicht existiert. (Diese beiden Ausdrücke sind nicht allgemein in Gebrauch; ich führe sie für diesen Kurs ein.)

Tiel ni havas kvar specojn de ambigueco en tradukado:

Damit kommen bei der Übersetzung vier Arten von Mehrdeutigkeit vor:

fontolingvo cellingvo
ŝajna ambigueco grava obstaklo en MT malpli grava obstaklo en MT
vera ambigueco ofte ignorata en MT ofte ignorata en MT
Ausgangssprache Zielsprache
scheinbare Mehrdeutigkeit schweres Hindernis in der MÜ weniger schweres Hindernis in der MÜ
echte Mehrdeutigkeit in der MÜ meist ignoriert in der MÜ meist ignoriert

Ŝajna ambigueco en la fontolingvo estas la plej grava problemo de MT, ĉar ĝi malhelpas trovi la signifon de la tradukata teksto. Ŝajna ambigueco en la cellingvo estas malpli grava; oni povas limigi ĝin per elekto de malpli ambiguaj vortoj kaj strukturoj, kaj oni fidas je la kapablo de la leganto elimini la ambiguecon.

Scheinbare Mehrdeutigkeit in der Ausgangssprache ist das größte Problem der MÜ, denn sie behindert das Herausfinden der Bedeutung des zu übersetzenden Textes. Scheinbare Mehrdeutigkeit in der Zielsprache ist weniger wichtig; sie lässt sich durch Wahl von eindeutigeren Wörtern und Strukturen in Grenzen halten, und im Übrigen vertraut man auf die Fähigkeit des Lesers, die Mehrdeutigkeit zu eliminieren.

La veran ambiguecon en la fontolingvo principe necesas traduki al vera ambigueco en la cellingvo. Sed tio eĉ por homa tradukisto estas tre malfacila, ofte nesolvebla tasko; tial la MT normale ne okupiĝas pri tiu speco de ambigueco. Por montri la malfacilecon de la tasko jen ekzemplo el la Franca teksto de la Asteriks-volumo Astérix chez Rahàzade, kiu en la bildaro 23B jene formulas la proponon ŝteli Persan tapiŝon:

Die echte Mehrdeutigkeit in der Ausgangssprache müsste man im Prinzip in echte Mehrdeutigkeit in der Zielsprache übersetzen. Das ist jedoch selbst für einen menschlichen Übersetzer eine schwere, oft unlösbare Aufgabe. Daher befasst sich die MÜ meistens nicht mit dieser Art von Mehrdeutigkeit. Um die Schwierigkeit der Aufgabe anzudeuten, folgt hier ein Beispiel aus dem französischen Text des Asterix-Bandes Astérix chez Rahàzade, der im Bildblock 23B den Vorschlag, einen persischen Teppich zu stehlen, folgendermaßen formuliert:

"Il vaut mieux un tapis persan volé qu'un tapis volant percé."
("Prefere ŝtelita Persa tapiŝo ol rompita fluganta tapiŝo.")
("Besser ein gestohlener Perserteppich als ein kaputter fliegender Teppich.")

La ĉarmo estas en la dusignifeco de "voler" (flugi/ŝteli) kaj la kruca egal-soneco de la vort-paroj "persan/volé" kaj "volant/percé", kiu verŝajne estas neimitebla en la plej multaj lingvoj. La Germana eldono tial prezentas tute alian vortludon, kiu baziĝas sur la dusignifeco de la vorto "hochgehen" (ekflugi/esti malkaŝita).

Der Reiz liegt in der Doppeldeutigkeit von "voler" (fliegen/stehlen) und im kreuzweisen Gleichklang von "persan/volé" und "volant/percé", der vermutlich in den meisten Sprachen nicht nachzuahmen ist. Die deutsche Ausgabe präsentiert daher ein anderes Wortspiel, das auf der Doppeldeutigkeit des Wortes "hochgehen" (losfliegen/entdeckt werden) basiert.

Tiaj detaloj momente estas neatingeblaj por la MT.

Solche Feinheiten liegen derzeit außerhalb der Möglichkeiten der MÜ.

>>>