<<< [=]

4 Ekzemploj

4 Beispiele

4.3 IBM Websphere Translation Server

De 2001, IBM ofertas produkton por maŝina tradukado, kiu ruliĝas en ret-servilo kaj rete proponas siajn servoj. La produkto estas parto de la produkt-familio Websphere kaj nomiĝas (Angle) Websphere Translation Server. Ĝi servas por realtempe traduki retpaĝojn, retpoŝtajn mesaĝojn kaj retbabiladon. Depende de la uzata komputilo ĝi tradukas 200 ĝis 500 vortojn sekunde, do multe pli ol homo povas paroli, tajpi aŭ eĉ legi.

Seit 2001 bietet IBM ein Produkt zur maschinellen Übersetzung an, das in einem Netz-Server läuft und seine Dienste über das Netz anbietet. Das Produkt gehört zur Produktfamilie Websphere und heißt (englisch) Websphere Translation Server. Es übersetzt in Echtzeit WWW-Seiten, Netzpostnachrichten und Netzgeplauder (chat). Je nach dem vewendeten Rechner übersetzt es 200 bis 500 Wörter pro Sekunde, also um vieles mehr, als ein Mensch sprechen, tippen oder sogar lesen kann.

4.3.1 La lingvo-paroj

4.3.1 Die Sprachenpaare

La lingvoj de Websphere koncentriĝas ĉirkaŭ la Angla, de kaj al kiu ĝi tradukas al kaj el kelkaj Eŭropaj, Amerikaj kaj Aziaj lingvoj. Versio 5.0 subtenas jenajn lingvo-parojn:

Die Sprachen von Websphere konzentrieren sich um das Englische, aus dem bzw. in das es in/aus einige(n) europäische(n), amerikanische(n) und asiatische(n) Sprachen übersetzt. Version 5.0 unterstützt folgende Sprachenpaare:

de al
Angla Brazila Portugala
Franca
Germana
Hispana
Itala
Japana
Korea
Franca
Germana
Hispana
Itala
Japana
Angla
aus in
Englisch Brasilianisches Portugiesisch
Deutsch
Französisch
Italienisch
Japanisch
Koreanisch
Spanisch
Deutsch
Französisch
Italienisch
Japanisch
Spanisch
Englisch

4.3.2 Apliko

4.3.2 Anwendung

Laŭ eldiro de IBM mem la sistemo faras proksimume 20 erarojn en 100 vortoj. Je tia eraremo ne estas mirige, ke el la firmaoj, kiuj raportas pri sukcesoj en la uzo de Websphere, ŝajne neniu raportas pri Translation Server. 20-procente erarajn tekstojn oni eble akceptas en tradukita retpaĝo, kiun oni legas, sed ne en paĝo, kiun oni prezentas al sia klientaro.

Laŭ IBM Websphere uzas la teknikon de "ingaj gramatikoj" (slot grammar), kiu ebligas la modifitan ĝeneraligon de frazo-skemoj. Temas do pri pli-malpli tradicia aliro, ne bazita sur korpuso.

Libere alireblaj specimenoj de tradukaĵoj estas alireblaj ĉe www-306.ibm.com/software/voice/viavoice/translation/demo/. Eksperimentoj proksimume konfirmas la donitan erar-kvanton de 20 %; ankaŭ la ecoj de la eraroj indikas tradician aliron, forte dependan kaj de la fonta kaj de la cela lingvoj. Ekzemplon donas frazo, kiu Angle troviĝas sur ĝuste tiu retpaĝo, per kiu IBM ofertas senkostajn traduk-specimenojn:

Laut Aussage von IBM selbst macht das System etwa 20 Fehler in 100 Wörtern. Bei dieser Fehlerquote ist es nicht verwunderlich, dass die Firmen, die Erfolgsberichte über den Einsatz von Websphere schreiben, den Translation Server nicht oder kaum erwähnen. Einen zu 20 % fehlerhaften Text akzeptiert man vielleicht in einer übersetzten WWW-Seite, die man selbst liest, aber nicht in einer, die man seinen Kunden präsentiert.

Nach IBM verwendet das System die Technik der slot grammars, die eine modifizierte Verallgemeinerung von Satz-Schemata erlaubt. Es handelt sich also um einen eher traditionellen Ansatz, der nicht korpus-basiert ist.

Frei zugängliche Proben für Übersetzungen mit Websphere sind verfügbar unter www-306.ibm.com/software/voice/viavoice/translation/demo/. Versuche bestätigen in etwa die genannte Fehlerquote von 20 %; auch die Art der Fehler deutet auf einen traditionellen Ansatz hin, der stark sowohl von der Quell- als auch von der Zielsprache abhängt. Ein Beispiel dafür bietet ein Satz, der sich auf Englisch auf eben der WWW-Seite befindet, auf der IBM die kostenlose Probeübersetzung anbietet:

en Select a language pair from drop down list
de Wählen Sie ein Sprachpaar aus Tropfen an Liste entlang
es Seleccione un par de lengua de entre gota hacia abajo lista
fr Sélectionnez une paire de la langue parmi la goutte en la liste
it Scegliete una coppia di lingue tra elenco a discesa

Evidente la sistemo havis problemojn pri la du fakaj esprimoj "pair of languages" (lingvo-paro) kaj "drop down list" (disfaldebla listo): La unuan ĝi fuŝis en la Hispana kaj Franca, la duan ĝi sukcesis bone traduki nur al la Itala. Tio pruvas, same kiel ĉe Systran, ke la analizo de sintaksaj strukturoj dependas ne nur de la fonta, sed ankaŭ de la cela lingvo. Tio povas deveni de vortaroj, kiuj enhavas ne nur unuopajn vortojn, sed plurvortajn esprimojn, tiel ke fakte uzatas speco de korpuso.

Offenkundig hatte das System Probleme mit den beiden Fachausdrücken "pair of languages" (Sprachenpaar) kaj "drop down list" (Klappliste): den ersten konnte es nur auf Deutsch und Italienisch gut wiedergeben, den zweiten nur auf Italienisch. Das zeigt, dass ebenso wie bei Systran die syntaktische Analyse nicht nur von der Quellsprache, sondern auch von der Zielsprache abhängt. Das kann damit zu tun haben, dass die verwendeten Wörterbücher nicht nur einzelne Wörter, sondern auch Zusammensetzungen enthalten, so dass doch eine Art Korpus vorliegt.

4.3.3 Spontanelingva parolo

4.3.3 Gesprochene Spontansprache

En januaro 2004 la Germana fak-gazeto Computer-Zeitung anoncis la eldonon de nova produkto:

Im Januar 2004 kündigte die deutsche Computer-Zeitung das Erscheinen eines neuen Produktes an:

Verstehen wir uns endlich? Mitte 2004 wollen die IBM-Forscher des Watson Research Center ihre Spontanübersetzungssoftware auf Notebooks und PDAs schicken. Im Lab beherrschen Prototypen schon die Kunst, gesprochenes Englisch und Mandarin-Chinesisch in Text umzusetzen, diesen in eine zweite Sprache zu übersetzen und synthetisch auszusprechen. ...

Ĉu finfine ni interkompreniĝas? Meze de 2004 la esploristoj de la esplorcentro Watson de IBM intencas sendi al porteblaj komputiloj kaj personaj komputil-asistantoj sian traduk-programaron por spontanea parolo. En la laboratorio [Angla vorto en la Germana teksto] prototipoj jam kapablas transformi parolan Anglaĵon kaj Mandaren-Ĉinaĵon al teksto, traduki tiun al dua lingvo kaj sinteze elparoli ...

Redemando ĉe la gazeto kaj ĉe IBM rezultigis nur, ke ĉe Watson oni ja laboris pri parol-traduka programo. Pri almerkatigo nenio estis sciebla. Ŝajnas, ke novaĵoj pri tiu temo ĉiam provokas iom da troa entuziasmo.

Nachfrage bei der Zeitung und bei IBM ergab nur, dass man bei Watson allerdings an einem Sprachübersetzungsprogramm gearbeitet habe. Über eine Markteinführung war nichts zu erfahren. Es scheint, dass Nachrichten über dieses Thema leicht etwas zu große Begeisterung hervorrufen.

>>>