<<< [=]

4 Ekzemploj

4 Beispiele

4.1 UNL

UNL

La projekto UNL estas interesa pro pluraj kialoj. Precipe, ĉar ĝi estis lanĉita de la Unuiĝintaj Nacioj pere de sia universitato (en Tokio); Ĝi do estas projekto speciale grava, ĉar malfacile iu povus konkurenci ĝin laŭ la reputacio, kiu altiras esplorajn partnerojn.

Das Projekt UNL ist aus verschiedenen Gründen interessant. Vor allem, weil es von den Vereinten Nationen über ihre Universität (in Tokio) gestartet wurde; es ist daher ein besonders bedeutsames Projekt, da kaum ein anderes ihm in Bezug auf den wissenschaftlichen Ruf Paroli bieten könnte, der für das Anwerben von Forschungspartnern so wichtig ist.

UNL estas Anglalingva akronimo, kiu signifas "Universal Networking Language" (= universala reta lingvo). Ĝi tamen estas ne nur lingvo, sed MT-projekto, la "UNL-projekto" (UNLP); la esprimo "lingvo" rilatas al la ponto-lingvo, kiun ĝi uzas.

UNL ist ein englisches Akronym und bedeutet "Universal Networking Language" (= Universal-Netz-Sprache). Es handelt sich aber nicht nur um eine Sprache, sondern um ein MÜ-Projekt, das "UNL-Projekt" (UNLP); der Ausdruck "Sprache" bezieht sich auf die verwendete Brückensprache.

UNLP komenciĝis en 1996/97 kun la celo, produkti ponto-lingvan MT-sistemon por ret-paĝoj (TTT). Valoras citi el la intenc-deklaro:

UNLP begann 1996/97 mit dem Ziel, ein brückensprachliches MÜ-System für WWW-Seiten zu entwickeln. Es lohnt sich, aus der Absichtserklärung zu zitieren:

"The Purposes and Activities of UNLP are to develop and promote the communication and information platforms and media that provide equal opportunities for all peoples to access, share and exchange the scientific, cultural, social and economic resources available in the global community. The UNLP has a flexible and agile network of persons and institutions devoted to further develop, expand, improve and disseminate the UNL System as a way to overcome the languages barrier, and as a platform to record and disseminate human knowledge among peoples of different languages."

A gift to the next generation.

"La celoj kaj aktivadoj de UNLP estas por evoluigi kaj subteni la komunikajn kaj informajn bazojn kaj komunikilojn, kiuj provizas por ĉiuj popoloj egalajn ĉancojn por aliri, partopreni kaj interŝanĝi la sciencajn, kulturajn, sociajn kaj ekonomiajn resursojn disponeblajn en la tutglobal komunumo. La UNLP havas adaptiĝeman kaj ageman reton da personoj kaj institucioj dediĉitaj al la plia evoluigo, vastigo, plibonigo kaj disvastigo de la sistemo UNL kiel vojo superi la lingvan barilon kaj kiel platformon por registri kaj disvastigi homan scion inter popoloj diverslingvaj."

"Zweck und Ziel des UNLP ist es, Kommunikations- und Informationsplattformen und -medien zu entwickeln und zu fördern, die allen Völkern gleiche Chancen bieten, auf die wissenschaftlichen, kulturellen, gesellschaftlichen und wirtschaftlichen Ressourcen der globalen Gemeinschaft zuzugreifen, an ihnen teilzuhaben und sie auszutauschen. Das UNLP besitzt ein flexibles und reges Netz von Personen und Einrichtungen, die sich der weiteren Entwicklung, Ausweitung, Verbesserung und Verbreitung des UNL-Systems als Weg zur Überwindung der Sprachenbarriere und als Plattform zur Erfassung und Verbreitung menschlichen Wissens unter Völkern mit verschiedener Sprache widmen."

La plano estis trakti la homajn lingvojn laŭ tri kategorioj:

  • 15 lingvoj estu prioritate traktitaj; por ili la UNL-sistemo estu disponebla ĝis la jaro 2000. Temas pri la ses oficialaj lingvoj de UN kaj naŭ pliaj lingvoj kun po ĉ. 100 milionoj aŭ pli da parolantoj.
  • 150 lingvoj estu traktitaj en dua fazo (ĝis 2006), tiel ke ĉiu lando de la tero estu reprezentata per unu lingvo.
  • La aliaj lingvoj ne estu konsiderataj.

Ĉar la sistemo nun (2004) ankoraŭ ne estas ĝenerale disponebla, estas neklare, kie ĝi tempe situas en siaj planoj.

Geplant war, die natürlichen Sprachen nach drei Kategorien zu behandeln:

  • 15 Sprachen sollten mit Vorrang behandelt werden; für sie sollte das System UNL bis zum Jahr 2000 zur Verfügung stehen. Es handelt sich um die sechs Amtssprachen der UN und neun weitere Sprachen mit je ca. 100 Millionen oder mehr Sprechern.
  • 150 Sprachen sollten in einer zweiten Phase (bis 2006) behandelt werden, so dass jedes Land der Erde durch mindestens eine Sprache vertreten sein sollte.
  • Andere Sprachen sollten nicht berücksichtigt werden.

Da das System derzeit (2004) noch nicht allgemein verfügbar ist, ist unklar, wie gut das Projekt im Plan liegt.

Teknike la sistemo UNL aspektu jene:

  • Aŭtoroj de retpaĝoj generu el sialingva teksto UNL-version per programo nomita UNL-alkonvertilo. Tiu programo demandas la aŭtoron, se ĝi bezonas helpon por solvi ambiguecon. Tiel ĝi kapablas produkti altkvalitan, malmulte ambiguan UNL-tekston.
  • La UNL-teksto (nelegebla por homoj) estas disponigata en TTT.
  • Uzanto, kiu volas legi la tekston, ricevas ĝin ne rekte, sed tra dekonvertilo sialingva, programo, kiu el UNL generas tekston en la preferata lingvo (el inter la disponeblaj).
  • La al- kaj de-konvertaj programoj ruliĝu ne sur la komputiloj de la uzantoj, sed en centraj aŭ discentraj "lingvo-serviloj" rete atingeblaj. La programoj baziĝas sur la "UNL-vortaro" kaj sur "lingvaj reguloj" por la unuopaj lingvoj.

Technisch soll das System UNL so aussehen:

  • Autoren von WWW-Seiten erzeugen aus einem Text in ihrer Sprache eine UNL-Version, mit einem Programm, das UNL-Enkonverter heißt. Dieses Programm fragt beim Autor nach, wenn es Hilfe zur Auflösung einer Mehrdeutigkeit braucht. Auf diese Weise ist es in der Lage, einen qualitativ guten UNL-Text mit wenig Mehrdeutigkeit zu erzeugen.
  • Der (für Menschen unlesbare) UNL-Text wird im WWW angeboten.
  • Ein Anwender, der den Text lesen will, erhält ihn nicht direkt, sondern über einen Dekonverter für seine Sprache, also ein Programm, das aus UNL einen Text in der (unter den verfügbaren Sprachen) bevorzugten Sprache erzeugt.
  • Die Enkonverter- und Dekonverter-Programme laufen nicht auf dem Rechner der Anwender, sondern auf zentralen oder verteilten "Sprach-Servern", die über Netz erreichbar sind. Die Programme stützen sich auf das "UNL-Wörterbuch" und auf "sprachliche Regeln" für die einzelnen Sprachen.

Informe UNL baziĝas sur tri partoj:

  1. La UNL-specifoj, kiuj fiksas la strukturon de la ponto-lingvo.
  2. La universala monda vortaro kun "universalaj vortoj", kiuj baziĝas sur Anglaj vortoj.
  3. La UNL-konobazo, kiu enhavas semantikajn informojn pri universalaj vortoj.
Die Informationsbasis der UNL besteht aus drei Teilen:

  1. Die UNL-Spezifikation, die die Struktur der Brückensprache festlegt.
  2. Die Universalwörter, die auf englischen Wörtern basieren.
  3. Die UNL-Wissensbasis, die semantische Informatioen über Universalwörter enthält.

La UNL-vortaro

La vortaro de UNL konsistas el "universalaj vortoj" (UV). Ili eliras de la Angla lingvo kaj estas suplementitaj per rilatoj al aliaj vortoj, por esti pli klaraj kaj sen-ambiguaj. La UV-oj kun siaj rilatoj formas la UNL-konobazon. La versio de 2004-01-08 havas amplekson de iom pli ol 15.000 linoj.

Das UNL-Wörterbuch

Das Wörterbuch der UNL besteht aus "Universalwörtern" (UW). Sie beruhen auf dem Englischen und sind durch Beziehungen zu anderen Wörtern ergänzt, um die Klarheit zu erhöhen und Mehrdeutigkeiten zu vermeiden. Die UW bilden zusammen mit diesen Beziehungen die UNL-Wissensbasis. Der Stand vom 2004-01-08 umfasst etwas über 15.000 Zeilen.

Ekzemple la (Brita) Angla vorto "cock", kiu signifas kaj "koko" kaj "krano", ekzistas en UNL en la formoj "cock(icl>bird{>animal})" kaj "cock(icl>domestic fowl)", kie "domestic fowl" estas pliklarigita kiel "domestic fowl{(icl>fowl>bird)}". Por la signifo "krano" ne ŝajnas troviĝi vorto en la versio de 2004-01-08; nek la Angla vorto "tap" nek la Usona "faucet" troveblas tie. Eble necesas uzi "valve(icl>tool{>functional thing})".

La rilato "icl" estas tre ofta en la UNL-konobazo. Ĝi signifas, ke vorto estas pli speciala ol la sekva; ekzemple "cock" = "koko" estas pli speciala ol "bird" = "birdo" kaj "animal" = "besto", kaj same ol "domestic fowl" = "kortbirdo". Ekzistas kelkaj dekoj da rilatoj inter UV-oj. Ekzemple la verbo "check" (= ekzameni) estas klarigita per "check({icl>do(}agt>thing,obj>thing{)})"; do ĝi estas pli speciala ol "do" (fari) kun aganto (agt) kaj objekto (obj). Alivorte, "check" estas transitiva verbo.

Zum Beispiel gibt es das englische (britische) Wort "cock", das (ebenso wie das deutsch Wort "Hahn") sowohl "männliches Huhn" als auch "Wasserhahn" bedeuten kann, in UNL in den Formen "cock(icl>bird{>animal})" und "cock(icl>domestic fowl)", wobei "domestic fowl" erläutert wird als "domestic fowl{(icl>fowl>bird)}". Für die Bedeutung "Wasserhahn" scheint es im Wörterbuch vom 2004-01-08 kein Wort zu geben; weder das englische Wort "tap" noch das US-amerikanische "faucet" finden sich dort. Möglicherweise muss man "valve(icl>tool{>functional thing})" benutzen.

Die Beziehung "icl" kommt im UNL-Wörterbuch sehr oft vor. Sie bedeutet, dass ein Wort spezieller ist als das vorhergehende; Zum Beispiel ist "cock" = "Hahn" spezieller als "bird" = "Vogel" und "animal" = "Tier", und auch als "domestic fowl" = "zahmes Geflügel". Es gibt einige Dutzend Beziehungen zwischen UW. Zum Beispiel wird das Verbum "check" (= "überprüfen") durch "check({icl>do(}agt>thing,obj>thing{)})" erläutert; es ist also spezieller als "do" ("tun") und hat einen Handelnden (agt) und ein Objekt (obj). Mit anderen Worten: "check" ist ein transitives Verbum.

Ne ĉiam estas klare, laŭ kiuj kriterioj UNL elektas siajn UV-ojn. Ekzemple ekzistas du prepozicioj "sans(icl>how(obj>thing))" kaj "without(icl>how(obj>thing)), kiuj Angle signifas, escepte de stila diferenco, preskaŭ la saman.

Es ist nicht immer klar, nach welchen Kriterien UNL seine UW auswählt. So gibt es zwei Präpositionen "sans(icl>how(obj>thing))" und "without(icl>how(obj>thing)), die im Englischen, vom Stilistischen abgesehen, fast dasselbe bedeuten.

La UNL-specifoj

La strukturo de UNL baziĝas sur du-umaj rilatoj: UNL-esprimoj konsistas el du universalaj vortoj (UV) kaj "rilato" inter ili: ril(UV1,UV2). Ĉar estas rilatoj de multaj diversaj specoj, oni povus ankaŭ paroli pri unu sola universala tri-uma rilato u(rilato, UV1, UV2). Tiuj triopoj estas notataj en jena formo:

Die UNL-Spezifikation

Die Struktur der UNL basiert auf binären Relationen: ein UNL-Ausdruck besteht aus zwei Universalwörtern (UW) und einer Beziehung bez(UW1,UW2). zwischen ihnen. Da es verschiedene Arten von Beziehungen gibt, könnte man auch von einer einzigen universellen ternären (drei-gliedrigen) Relation u(Beziehung, UW1, UW2) sprechen. Diese Tripel (Dreierkombinationen) werden folgendermaßen geschrieben:

nomo_de_rilato:id(uv_1:id[listo_de_atributoj_1],uv_2:id[listo_de_atributoj_2])
Relationsname:id(uw_1:id[Attributliste_1],uw_2:id[Attributliste_2])

Tion oni legas jene: La partoj en ortaj krampoj ([...]) povas manki, do ne necesas atribut-listoj. La kursivaj partoj estas nomoj, do la partojn nomo_de_rilato, uv_1, uv_2, listo_de_atributoj_1 kaj listo_de_atributoj_2 anstataŭas veraj nomo de rilato, universalaj vortoj kaj atribut-listoj. Kvar originalaj ekzemploj el la UNL-specifoj pliklarigu tion:

Das ist so zu lesen: Die Teile in eckigen Klammern ([...]) können fehlen; Attributlisten sind also nicht notwendig. Die kursiven Teile sind Namen (Bezeichnungen); die Teile nomo_de_rilato, uv_1, uv_2, listo_de_atributoj_1 und listo_de_atributoj_2 werden also durch echte Beziehungsnamen, Universalwörter und Attributlisten ersetzt. Hier vier Originalbeispiele aus der UNL-Spezifikation zur Erläuterung:

(1) aoj(hear(icl>perceive(agt>thing,obj>thing)).@entry.@ability, I)
(2) obj(hear(icl>perceive(agt>thing,obj>thing)).@entry.@ability, :01)
(3) agt:01(bark(agt>dog).@entry, dog(icl>mammal))
(4) plc:01(bark(agt>dog).@entry, outside(icl>place))

(1) En la unua ekzemplo la rilato nomiĝas aoj, kio signifas "objekto kun epiteto". La objekto estas la dua UV, en tiu ĉi okazo la vorto "I" (Angle "mi"). La epiteto estas la unua UV, en tiu ĉi okazo la vorto "perceive" (Angle "percepti"). "percepti" do estas epiteto de "mi" kun la atributo "@ability" = "kapablo". La rilato signifas proksimume "mi havas la kapablon aŭdi" aŭ "mi povas aŭdi".

(1) Im ersten Beispiel heißt die Relation aoj, das bedeutet "Objekt mit Attribut" oder "Objekt mit Eigenschaft". Das Objekt ist das zweite UW, in diesem Fall das Wort "I" (engl. "ich"). Das Attribut ist das erste UV, hier "perceive" (engl. "wahrnehmen"). "wahrnehmen" ist also ein Attribut von "ich" mit dem Attribut "@ability" = Fähigkeit. Achtung: Das Wort "Attribut" wird hier in doppelter Bedeutung gebraucht: einmal bedeutet es das "Attribut des Objekts" in der Relation "aoj", zum Zweiten ein Attribut eines UW wie in dem obigen Schema für UNL-Relationen ("Attributliste").

(2) En la dua ekzemplo la rilato nomiĝas "obj", tio signifas "koncernata, influata afero". La unua UV estas evento aŭ stato, kiu koncernas la duan UV. Ĉi tie la dua UV estas nura numero (01), kiu re-aperas en la tria kaj kvara ekzemploj; la tie aperanta UV do estas koncernata de la evento "hear" = "aŭdi".

(2) Im zweiten Beispiel heißt die Relation obj, das heißt "betroffenes Ding". Das erste UW ist ein Ereignis oder ein Zustand, das/der das zweite UW betrifft. Hier ist das zweite UW nur eine Nummer (01), die im dritten und vierten Beispiel wieder erscheint; das dortige UW ist also betroffen vom Ereignis "hear" = "hören".

(3) La rilato de la tria ekzemplo estas "agt" = "io, kio iniciatas agon". La dua UV iniciatas la agon esprimitan per la unua UV. Tie ĉi do iu "dog" (hundo) iniciatas la agon "bark" (boji), kiu estas markita per "01", do estas la koncernata objekto de la antaŭa rilato (aŭdi). Per tio ni havas pli-malpli kompletan frazon el tri rilatoj: "mi kapablas aŭdi" + "la aŭdado koncernas bojadon" + "la bojadon kaŭzas hundo" = "mi povas aŭdi hundon boji".

(3) Die Beziehung im dritten Beispiel ist "agt" = "etwas, das eine Handlung auslöst". Das zweite UW löst die Handlung aus, die durch das erste UW ausgedrückt wird. Hier löst also ein "dog" (Hund) die Handlung "bark" (bellen) aus, die mit "01" markiert ist; diese Handlung ist also das "betroffene Ding" der vorherigen Beziehung (hören). Damit haben wir einen mehr oder weniger vollständigen Satz: "Ich habe die Fähigkeit zu hören" + "Das Hören betrifft ein Bellen" + "ein Hund löst das Bellen aus" = "ich kann einen Hund bellen hören".

(4) La kvara rilato, "plc", suplementas tiun frazon. Ĝi signifas "loko, kie evento okazas"; la unua UV estas la evento, la dua la loko. La evento denove estas bark = "boji", la loko estas outside = "ekstere". La kompleta frazo do estas "mi povas aŭdi hundon boji ekstere".

(4) Die vierte Beziehung, "plc", ergänzt diesen Satz. Sie bedeutet "Ort, wo ein Ereignis stattfindet"; das erste UW ist das Ereignis, das zweite der Ort. Das Ereignis ist wieder bark = "bellen", der Ort ist outside = "draußen". Der vollständige Satz lautet also "ich kann einen Hund draußen bellen hören".

La universalaj vortoj en la ekzemploj enhavas esprimojn en rondaj krampoj, ekzemple "(icl>place)" post "outside". Tiuj esprimoj nomiĝas restriktoj. Ili donas pliajn informojn pri universalaj vortoj, ne pri la rilato. "(icl>place)" jam sen la rilato "plc" diras, ke temas pri loko (Angle place), kaj "bark(agt>dog)" diras, ke la ago "boji" normale estas kaŭzata de hundo. Se escepte bojus homo, kiu imitas hundon, tiu universala vorto tamen konservus sian aganton "dog"; ĝi apartenas al la signifo de la UV.

Die Universalwörter in den Beispielen enthalten Ausdrücke in runden Klammern, wie zum Beispiel "(icl>place)" nach "outside". Diese Ausdrücke heißen Einschränkungen. Sie geben weitere Informationen zu einem Universalwort, nicht zu einer Beziehung. "(icl>place)" sagt bereits ohne die Beziehung "plc" aus, dass es sich um einen Ort (Angle place) handelt, und "bark(agt>dog)" besagt, dass die Handlung "bellen" normalerweise von einem Hund ausgelöst wird. Wenn ausnahmsweise ein Mensch bellen würde, der einen Hund nachmacht, würde dieses Universalwort trotzdem seinen Handelnden "dog" behalten; er gehört zur Bedeutung des UW.

Ke la rilato "agt" kaj la restrikto "agt" havas la saman nomon, ne estas kompleta koincido; efektive rilatoj povas aperi ankaŭ kiel restriktoj. Sed ekzistas kelkaj restriktoj, kiuj ne aperas kiel rilatoj.

Dass die Beziehung "agt" und die Einschränkung "agt" denselben Namen haben, ist kein Zufall; tatsächlich können Beziehungen auch als Einschränkungen auftreten. Es gibt jedoch einige Einschränkungen, die nicht als Beziehungen auftreten.

La UNL-rilatoj estas prezenteblaj kiel arbo-simila grafo; oni ricevas ĝin kreante nodon por ĉiu (malsama) UV kaj ligante la nodojn per la "rilatoj":

Die UNL-Beziehungen sind als baum-ähnlicher Graph darstellbar; man erhält ihn, indem man für jedes (verschiedene) UW einen Knoten erzeugt und die Knoten durch die "Beziehungen" verbindet:

arbo el la 4 nodoj 'hear', 'I', 'dog', 'bark'

>>>