リムナンテスは愉快な気分

徒然なるままに、言語、数学、音楽、プログラミング、時々人生についての記事を書きます

人工言語製作のための「Hello, world文」コーパス翻訳ガイド

conlinguistics.wikia.org


  1. This is a pen. (en. これはペンです。)
  2. I love you. (en. 私はあなたを愛する。)
  3. I eat an apple. (en. 私はリンゴを食べる。)
  4. I speak in xxx. (en. 私はxxxで話します。)
  5. Muson manĝas kato. (eo. ネズミを食べる、ネコが。)


短いし製作初期にとても扱いやすい文章群だと思うのでおすすめの5文。

創った人工言語の文法が実用に堪えるかを試す試金石として使うんだと思いますが、その際に気をつける点や、そもそも訳すために必要な文法事項はなんだろうか?というお話。

1文目:This is a pen. (en. これはペンです。)

この文が最難関かもしれない。難しければ後回しで構わないと思う。

用意すべき文法事項は少なくとも

  • 指示代詞の文法(品詞、指示対象の遠近を区別するか)
  • 「AはBである」型の文型(繋辞の有無、AとBの順番、特別な動詞 or 構文を用意するかどうか)
  • "pen" の訳語

この中でも特に "pen" の訳語が非常にめんどくさかった。
"pen" って非常に文化的なんですよ。棒状のものの先端に固体〜液体状の染料を染み込ませて文字を書くって世界規模でみると全然普遍的ではないんですよね。"pen" という単語が作れるなら "pen" で良いんですけどね。

文化的に "pen" が存在しない場合は、筆記具、書くもの、その他その文化で筆記の為に使われるもの、このあたりで攻める。
筆記+道具という派生 or 合成語規則を作る。「筆記」は動詞「書く」を名詞転換して作ってもよし。

さらに細かく文法を考えるとしたら

  • 時制 or 相(現在時制っぽいものを作るかどうか、またデフォルトかどうか)
  • 個数の明示("pen" が1個かそうでないかを区別するか否か)
  • "pen" の名詞クラス(個数詞っぽいものが存在するか?)

あたりを詰める。

2文目:I love you. (en. 私はあなたを愛する。)

用意すべき文法事項は

  • 動詞述語文(相当の文)の統語論
  • 「愛する」とその語法(動詞か形容詞か、主語を与格で受けるとか生格で受けるとか)
  • 1人称/2人称単数代名詞

割と素直に訳せると思う。
好悪系の動詞は、その他の動詞と異なる格をとったりしうるのでその辺りをどうするか。

3文目:I eat an apple. (en. 私はリンゴを食べる。)

用意すべき文法事項は

  • 1人称代名詞
  • 「食べる」
  • 「りんご」
  • 格をどうするか

5文の中で一番素直に訳せると思われる、と見せかけて「りんご」という植物もとい生物種をどう規定するかを考えなければならない。

我々の想定する「りんご」もしくはそれに相当する/似ている何かが存在するのであれば、それで訳せばよい。
そうでない場合はなんでしょうね。「球体状の赤い果実」とでも訳せばいいんですかね。

あるいは、イスクイルなんかだと分類学的な種ごとに語根が定まっているので、漠然とした集合としての「りんご」は(多分)存在しない。「りんご」がセイヨウリンゴなのかワリンゴなのかヒメリンゴなのかetc.を明示しなければならないとか、そういうところまで考えるかどうか。

「りんご」を数えるとかどうとか、名詞クラスが〜とかは1文目のおまけと同様のことを考えるべき。

4文目:I speak in xxx. (en. 私はxxxで話します。)

xxxには自言語でも入れておけばよいかと思います。
「喋る」みたいな単語と、「〜語で」というのをどう表現することにするかという文法作成が主でしょうか。副詞で受けるか対格で受けるか。

あ、それと自言語で自言語を何て呼ぶかは結構難しい問題ではある。よくあるのは「我々の言語」という言い方か。あるいは自言語の一般名詞を流用するか。例えば "Esperanto" は "esper-ant-o"「希望する者」からの流用ですが、意味空間を汚染するのをどれくらい気にするか。

ただ、人工言語を育てている間に文法、特に形態論とかが変わってしまって固有名詞化することが多い気がするのであんまり気にしなくてもいいかもしれない。

5文目:Muson manĝas kato. (eo. ネズミを食べる、ネコが。)

基本要素は3文目と同じ。強調語 or 付け足し的なニュアンスの語法をどうするか。語順で示す、強調マーカーを置く、強調構文を作る、など。そもそもエスペラントって語順の入れ替えにそこまで意味持たせてたっけ…

あと「ネズミ」と「ネコ」の造語。生物をあらわす名詞の造語方法は「りんご」と同様に結構考えないといけないかもしれない。