言語ゲーム

とあるエンジニアが嘘ばかり書く日記

Twitter: @propella

言語の選択肢が複数表示されるのが意外とややこしい問題だったのでメモ

今 Squeakland.org で公開されているイメージを使って日本語を表示しようと地球アイコンを押すと、Japanese(???) の選択肢が二つ現れて妙な感じがします。たかが見た目の問題と思いきや、意外と面倒な問題が横たわっていました。

直前に投稿された Michel のロケールプラグインによって、Squeak は起動時に OS のロケール設置を読み込む事になりました。これは ja-JP のような形になります。ja が日本語、JP が日本国を示し、これは日本で話される日本語であるという意味になります。ところが、今までの Squeak では、「言語」の事しか考えていなかったので、「国」の情報が入るとおかしくなります。

なぜ二重に選択肢が出るのかは単なる技術的問題なので置いといて、翻訳辞書をどのように作るかを考えると様々な問題に当たります。

  • 単語を翻訳したい場合、現在の言語-国情報にピッタリマッチした辞書が見つからない場合、言語情報だけを使って適当な辞書を探さなくてはならない。
  • 翻訳辞書を作りたい場合、例えば日本語の場合、ja-JP の辞書を作るのか、ja の辞書を作るのかという事を明確にしておかなくてはならない。
  • ja と ja-JP の関係は、継承とみなすのか、単によく似た言語とみなすのか。(日本語ならどっちでも良いけど、例えばスペインとメキシコの関係は?)

ううー。面倒だ。