ハングル翻字2009年06月16日 20:23
ハングル翻字機を作った。
世界諸言語翻字機と一つにまとめる予定だったが、複雑になったので単体で公開する。
ハングルは同じ文字でも前後の文字との兼ね合いで音が変わるが、なるべく再現するよう試みた。
現在のところ、有声音化は実装してある。また同じ仕組みで対処できるl+r→l+lも実装した。
それ以上の変化は未実装である。例えばk+n→ŋ+nの変化には対応しておらずk+n→g+nとなってしまう。
終声に初声と同じ文字を使っているが、これも正しくない。例えば있다はIssTaとなるが、ItTaとなるべきである。
この辺りはそのうち気が向いたら修正する予定である。
また、二重パッチムの扱いは難しいので対処できる気がしない。
この翻字機で使っている英字表記についてだが、韓国語の英字表記にはマッキューン・ライシャワー式(以下MR)と文化観光部2000年式(以下2000)という2つの方法が広く用いられている。(余談だがどちらも名前がカッコよくて好きである。)
いろいろ考えた結果、MR式っぽい独自表記を使うことにした。
2000式は韓国で標準的な翻字法である。欧米で英字表記するときも大抵こちらだし、日本でも目にするのは大抵これだ。
なぜこちらを使わないかというと、これが非常に読みにくいのだ。
例えばeuと書いて「ウ」と読み(uとは違う発音)、eoと書いて「オ」と読む(oとは違う発音)。
また子音も語頭の有声音と無声音を区別しないためプサンがBusanだったりする。
一方、マッキューンライシャワー式は読みやすい。
MR式では「으」は「ŭ」、「어」はŏと書く。「ŭ」と書いてあればこれが「ウ」っぽい音でuとは別の字であることが一目で分かる。
語頭の有声音と無声音も区別され、プサンはPusanである。
これであれば韓国語を知らない人でも大体の読みが分かる。
MR式からの変更点だが、MR式は2000式ほどではないが1音複数文字の表記があり、これが多少分かりづらいことになっている。これを改めた。
「ae」や「oe」は一音である。一方「a」「o」の次に「e」が来た場合これと区別がつかないので、「aë」「oë」と書く。
同じものを表すのに別の文字を使うのは紛らわしいので、これを防ぐために、aeはæ、oeはøと書くことにした。これによりeとëの区別が必要なくなり、常にeと書けるようになった。
同様に[ŋ]をngと書くとnの次にgが来たものと紛らわしいので「ŋ」と書くことにする。
さらに、文字の切れ目を分かりやすいようにハングル一文字ごとに対応する頭文字を大文字にする。
例 : AnNyŏŋHaSeYo?
これによって実は上で書いたaëやngの問題も解決してしまうのだが、せっかく考えたのでそのままにする。
個人的にはその方が読みやすいと思うので。
aeって書いてあると2音なのかと勘違いするかもしれないけどæって書いておけばその心配はない。
ただ、なにも知らない人がæを「エ」と読めるかというとちょっと微妙かもしれない。
æの代わりに「エ」と読みやすい「ɛ」を使う案も考えたのだが、環境によって汚い字になるのと、MR式から離れすぎるのも問題だと思いやめておいた。
世界諸言語翻字機と一つにまとめる予定だったが、複雑になったので単体で公開する。
ハングルは同じ文字でも前後の文字との兼ね合いで音が変わるが、なるべく再現するよう試みた。
現在のところ、有声音化は実装してある。また同じ仕組みで対処できるl+r→l+lも実装した。
それ以上の変化は未実装である。例えばk+n→ŋ+nの変化には対応しておらずk+n→g+nとなってしまう。
終声に初声と同じ文字を使っているが、これも正しくない。例えば있다はIssTaとなるが、ItTaとなるべきである。
この辺りはそのうち気が向いたら修正する予定である。
また、二重パッチムの扱いは難しいので対処できる気がしない。
この翻字機で使っている英字表記についてだが、韓国語の英字表記にはマッキューン・ライシャワー式(以下MR)と文化観光部2000年式(以下2000)という2つの方法が広く用いられている。(余談だがどちらも名前がカッコよくて好きである。)
いろいろ考えた結果、MR式っぽい独自表記を使うことにした。
2000式は韓国で標準的な翻字法である。欧米で英字表記するときも大抵こちらだし、日本でも目にするのは大抵これだ。
なぜこちらを使わないかというと、これが非常に読みにくいのだ。
例えばeuと書いて「ウ」と読み(uとは違う発音)、eoと書いて「オ」と読む(oとは違う発音)。
また子音も語頭の有声音と無声音を区別しないためプサンがBusanだったりする。
一方、マッキューンライシャワー式は読みやすい。
MR式では「으」は「ŭ」、「어」はŏと書く。「ŭ」と書いてあればこれが「ウ」っぽい音でuとは別の字であることが一目で分かる。
語頭の有声音と無声音も区別され、プサンはPusanである。
これであれば韓国語を知らない人でも大体の読みが分かる。
MR式からの変更点だが、MR式は2000式ほどではないが1音複数文字の表記があり、これが多少分かりづらいことになっている。これを改めた。
「ae」や「oe」は一音である。一方「a」「o」の次に「e」が来た場合これと区別がつかないので、「aë」「oë」と書く。
同じものを表すのに別の文字を使うのは紛らわしいので、これを防ぐために、aeはæ、oeはøと書くことにした。これによりeとëの区別が必要なくなり、常にeと書けるようになった。
同様に[ŋ]をngと書くとnの次にgが来たものと紛らわしいので「ŋ」と書くことにする。
さらに、文字の切れ目を分かりやすいようにハングル一文字ごとに対応する頭文字を大文字にする。
例 : AnNyŏŋHaSeYo?
これによって実は上で書いたaëやngの問題も解決してしまうのだが、せっかく考えたのでそのままにする。
個人的にはその方が読みやすいと思うので。
aeって書いてあると2音なのかと勘違いするかもしれないけどæって書いておけばその心配はない。
ただ、なにも知らない人がæを「エ」と読めるかというとちょっと微妙かもしれない。
æの代わりに「エ」と読みやすい「ɛ」を使う案も考えたのだが、環境によって汚い字になるのと、MR式から離れすぎるのも問題だと思いやめておいた。
Post time : 2009年06月16日 20:23│Comments(0)