よい自然言語とは?

  • (by K, 2007.07.28)

(0)

  • インチやフィートやマイルの単位系、寸や尺や里という単位系は、メートル法に比べて明らかに劣っていると思う。単位変換が全然容易ではないから。・・・これと同じような観点で、自然言語を考えてみたい。
  • 自然言語というのは、プログラミング言語ではない普通の言語のことである。日本語とか英語とか。

(1)

  • 理想的な自然言語は以下の条件を満たしていると信じる。
    • 文字:
      • (他の言語と比較して)表記に必要な文字種が少ない。
      • 画数が少なく、書きやすい。
      • 逆さになっていたり、鏡面になっていたりしても、誤読しない工夫がある(たとえは"6"と"9"みたいな文字はよくない)。
    • 語彙・文法:
      • 基本語彙が少なくて合成語が多い。
      • (他の言語と比較して)文章が短い(同じ内容で)。
      • 同音異義語が皆無か、もしくは非常に少ない。
      • 動詞などが変化しないか、もしくは変化するにしても完全に規則的である。
      • 副詞や形容詞がどの語に係っているか紛らわしくない。
    • 発音:
      • 難しい発音がない。似ている発音もない。
      • 単語ごとに発音記号を辞書に書かなければいけないということはない。
    • 強度の表現の統一:
      • たとえば、暑い、寒い、暖かい、涼しい、などの表現がある。僕はこういう表現はダメだと思っている。それなら「暖かい」だけを語にして、「-暖かい」=「涼しい」、「2暖かい」=「暑い」、「-3暖かい」=「とても寒い」のようにできないものだろうか。ここでは、1を心地よい程度と仮定した。だから「0.5暖かい」という微妙な表現もできる。「0暖かい」は完全に真ん中として使えるだろう。なにも数値がそのまま出てくる必要はないんだけど、でも数値に換算可能な表記であればいいと思う(たとえば2はキロ、3がメガ、-1はミリ、-2がマイクロとか:メガ暖かい・・・確かにすごく暑そうだ・・・笑)。
      • 英語の副詞で、neverとかseldomとかoftenとかalwaysとかまあいろいろあるけど、これだって無駄に単語を増やしていると思う。うまく数値化すれば単語は減らせるし、もっと微妙な表現も可能になる。
      • 色を光の波長に類する数字で表したらどうかと思ったけど、そうすると白とかが表せないかー(まあRGBとかCMYで書く方法もあるけど)。でも雪色(白)とか、空色(青)など、色を表す語を用意しなくても、名詞から色を抽出できれば十分かもしれない。
      • 方向も数値化できそう。東西南北をやめて、たとえばいわゆる「3時の方向」とかでいいんじゃないの?(=東)。
      • もしかしたら「なんで強度の表現の統一がよい言語の条件なの?」って思うかもしれない。でもこれは(僕の信じるところでは)言語的には大進歩なのである。・・・たとえば水は温度によって、「冷水」「温水」「湯」「熱湯」などと名詞が変わる。これは確かに短く表現できてよいことだけれども、温度に関する記述が名詞に融合してしまっているために、他の名詞に同じような温度属性を付与することができない。それとも油に対して「冷油」「温油」「熱油」という名詞を作るほうがいいのか?いやそうではないだろう。実際は、温度属性だけをもつ「冷たい」「熱い」などの形容詞を作り、「冷たい水」「冷たい油」のように使うわけだ。形容詞は言語的大進歩のひとつだと思う。同じことは副詞にも言えて、副詞は動詞に属性を付与できる。また副詞は形容詞に属性を付与することもできる(「とても」熱い、とか)。これで動詞や形容詞を乱発しないで済んでいるのである。
      • 僕はこれに加えて、程度の表現やその他数値化可能なものは、全部数値的表現に統一すればいいと思っている。マイナスを使えば、対義語も乱発しなくていい。数の利用はさまざまな学問に革命的な進化をもたらしたけれど、言語だってその恩恵を受けていいはずだ。

(2)

(3)

  • ここからが、このページを書くことにした最大の動機である。
  • 僕はNHKの「ことばおじさん」の番組が好きでとてもよく見ているのだが、日本語の複雑さや難しさを「いいですね」と言っていることに非常に違和感を覚える。
  • そんなに難しい例を出すまでもなく、日本語には漢字があり、これが小学校で習う範囲だけでも1000文字くらいはある。ひらがなとカタカナをあわせれば1100文字にはなるだろう。全部ひらがなだけの文章は読む気がしないから、まあ日本語としてはこの1100文字くらいは必要だと仮定すると、これは理想の言語からは程遠い。これはどちらかといえば恥ずべきことなんだと思う。
  • また漢字一文字取っても読み方がいくつもある。「魚」という漢字は、「ぎょ」という音読み(中国語由来)だけではなく「うお」とか「さかな」とかいう当て字もある。これは、たとえば「fish」を「さかな」と読ませるようなやり方がベースになっている。中国語から文字と意味をもらって読み方を日本語から与えた感じだ。・・・この結果、ひとつの単語が前後関係により違う読み方をすることになり、日本語にも発音記号に相当する「ふりがな」が必要になっている。
  • 日本語は言語としては非常に腐っていることを自覚すべきだ。というか僕はこんな日本語くらいしか満足に扱えない自分をとても恥ずかしく思う。全然誇れない。・・・日本語には歴史があるから、その点だけは誇っていいかもしれないけど、歴史があるとか由緒正しいとかいうのは「フィートは足の長さを基にしてできた単位なんですよ」程度の意味しかない。いくら日本や日本の文化を愛しているとしても、日本語が理想の言語としては他の言語よりもはるかに劣るのは明白だから、これを「いいもの」だとはいえない。いやはっきりと劣っていると認めざるを得ない。そして僕としては劣っているものを誇ることはできない。
  • 扱いにくい単位系をあえて使うと、単位の換算に余計な労力を使うから、その分だけ非生産的である。同じように、こんな劣った言語で苦労すると(敬語の使い方とか、らぬきことばはいけないとか、漢字の書き取りテストの勉強時間とか、みんな少しは苦労したことがあるはず)その分時間を無駄にするだけでいいことはない。その時間をほかの事に使ったらきっともっとよくなるはずである。
  • もちろん日本の文化をなくしてしまえとはいっていない。今の現代語を「古文2」とでもして残しておくべきだ。でも日本が寸・尺・里を古い文章の中に封印したように、そして口語と文語を統一(というか口語に一本化した)ように、今の日本語もやがては日常会話から葬り去られる「べき」ものである。それができないようなら、日本語は生き残ることはないだろう(たぶん英語にのっとられる)。まあどちらにせよ今の日本語は消えることに違いはないんだけど。
  • そしてこんなダメな日本語をさしたる考えもないまま「すばらしいですね」とかいうことは、日本語の改良を妨げるだけだ。ダメなものをダメといわないのは非生産的である。→boyaki_a/00031の(2)

(4) 2008.08.05追記

  • 結局のところ、日本語も徐々に英語由来の外来語が増えているし、日本人同士でさえたとえば日本語で「力強く」といえば十分なときでも「powerfulに」とかいったりしてきているので、やがては日本語はなくなると思う。それでいい。
  • しかし英語が理想の言語かというともちろんそうじゃない。かといって、エスペラントやトキポナやソルレソルに移行していくかというと、そうなりそうな気配はまだない。こういう大幅な変革はやはり受け入れられにくいのだと思う。それでベーシック英語みたいなアプローチがあるんだろう。
  • それで、ベーシック英語の先のあるものを考えてみたんだけど、「please」を「plz」と書いたり、「thanks」を「thx」と書いたり、「you」を「U」と書く、チャットなどでの極めてくだけた書き方へ進むのがとりあえずはいいんじゃないかと思った。これで頻度の高い単語の文字長は大幅に短くなる。そしてさらにその先としては、最終的には英語のスペルが発音と完全対応して、発音記号が辞書から不要になればいいと思う。

こめんと欄

  • 「30日でできる!言語自作入門」とかないかなあ。僕にはこの分野の知識がないので考えを深められない・・・。ここでいう言語はコンパイラやインタプリタじゃないですよ(笑)。 -- K 2007-07-28 (土) 15:19:29

コメントお名前NameLink

リロード   新規 編集 差分 添付   トップ 一覧 検索 最終更新 バックアップ   ヘルプ   最終更新のRSS
Last-modified: 2008-08-05 (火) 13:20:32 (4869d)