前回は、日本語の辞書開発にコーパスを活用する試みの事例として、オンラインの学習辞書「日本語教育語彙表」と「基本動詞ハンドブック」を紹介し、辞書開発にコーパスを活用するためのツールとして NINJAL-LWP for BCCWJ(NLB)と NINJAL-LWP for TWC(NLT)の使い方を説明しました。今回は多義語の語釈と語義の配列順の決定という問題に関連して、「基本動詞ハンドブック」での多義動詞の記述にコーパスの威力がどのように発揮されるのかを見ていくことにします。
日本語学習を始めた初期の頃は、限られた語彙の知識しか持ち合わせていないために、単語の使い分けに悩むことはそう多くありません。しかし、レベルが上がるにつれて語彙が豊富になり、さまざまな状況に応じた日本語の使い分けをしなければならなくなります。例えば、「知る」と「分かる」を初級段階で習ったときには「その話を知っていますか」や「日本語が分かりますか」など、ごく限られた意味と用法だけを知っていればよかったのですが、中級以上になると「友達に聞いて知った/分かった」「彼なら知ってるさ/分かってるさ」など、どちらも使える用法に接するようになり、その微妙な使い分けが問題になります。さらに、「あなたの気持ちはよく分かります/×知ります」「テレビ見てないから、そんな事件があったこと全然知らなかった/×分からなかった」など、どちらかひとつしか使えない意味や用法も学ばなければならなくなり、混乱と誤用が生じます。初級の段階で学ぶ基本的な語彙というのは、上級レベルで学ぶ語彙に比べて多くの意味や用法を有する多義語であることが多いのです。そのため、知っていると思っていた初級の語彙なのに、中級・上級になってから悩まされるといったことが少なくありません。「基本動詞ハンドブック」は、初級レベルで学ぶ基本的な動詞を取り上げて、その意味や用法を詳細に記述し、図解やアニメなどを活用して、レベルの進んだ学習者や日本語教師に基本動詞の複雑な意味と用法を分かりやすく解説することを目指しています。 以下では「基本動詞ハンドブック」で扱った「かぶる」という動詞の語釈と、「下げる」という動詞の語義の配列順という二つの問題を取り上げて、これらの解決にコーパスがどのように役立つのかを見ていきます。
コーパスが活用される以前は、辞書の執筆者が苦労して集めた用例の分析と執筆者の言語直観や分析力に頼って語釈が考えられていました。そのため、実際には使われている用法でも執筆者に気づかれないため記載されなかったり、すでに使われなくなっているのにいつまでも記載され続けたりといった問題が生じます。例えば「かぶる」という動詞では、「帽子をかぶる」「船が波をかぶる」のような他動詞についてはともかく、「机の上にうっすらと埃がかぶっていた」「予定がかぶっちゃった」など、自動詞として使われる場合は十分な語釈が立てられているとは言えません。そこで、以下では「かぶる」の自動詞の用法を国語辞典がどのように記述しているのかを見てみることにしましょう。表1は A から G までの小型の国語辞典7種が自動詞「かぶる」にどのような語釈を与えているかをまとめたものです。
ブルーで示したのは「写真が露出過度などのためぼやける」という意味、グリーンで示したのは「波で船が揺れる」という意味、オレンジで示したのは「ものが重なる」という意味です。そのうちのブルーの語釈は7種全ての辞典が記載していますが、グリーンとオレンジの語釈については、記載していないもの、どちらか一方しか記載していないもの、二つとも記載しているものといったように、辞書によって扱いはさまざまです。そこで、前回の記事で使い方を説明した NLB と NLT を用いて、BCCWJ や TWC で実際にどのような自動詞の用例が出現しているのかを確認してみることにしましょう。
まず、NLB と NLT の「…が被る」というコロケーションの用例を使って、ブルーの「写真が露出過度などのためにぼやける」という意味の用例を探してみます。その結果、NLB, NLT ともに、純粋にこの意味で使われている用例はひとつもないことが分かりました。[1] 似た意味としては「ホワイトバランスのモードが違っていたので、少し赤がかぶってます」のように、「もとの色に別の色が重なる」という例や、「テレビなどのメディアでもその画像に霊体がかぶります」のように「もとの画像に別の画像が重なる」という意味を表す用例が見られました。一方、「板書に体がかぶっている」のように、「ものに別のものが重なる」という例も見られましたので、これら全てをまとめて、「もとのものに別のものが重なって、もとのものを見えにくくする」といった語釈を立てることができます。いずれにしろ、「写真が露出過度などのためにぼやける」という語釈は廃止すべきでしょう。 次に、グリーンの「波で船が揺れる」の意味を持つ用例を探してみたところ、「船」と「かぶる」が共起する例(「小船が波をかぶる」など)はありましたが、全て他動詞として使われているもので、自動詞として「かぶる」が使われている用例はひとつもありませんでした。1億語や11億語のコーパスを探してもなかったのですから、この意味ではほとんど使われていないと考えてよさそうです。小型の国語辞典からは「波で船が揺れる」という語釈を削除すべきであると思います。 最後に、オレンジの「ものが重なる」という意味の用例を探してみます。これに類する用例は、すでに挙げた「ものに別のものが重なる」という例がありますが、そのような目に見えるものの重なりとは違い、「意見」や「予定」や「声」のように目に見えないものが重なる例がたくさん見つかりました。これらは次の2種に分けられます。どちらも当事者にとって不都合な事柄を表しています。
(1) 複数のものの全体、または一部に重なりや共通点がある。
(2) ある音声が発生するのと同時、または進行中に、他の音声が発生、進行する。 小型の国語辞典であれば、これら二つの意味に関して「ものの全体や一部に類似した別のものが重なって不都合が生じる」のようなひとつの語釈にまとめてもいいかもしれません。 以上、7種の国語辞典に記載されていた語釈をコーパスで確認し、7種全ての辞典が採用している「写真が露出過度などのためにぼやける」という語釈や3種の辞典が採用している「波で船が揺れる」という語釈は廃止すべきであることが分かりました。また、3種の辞典しか扱っていない「ものが重なる」という語釈については、数多くの用例がみつかったことから、全ての辞典でこの意味を取り上げるべきであること、そして、目に見えるものが重なる場合にも用いられる点やあまりよい意味では用いられない点などに関してもう少し詳しい記述が必要であることが分かりました。このように、辞書の記述にコーパスを活用すれば、内省だけでは気づきにくいさまざまな現象に目配りすることが可能となり、より精緻な語釈や使われなくなった語義の発見ができるようになります。また、次に述べるように、新語義の発見につながることも少なくありません。
自動詞「かぶる」に関して、前の節で7種の国語辞典を観察しましたが、コーパスの用例を丹念に見ていくと、これら7種のどれにも扱われていない意味の用例があることに気づきます。以下の四つは、NLB と NLT の「…が被る」というコロケーションの用例リストから見いだした語義と用例です。
(1) 粉や液体状のものが他のものの上に広がる。
(2) 身体やものの一部が前傾したり下向きになったりする。
(3) 同一と考えられていなかったものが実は同一のものである。
(4) 好ましくない影響や負担が人に及ぶ。 コンピュータは大容量のコーパスを瞬時に処理してくれますが、語や文の意味の判別まではしてくれません。したがって、ここで取り上げたような調査を行うには、コーパスから検索した大量の用例を一つひとつ目で確かめて意味の判別をするという地道な作業が必要になります。コーパスが最も威力を発揮するのは量的な分析ですが、コーパスを活用した質的な分析も、人間の内省では見落としてしまうさまざまな問題に気づかせてくれる有力な研究方法なのです。
学習辞書での語義配列は、頻度を重視し、よく使われている語義から先に配列するものと、中心義を先に記述し、その後に派生義の記述へと進むものとがあります。「基本動詞ハンドブック」は後者の方法を採用し、さらに、語義間のネットワークを枝分かれ図の多義ネットワークで示します。図1は「飛ぶ」の多義ネットワークです。数字の上にカーソルを合わせると、図2に示したように、それぞれの語義ラベルが表示されます。
以下では「下げる」という動詞を取り上げて多義語の配列順の決定にコーパスが利用できることを見てみたいと思います。
国語辞典での「下げる」の記述は、辞典によって語義の数、語釈の内容、語義の配列順が大きく異なっています。その中で、比較的似通った語釈を立てている国語辞典を取り上げて、その配列順を観察することにします。 表2は「下げる」の数ある語義のうち、第1義から第3義までの語釈が比較的似通っている小型の国語辞典の記述を示したものです。辞典 X は並列的な記述を行っていますが、辞典 Y と Z は階層的な記述を行っています。ブルーで示したのは「ある場所に固定して垂らす」、オレンジで示したのは「手・腰・肩などから垂らす」、グリーンで示したのは「低い位置へ移動する」という意味です。
中心義とは、「母語話者の頭の中で中心にあると考えられる意義」であり、「一般に具体性が高く、認知されやすく、用法上の制約を受けにくい」という性質を持ちます。[2] 「飛ぶ」という動詞であれば、「飛行機が飛ぶ」や「花粉が飛ぶ」よりも、まず「鳥が飛ぶ」を思い起こすと思いますが、このように「最も確立されていて、認知的際立ちが高く、また、最初に習得され、中心的なコンテクストで最も活性化されやすい」[3] という特徴を有する「プロトタイプ的意味」を持つ語義を第1義に立てる必要があります。その決定には、頻度、用法上の制約、意味の具体性、認知のしやすさといったさまざまな要因を複合的に考えて決める必要がありますが、その中で最も客観的なデータを提供してくれるのが、頻度です。そこで、NLT を使って、すでに述べた「下げる」の三つの意味を表す用例の頻度を調査しました。表3がその結果です。
この表から「ある場所に固定して垂らす」と「手・腰・肩などから垂らす」の二つの頻度には大差ありませんが、「低い位置へ移動する」という意味での頻度が突出して大きいことがわかります。このように、頻度はどの意味がより基本的であるのかの重要な手がかりを与えてくれます。 しかし、すでに述べたように、中心義の決定には、頻度のほかに、用法上の制約、意味の具体性、認知のしやすさといったさまざまな要因を考える必要があります。頻度だけを考慮に入れるのなら、「温度を下げる」「給料を下げる」など、「程度や数量などを低くする」という抽象度の高い意味の使用のほうがはるかに多く、NLT の調査では18,670回も出現しています。しかし、ものの物理的な移動を表す「低い位置へ移動する」という語義のほうが、より具体的であり、より認知が容易であると考えられますから、「下げる」の中心義としてはこちらのほうを採用すべきでしょう。
頻度はひとつの重要な目安ではありますが、語義配列を決めるにはそのほかの要因も考慮に入れた総合的な判断が必要となるわけです。 以上を考慮して、「基本動詞ハンドブック」の「下げる」の項では、「低い位置への移動」を第1義、「ある場所に固定して垂らす」という意味の「垂直方向に設置」を第2義、「手・腰・肩などから垂らす」という意味の「垂直方向に維持」を第3義とし、頻度が非常に高い「数量の減少」という意味は、より具体的な「後方に移動」と「目立たない所に移動」という意味を介して第6義に位置づけられています。
〈参考文献〉 瀬戸賢一(2005)『よくわかる比喩――ことばの根っこをもっと知ろう』研究社。 籾山洋介・深田智(2003)「第4章 多義性」松本曜編『認知意味論』大修館書店、pp. 135-86.
〈注〉
|