研究社 会社案内 採用情報 サイトマップ 書店様向け 教育現場向け

研究社 WEB マガジン Lingua リンガ

 

 

リレー連載

 実践で学ぶ  コーパス活用術

29

砂川 有里子

コーパス準拠の日本語学習辞書

― 多義語の語釈と語義の配列順 ――

© (WT-shared) Matthew 6476

 

 前回は、日本語の辞書開発にコーパスを活用する試みの事例として、オンラインの学習辞書「日本語教育語彙表」と「基本動詞ハンドブック」を紹介し、辞書開発にコーパスを活用するためのツールとして NINJAL-LWP for BCCWJ(NLB)NINJAL-LWP for TWC(NLT)の使い方を説明しました。今回は多義語の語釈と語義の配列順の決定という問題に関連して、「基本動詞ハンドブック」での多義動詞の記述にコーパスの威力がどのように発揮されるのかを見ていくことにします。

 

 1  日本語学習者の悩み

 日本語学習を始めた初期の頃は、限られた語彙の知識しか持ち合わせていないために、単語の使い分けに悩むことはそう多くありません。しかし、レベルが上がるにつれて語彙が豊富になり、さまざまな状況に応じた日本語の使い分けをしなければならなくなります。例えば、「知る」と「分かる」を初級段階で習ったときには「その話を知っていますか」や「日本語が分かりますか」など、ごく限られた意味と用法だけを知っていればよかったのですが、中級以上になると「友達に聞いて知った/分かった」「彼なら知ってるさ/分かってるさ」など、どちらも使える用法に接するようになり、その微妙な使い分けが問題になります。さらに、「あなたの気持ちはよく分かります/×知ります」「テレビ見てないから、そんな事件があったこと全然知らなかった/×分からなかった」など、どちらかひとつしか使えない意味や用法も学ばなければならなくなり、混乱と誤用が生じます。初級の段階で学ぶ基本的な語彙というのは、上級レベルで学ぶ語彙に比べて多くの意味や用法を有する多義語であることが多いのです。そのため、知っていると思っていた初級の語彙なのに、中級・上級になってから悩まされるといったことが少なくありません。「基本動詞ハンドブック」は、初級レベルで学ぶ基本的な動詞を取り上げて、その意味や用法を詳細に記述し、図解やアニメなどを活用して、レベルの進んだ学習者や日本語教師に基本動詞の複雑な意味と用法を分かりやすく解説することを目指しています。

 以下では「基本動詞ハンドブック」で扱った「かぶる」という動詞の語釈と、「下げる」という動詞の語義の配列順という二つの問題を取り上げて、これらの解決にコーパスがどのように役立つのかを見ていきます。

 

 2  語釈にコーパスを利用する
2.1 「かぶる」の語釈――国語辞典の場合

 コーパスが活用される以前は、辞書の執筆者が苦労して集めた用例の分析と執筆者の言語直観や分析力に頼って語釈が考えられていました。そのため、実際には使われている用法でも執筆者に気づかれないため記載されなかったり、すでに使われなくなっているのにいつまでも記載され続けたりといった問題が生じます。例えば「かぶる」という動詞では、「帽子をかぶる」「船が波をかぶる」のような他動詞についてはともかく、「机の上にうっすらと埃がかぶっていた」「予定がかぶっちゃった」など、自動詞として使われる場合は十分な語釈が立てられているとは言えません。そこで、以下では「かぶる」の自動詞の用法を国語辞典がどのように記述しているのかを見てみることにしましょう。表1は A から G までの小型の国語辞典7種が自動詞「かぶる」にどのような語釈を与えているかをまとめたものです。

表1. 国語辞典の記述 自動詞としての「かぶる」
第1 第2 第3
A 写真の画面が、フィルムの欠陥、現像の失敗、露出過度などが原因で黒っぽくぼやける。    
B 写真で、露出過度のために画面がぼやける。「フィルムが−」    
C 〔写真で〕現像の失敗、露出過度などのため、フィルム・印画紙がくもる。    
D 〔露出が過ぎて〕乾板・フィルムが曇る。 〔波のために〕船が揺れる。  
E 写真で、現像処理の失敗や露出過多などのためにフィルムや印画紙が曇って見える。「この写真は−っている」 [俗]重なる。「予定が−」  
F 写真の画面が露出過度などでぼやける。 〔荒波をかぶって〕船がゆれる。 [俗]〔同じような物事が〕かさなる。「話の筋が−」
G 〔写真で〕露出が過ぎて、画面がぼやける。 〔荒波のために〕船がゆれる。がぶる。 [俗]かさなる。ダブる。「声が−」「会議の時間が−」

 ブルーで示したのは「写真が露出過度などのためぼやける」という意味、グリーンで示したのは「波で船が揺れる」という意味、オレンジで示したのは「ものが重なる」という意味です。そのうちのブルーの語釈は7種全ての辞典が記載していますが、グリーンオレンジの語釈については、記載していないもの、どちらか一方しか記載していないもの、二つとも記載しているものといったように、辞書によって扱いはさまざまです。そこで、前回の記事で使い方を説明した NLBNLT を用いて、BCCWJ や TWC で実際にどのような自動詞の用例が出現しているのかを確認してみることにしましょう。

2.2 「かぶる」の語釈――国語辞典の再検討

 まず、NLBNLT の「…が被る」というコロケーションの用例を使って、ブルーの「写真が露出過度などのためにぼやける」という意味の用例を探してみます。その結果、NLB, NLT ともに、純粋にこの意味で使われている用例はひとつもないことが分かりました。[1] 似た意味としては「ホワイトバランスのモードが違っていたので、少し赤がかぶってます」のように、「もとの色に別の色が重なる」という例や、「テレビなどのメディアでもその画像に霊体がかぶります」のように「もとの画像に別の画像が重なる」という意味を表す用例が見られました。一方、「板書に体がかぶっている」のように、「ものに別のものが重なる」という例も見られましたので、これら全てをまとめて、「もとのものに別のものが重なって、もとのものを見えにくくする」といった語釈を立てることができます。いずれにしろ、「写真が露出過度などのためにぼやける」という語釈は廃止すべきでしょう。

 次に、グリーンの「波で船が揺れる」の意味を持つ用例を探してみたところ、「船」と「かぶる」が共起する例(「小船が波をかぶる」など)はありましたが、全て他動詞として使われているもので、自動詞として「かぶる」が使われている用例はひとつもありませんでした。1億語や11億語のコーパスを探してもなかったのですから、この意味ではほとんど使われていないと考えてよさそうです。小型の国語辞典からは「波で船が揺れる」という語釈を削除すべきであると思います。

 最後に、オレンジの「ものが重なる」という意味の用例を探してみます。これに類する用例は、すでに挙げた「ものに別のものが重なる」という例がありますが、そのような目に見えるものの重なりとは違い、「意見」や「予定」や「声」のように目に見えないものが重なる例がたくさん見つかりました。これらは次の2種に分けられます。どちらも当事者にとって不都合な事柄を表しています。

(1) 複数のものの全体、または一部に重なりや共通点がある。
「客層がかぶっている」
「意見がかぶっている」
「バイトのシフトが授業とかぶった」など。

(2) ある音声が発生するのと同時、または進行中に、他の音声が発生、進行する。
「複数の声がかぶって、聞き分けられない」
「自分の声と相手の声がかぶって聞きにくい」
「ナレーションと曲がかぶって聞こえない」など。

小型の国語辞典であれば、これら二つの意味に関して「ものの全体や一部に類似した別のものが重なって不都合が生じる」のようなひとつの語釈にまとめてもいいかもしれません。

 以上、7種の国語辞典に記載されていた語釈をコーパスで確認し、7種全ての辞典が採用している「写真が露出過度などのためにぼやける」という語釈や3種の辞典が採用している「波で船が揺れる」という語釈は廃止すべきであることが分かりました。また、3種の辞典しか扱っていない「ものが重なる」という語釈については、数多くの用例がみつかったことから、全ての辞典でこの意味を取り上げるべきであること、そして、目に見えるものが重なる場合にも用いられる点やあまりよい意味では用いられない点などに関してもう少し詳しい記述が必要であることが分かりました。このように、辞書の記述にコーパスを活用すれば、内省だけでは気づきにくいさまざまな現象に目配りすることが可能となり、より精緻な語釈や使われなくなった語義の発見ができるようになります。また、次に述べるように、新語義の発見につながることも少なくありません。

2.3 「かぶる」の語釈――新語義の発見

 自動詞「かぶる」に関して、前の節で7種の国語辞典を観察しましたが、コーパスの用例を丹念に見ていくと、これら7種のどれにも扱われていない意味の用例があることに気づきます。以下の四つは、NLBNLT の「…が被る」というコロケーションの用例リストから見いだした語義と用例です。

(1) 粉や液体状のものが他のものの上に広がる。
「山の頂きには雪がかぶり
「商品にホコリがかぶっていませんか」
「波が岩にかぶっても」

(2) 身体やものの一部が前傾したり下向きになったりする。
「ヒザが後ろに逃げた分、上体がかぶり気味になって」
「右肩が被らない様に右肩、右ひじ、右手の動きを意識すると全然安定します」

(3) 同一と考えられていなかったものが実は同一のものである。
「親友と好きな人がかぶった
「北陸新幹線が開業すると、直江津付近〜金沢間で運転区間が被る

(4) 好ましくない影響や負担が人に及ぶ。
「裏目に出たら、責任が一挙にかぶってきます」
「自治体に一番に被害が被るのに」

 コンピュータは大容量のコーパスを瞬時に処理してくれますが、語や文の意味の判別まではしてくれません。したがって、ここで取り上げたような調査を行うには、コーパスから検索した大量の用例を一つひとつ目で確かめて意味の判別をするという地道な作業が必要になります。コーパスが最も威力を発揮するのは量的な分析ですが、コーパスを活用した質的な分析も、人間の内省では見落としてしまうさまざまな問題に気づかせてくれる有力な研究方法なのです。

 

 3  語義配列にコーパスを利用する
3.1 「基本動詞ハンドブック」の語義配列

 学習辞書での語義配列は、頻度を重視し、よく使われている語義から先に配列するものと、中心義を先に記述し、その後に派生義の記述へと進むものとがあります。「基本動詞ハンドブック」は後者の方法を採用し、さらに、語義間のネットワークを枝分かれ図の多義ネットワークで示します。図1は「飛ぶ」の多義ネットワークです。数字の上にカーソルを合わせると、図2に示したように、それぞれの語義ラベルが表示されます。

図1. 「飛ぶ」の多義ネットワーク
図2. 多義ネットワークの意味表示

 以下では「下げる」という動詞を取り上げて多義語の配列順の決定にコーパスが利用できることを見てみたいと思います。

3.2 「下げる」の語義配列――国語辞典の場合

 国語辞典での「下げる」の記述は、辞典によって語義の数、語釈の内容、語義の配列順が大きく異なっています。その中で、比較的似通った語釈を立てている国語辞典を取り上げて、その配列順を観察することにします。

 表2は「下げる」の数ある語義のうち、第1義から第3義までの語釈が比較的似通っている小型の国語辞典の記述を示したものです。辞典 X は並列的な記述を行っていますが、辞典 Y と Z は階層的な記述を行っています。ブルーで示したのは「ある場所に固定して垂らす」、オレンジで示したのは「手・腰・肩などから垂らす」、グリーンで示したのは「低い位置へ移動する」という意味です。

表2. 国語辞典の記述 「下げる」
第1 第2 第3
X 上部と固定し他方が下にたれるようにして取り付ける。「軒下に提灯を−」 手・肩・腰などで支えて下に垂らす。ぶら下げる。また、そのようにして引き連れる。「買い物かごを手に−」 物の位置を上から下に移動させる。「柱時計の位置を−」「銃口を−」
Y (1) 〔モノヲ、トコロカラ(ニ)〕物の一端を固定して下方に垂らす。 (2) 〔モノヲ〕低い位置に移す。また、物や体の一部、または一方を低くする。「文頭を一字下げて書く」 
(ア) ある場所に固定して垂らす。 (イ) 手に握ったり身につけたりして持つ。
Z (1) 〔何かに付いている、また、何かに属している〕物の位置を低くする。
(ア) 位置を上から下へかえる。「機頭を−・げる」 (イ) 一定の場所にかけて・垂らす(つるす)。「風鈴を−・げる」 (ウ) 携帯・携行するために、手に持って(身につけて)ぶらぶらさせる。「かごを−・げた女性」

3.3 「下げる」の中心義――頻度との関わり

 中心義とは、「母語話者の頭の中で中心にあると考えられる意義」であり、「一般に具体性が高く、認知されやすく、用法上の制約を受けにくい」という性質を持ちます。[2] 「飛ぶ」という動詞であれば、「飛行機が飛ぶ」や「花粉が飛ぶ」よりも、まず「鳥が飛ぶ」を思い起こすと思いますが、このように「最も確立されていて、認知的際立ちが高く、また、最初に習得され、中心的なコンテクストで最も活性化されやすい」[3] という特徴を有する「プロトタイプ的意味」を持つ語義を第1義に立てる必要があります。その決定には、頻度、用法上の制約、意味の具体性、認知のしやすさといったさまざまな要因を複合的に考えて決める必要がありますが、その中で最も客観的なデータを提供してくれるのが、頻度です。そこで、NLT を使って、すでに述べた「下げる」の三つの意味を表す用例の頻度を調査しました。表3がその結果です。

表3. NLT の頻度
ある場所に固定して垂らす 140
手・腰・肩などから垂らす 115
低い位置へ移動する 5,962

この表から「ある場所に固定して垂らす」と「手・腰・肩などから垂らす」の二つの頻度には大差ありませんが、「低い位置へ移動する」という意味での頻度が突出して大きいことがわかります。このように、頻度はどの意味がより基本的であるのかの重要な手がかりを与えてくれます。

 しかし、すでに述べたように、中心義の決定には、頻度のほかに、用法上の制約、意味の具体性、認知のしやすさといったさまざまな要因を考える必要があります。頻度だけを考慮に入れるのなら、「温度を下げる」「給料を下げる」など、「程度や数量などを低くする」という抽象度の高い意味の使用のほうがはるかに多く、NLT の調査では18,670回も出現しています。しかし、ものの物理的な移動を表す「低い位置へ移動する」という語義のほうが、より具体的であり、より認知が容易であると考えられますから、「下げる」の中心義としてはこちらのほうを採用すべきでしょう。

図3. 「下げる」の多義ネットワーク

 頻度はひとつの重要な目安ではありますが、語義配列を決めるにはそのほかの要因も考慮に入れた総合的な判断が必要となるわけです。

 以上を考慮して、「基本動詞ハンドブック」の「下げる」の項では、「低い位置への移動」を第1義、「ある場所に固定して垂らす」という意味の「垂直方向に設置」を第2義、「手・腰・肩などから垂らす」という意味の「垂直方向に維持」を第3義とし、頻度が非常に高い「数量の減少」という意味は、より具体的な「後方に移動」と「目立たない所に移動」という意味を介して第6義に位置づけられています。

 

〈参考文献〉

瀬戸賢一(2005)『よくわかる比喩――ことばの根っこをもっと知ろう』研究社。

籾山洋介・深田智(2003)「第4章 多義性」松本曜編『認知意味論』大修館書店、pp. 135-86.

 

 

〈著者紹介〉

砂川 有里子(すなかわ ゆりこ)

筑波大学名誉教授。筑波大学にて博士(言語学)を取得。専門は日本語学、談話分析、日本語教育。編著の辞書は『日本語文型辞典』(くろしお出版)と『明鏡国語辞典』(大修館書店)。単著の著書は『文法と談話の接点――日本語の談話における主題展開機能の研究』(くろしお出版)、共著の著書は『日本語教育研究への招待』(くろしお出版)、『日本語教育のためのコーパス調査入門』(くろしお出版)、『文法・談話研究と日本語教育の接点』(くろしお出版)、『モダリティと言語教育』(ひつじ書房)、Storytelling across Japanese Conversational Genre(John Benjamins)などがある。

 

 


〈注〉

[1] NLT では「写真が青かぶりしてしまった」「写真が色かぶりしてしまった」という2例が見いだされましたが、どちらも「青かぶり」「色かぶり」という複合名詞の形になっており、動詞「かぶる」の例とは見なせません。

[2] 瀬戸(2005)、p.100を参照。

[3] 籾山・深田(2003)、p.169を参照。


 

 

関連書籍
『よくわかる比喩――ことばの根っこをもっと知ろう』

キーワードで書籍検索
コーパス corpus コロケーション 類義語 多義 日本語

▲ページトップに戻る

複写について プライバシーポリシー お問い合わせ

Copyright(C)Kenkyusha Co., Ltd. All Rights Reserved.