研究社 会社案内 採用情報 サイトマップ 書店様向け 教育現場向け

研究社 WEB マガジン Lingua リンガ

 

 

リレー連載

 実践で学ぶ  コーパス活用術

12

石田 プリシラ

日本語コーパスに見られる慣用句の用法

© (WT-shared) Matthew 6476

 

 今月から2回にわたり、日本語のコーパスが慣用句の研究のためにどのように活用できるかをテーマとします。今月は、コーパスによって、辞書を引いただけではわからないような慣用句の用法上の傾向が明らかになるということを示します。

 

 1  慣用句の用法

 慣用句[1] の「用法」とは何かを説明するにあたり、まず「目を盗む」を例とします。この慣用句が普通どのように使われるかを日本語の母語話者に聞いてみると、「親の目を盗んで、タバコを吸っている」や、「先生の目を盗んで、教科書に落書きしていた」などの例をあげる人が多いです。「親の目を盗んだ」や「先生の目を盗んでいた」という人はいません。また、新聞や小説などの実例を集めてみれば、「審判の目を盗んで泳法違反をした」といった形をとるものが圧倒的に多いことがわかります。BCCWJ という日本語コーパスにおいては(詳細は後述)、95例のうち、81例も「目を盗んで 〜 をする」というパターンのものです。

 このように、「目を盗む」には「 〜 て」の形でよく使われる、といった活用形の偏りがあります。[2] これは特殊な例ではなく、多くの慣用句には、活用形や文型の偏り、また、特に好まれている共起語があります。一つ一つの慣用句がどのように使われているかということや、どのような用法上の傾向があるかということを調べるために、コーパスは非常に役に立ちます。以下、「現代日本語書き言葉均衡コーパス(BCCWJ)」という日本語コーパスの構成や検索方法を紹介してから、「舌を巻く」と「あっけにとられる」といった慣用句を例として、コーパスから慣用句の用法についてどのようなことがわかるかを示していきます。

 

 2  「現代日本語書き言葉均衡コーパス」(BCCWJ)
<http://www.ninjal.ac.jp/corpus_center/bccwj/>

 日本語コーパスは、英語コーパスと比べると、開発がかなり遅れていましたが、2011年8月に、「現代日本語書き言葉均衡コーパス(Balanced Corpus of Contemporary Written Japanese, 略称 BCCWJ)」がついに公開されました。国立国語研究所が5年間のプロジェクトで構築した、約105,000,000語を収録しているコーパスです。「現代日本語」を対象としており、データの刊行年代の幅は最大1971〜2008年です。「書き言葉」というのは、書籍、雑誌、新聞、白書、国会会議録、Yahoo! 知恵袋、Yahoo! ブログなどの、合計11種類のテキストタイプから構成されているものです。(書籍は一番多くて、BCCWJ の約6割を占めています。) また、様々なジャンルのテキストの無作為に抽出したサンプルから構成されていることから、「均衡コーパス」と言われています。日本語の特徴を調べられる均衡コーパスは、現在、これ以外のものは存在しません。

 BCCWJ は「KOTONOHA」という国立国語研究所の大規模プロジェクトに含まれているコーパスの一つです。このプロジェクトで、複数の書き言葉と話し言葉コーパスの構築を段階的に進めています。BCCWJ のほかに、明治・大正時代の雑誌を収録している「近代雑誌」のコーパス、および現代語の独話(講演など)を中心とした「日本語話し言葉コーパス(CSJ)」は既に公開されています。今後の計画としては、平安時代から現代までの文献を集めた「日本語歴史コーパス(CHJ)」、およびネット上の日本語のテキストを収録した「超大規模コーパス」を現在開発中です。KOTONOHA 計画の詳細に関しては、下記の URL を参照してください。

「KOTONOHA: 国語研究所のコーパス開発計画」
<http://www.ninjal.ac.jp/corpus_center/kotonoha.html>

 

 3  慣用句のオンライン検索

 BCCWJ は、オンラインと DVD 版で三つの方法で公開されています。ここでは、「少納言」と「中納言」という、無償で利用できるオンライン検索ツールを紹介します。[3]

「少納言」 <http://www.kotonoha.gr.jp/shonagon/>

 「少納言」は上記の URL からアクセスし、「利用条件」に同意すれば、すぐに BCCWJ の全文検索をすることができます。検索方法は「文字列検索」で、慣用句を検索する場合は、「検索文字列」の欄に「舌を巻」や「あっけに」などの、慣用句の一部を入力します(図1)。入力した文字列はそのまま検索され、その他の表記形は同時に検索されないので、漢字またはひらがなやカタカナで表記されているすべての用例を拾うためには、検索条件を変えて検索を複数回行うことが必要になります(例えば「舌を巻」と「舌をま」、「呆気に」と「あっけに」)。検索文字列の前後文脈は、正規表現を使えば、1回の検索で複数の条件を指定し、複数の活用形や共起語を同時に抽出することが可能です。[4] また、目的に応じて、検索対象の「メディア/ジャンル」や、刊行年代の「期間」を指定することができます。例えば、「メディア/ジャンル」を「書籍」と「新聞」に絞ったり、「期間」を「2000年代」や「1971年〜1975年」などにしたりすることが可能です。

図1. 「少納言」の検索画面
 

 検 索 ボタンをクリックしたら、無作為に抽出された用例500件までは、「検索文字列」を中心としたコンコーダンスラインとして表示されます(図2)。前文脈と後文脈それぞれ40字程度、および出典情報が表示されます。しかし、検索結果をダウンロードすることはできません。

図2. 「舌を巻く」の検索結果(少納言)
「中納言 1.1.0」 <http://www.ninjal.ac.jp/corpus_center/bccwj/subscription.html>

 「中納言」を使うためには、上記の URL から「申込書」と「利用許諾契約書」をダウンロードし、申請の手続きをします。[5] 手続きが終わったら、<https://chunagon.ninjal.ac.jp/login> の画面でログインし、自由に検索できます。

 検索方法としては、慣用句の構成語を「キー」とし、もう一つの構成語を「後方共起条件」として追加して検索します。例えば、「舌を巻く」を検索したい場合は、キー の下にあるプルダウンメニューから 語彙素 [6] を選び、「舌」と入力します(図3)。それから 後方共起条件の追加 をクリックし、語彙素 を選び、「巻く」と入力します。また、キーから 1 キーから 5 語以内 とします。そうすれば、「舌を巻く」の例だけでなく、「舌巻いた」のように、話し言葉的な用法で格助詞「を」が省略された例、また、句中に副詞などが挿入された例を1回の検索で拾うことができます。[7] できるだけ多くの用例を抽出するために、各検索条件を必要最小限の語彙素で指定します。

図3. 「中納言」の検索画面

 「語彙素」の検索は先の「文字列検索」とは違って、1回の検索で複数の表記形や活用形が抽出できます。例えば「呆気」をキーとした場合は、「呆気」「あっけ」「あっ気」のすべての用例が表示されます。「巻く」のような動詞の基本形を入力したら、1回の検索で「巻く/まく/巻いた/まいた/巻いている/巻いていた…」などの、様々な表記形や活用形が抽出されます。なお、中納言では、「前後文脈の語数」を10語から500語までと設定することが可能です。「コーパス情報」や「出典情報」の指定もできます。

 検索結果は、「キー」を中心としたコンコーダンスラインとして表示され、ダウンロードすることもできます。図4は、「舌を巻く」の検索結果のうち、「前文脈」「キー」「後文脈」のみを示した10件です(前後文脈は30語ずつ)。分析に入る前に、検索結果に目を通し、慣用句の使用例以外のものを除外します。例えば、「舌を巻いて発音する」のように、「身体部位である舌を丸める」といった文字通りの意味を表す例や、「『目の玉が飛び出る』『腰をぬかす』『舌を巻く』」のように、慣用句そのものを列挙している例は、慣用句の使用例ではないので、外します。

図4. 「舌を巻く」の検索結果(中納言)

 

 4  コーパスに見られる「あっけにとられる」と「舌を巻く」

 コーパスを利用することにより、個々の慣用句の活用形の偏り、文型の偏り、共起語の特徴などに気づきやすくなります。以下、BCCWJ から得られた「舌を巻く」と「あっけにとられる」の用例をもとに、それぞれの慣用句の用法にどのような傾向があるかを述べます。

「あっけにとられる」と「見る」系の動詞

 BCCWJ における「あっけにとられる」の用例はすべて「わたしは呆気にとられた」「美奈子はあっけにとられて、空を見る。」「工場長はあっけにとられていた」のように、「−られる」の受身表現が使われています(332件)。よって、この慣用句の「標準形」は受身表現であるといえます。

 この慣用句の活用形と後文脈を検討しますと、「あっけにとられ(て) 〜 をする」といったパターンが好まれることがわかります。この用法は「あっけにとられる」全件の3割強を占めています(332例のうち110例)。特に注目すべきは、「あっけにとられ(て)」の後に続く動詞は、「見る」や「眺める」などの、視覚的な認識を表す動詞が多いことです(110例のうち60例)。以下、BCCWJ から抽出した「あっけにとられて」の例の一部を示します(下線は筆者がつけました)。

(314〜325行)
あっけ に(取ら)れてそれを見ていると、なんと球審はセーフのジェスチャーをし
呆気   に(取ら)れて見詰めていると、急に恥しそうな表情になり咳払いをし
呆気   に(取ら)れて見送っている。 最初からいきさつを見ていた諸橋は、
呆気   に(取ら)れて後に付いていった。黒ずくめの男に枡席に案内さ
あっけ に(取ら)れて誰も口を開かなかった。広い宴会場のすべての人が
あっけ に(取ら)れて眺めていますと、大猿はよほどの力があるものか、
呆気   に(取ら)れて眺めていると、かれは忽ち蚊帳から這い出して来て、もと
あっ気 に(取ら)れて彼女の後ろ姿を見ていたが、自分の役目を思い出して
呆気   に(取ら)れて母を、それから父を見た。父はばつの悪
あっけ に(取ら)れて母親を見つめた。頭が変になってしまったの?
あっけ に(取ら)れて呆然と眺めていたけど、なんだか凄くヤバイことになり

 表1は、この慣用句に後続するすべての「見る」系の動詞を、出現数の降順に示したものです。なお、「あっけにとられ(て)」が「見る」系の動詞と共起しやすいことは、この慣用句により表現されている心理活動が「見る」という身体的な動作を伴いやすいことを示唆します。

表4. 「あっけにとられ(て)」に後続する「見る」系の動詞
動詞(辞書形) 動詞(辞書形)
見る 20 見合わせる  2
見つめる 11 見とれる  2
眺める 11 見返す  1
見送る  5 見回す  1
見上げる  3 凝視する  1
見守る  3    
    60
「あっけにとられる」と驚きの表情

 BCCWJ においては、「あっけにとられる」と「舌を巻く」は「あっけにとられた」(332例のうち119例)と「舌を巻いた」(86例のうち29例)のように、「 〜 た」の形がよく用いられています。このこと自体は興味深いとはいいがたいかもしれませんが、それぞれの慣用句で「 〜 た」の形がどのように使われているのかをさらに検討しますと、かなりはっきりした違いが見えてきます。「舌を巻いた」は「あまりの強さに、小泉首相も舌を巻いた。」のように、文末に使われることがほとんどです。一方、「あっけにとられた」は「星島はあっけにとられた。」のような文末用法のほかに、「家内はあっけにとられた顔で私を見た」のように、「顔」などの名詞の直前に置かれ、その名詞の修飾語として機能している場合もたくさんあります。以下は、BCCWJ から抽出した例の一部です。

(81〜91行)
               ですがねえ…。」 使用人は あっけ に(とら)れた顔つきで、首をひねっ
             、西日がきれいに染めていた。 あっけ に(とら)れた顔で、そこまでゆら
             と声をかけたりする母を道彦は あっけ に(とら)れた顔でまじまじと眺めて
             があるか」とどなった。家内は あっけ に(とら)れた顔で私を見た
             んだけど」 さすがの昇一も、 あっけ に(とら)れた顔になった。
ですから遠慮はいりません」 ファビエンヌは 呆気  に(とら)れた顔になった。
             離婚するというのは」 雪絵は 呆気  に(とら)れた顔になった。
                   たのを目にし、警備員が 呆気  に(とら)れた顔をした。
         ないでほしいの」 シバさんは一瞬 あっけ に(とら)れた顔をして、おずおず
             十蔵は目を剥いた。 新九郎も あっけ に(とら)れた顔を十蔵に向ける。
             立っていた。そして、私たちの あっけ に(とら)れた顔を眺めながら、にこやか

 上の例に加えて、「あっけにとられた表情」や「あっけにとられたような顔/表情」の用例も複数あります(「 〜 た+名詞」40例のうち合計24例)。よって、「あっけにとられる」には、「 〜 た(ような)顔/顔つき/表情」といった用法があるといえます。なお、この用法が好まれることから、「あっけにとられる」は、心の中の驚きが外にあらわれでること、つまり表出されることを表現しやすい傾向がある、ということがわかります。

「 〜 に舌を巻く」の「 〜 」

 BCCWJ における「舌を巻く」の前文脈に注目しますと、この慣用句は「クラークは、彼女の英語力に舌を巻いた」や「その筋力には舌を巻くしかない」のように、「名詞句+に」をとることが多いです。BCCWJ から抽出した用例の5割弱はこの文型です(86例のうち41例)。以下は、無作為に選んだ10例を示しました。

                                    クラークは、彼女の英語力に 舌 を(巻い)た。
                  一時間近く観察をつづけ、相手の追跡の巧みさに 舌 を(巻い)たが、
トーナメント・ホストのニクラスは、タイガーの多彩なゲーム運びに 舌 を(巻い)た。
                  森茂男教諭(四十四)も最近の部員の上達ぶりに 舌 を(巻く)。
          こうしてみると、改めてそのわかりやすいしゃべり口調に 舌 を(巻い)てしまいました。
                    「乾くんのバイクテクニックと専門知識にゃ、 舌 を(巻く)けどさ。
                                          その泰然自若ぶりには 舌 を(巻く)しかなかった。
                              外見に似合わぬしたたかさに加納は 舌 を(巻い)た。
            ひとりも落とさなかった。あまりの強さに、小泉首相も 舌 を(巻い)た。
                      嫌われてはいるが、カラスの賢さには人間も 舌 を(巻く)ほどだ。

 この文型は便宜的に「…が 〜 に舌を巻く」と示すことにします。「 〜 に」には、主体がなぜ舌を巻いたか、つまり主体の驚きや感心の原因を表す名詞句が用いられます。どのような名詞句なのかを検討しますと、先の「英語力」「巧みさ」「強さ」「筋力」「多彩なゲーム運び」のように、身体・精神的な能力や技術を表すものが使われる傾向が非常に強いです。

 また、「舌を巻く」の意味に「感心」や「感嘆」が含まれていると感じられるのは、この慣用句が上のような能力や技術を表す名詞句と共起しやすいことや、こういった名詞に対してプラス評価を表していることが原因と考えられます。

「 〜 と舌を巻く」

 BCCWJ における「舌を巻く」の前文脈をさらに検討しますと、先の「…が 〜 に舌を巻く」のほかに、「地元の警察は『指導件数が減った』舌を巻き…」のように、引用を示す「と」を伴っている用例があります。以下は、BCCWJ から抽出したすべての例です(86例のうち13例)。

      派大関も「上手のイメージが強く、二本差しは頭になかった」と 舌 を(巻い)た。 朝青龍、稀勢の里が
        の中でも五指に入るだろう。河勝も、赤檮には及びませぬ、と 舌 を(巻い)ており、今、馬子の警護隊
          れたのに相違ないが、あの若さで、よくもやりおおせたと、 舌 を(巻か)ない者はなかった。 しか
        するようになってきた。地元の警察は「指導件数が減った」と 舌 を(巻き)、大学や専門学校に進む生
        しつこく、あつかましい知財戦略には脱帽せざるを得ない」と 舌 を(巻く)。いやそれだからこそ、ア
      のが辛いんです」 まさか、と思ったり、これこそが青春よ、と 舌 を(巻く)気分になったり、まだ事態
        ていた。 家長はなぜか気圧された。堂々たるものだ、と彼は 舌 を(巻い)た。由々しい事態には違い
、あんなに書けるってすごいね、大体、ラテン語もあるし…」と息子が 舌 を(巻き)、私も大いに恐れ入った。
                。 (都の花にも、狂い咲きがあるのか)と、大椽は 舌 を(巻い)た。 (奥州の粗い風土に
        のである。こういう才能というのもあるのだなあ、と、密かに 舌 を(巻い)てしまうのである。刑務所
                にしても、恐るべき勘のよさだわ−と、由佳は密かに 舌 を(巻い)た。「困ります、そんなふ
あんなにスピードのある選手だとは思わなかった」とイチローの俊足に 舌 を(巻い)ている。 さらこの足を見
              「とにかく飛ばしますよ」と香田監督はそのパワーには 舌 を(巻く)。 北海道のチームの中で

 これらの例における「と」節は、「『指導件数が減った』」や「恐るべき勘のよさだわ−」のように、主体の言葉や考えを直接引用する形で、その人の驚きや感心の原因を表現します。この文型を便宜的に「…が『 〜 』と舌を巻く」と示しますが、先の「堂々たるものだ、と彼は舌を巻いた」のように「と」節を先にしたり、「『とにかく飛ばしますよ』と香田監督はそのパワーには舌を巻く」のように、「名詞句+に」を追加したりする場合があります。

 BCCWJ においては、この文型は「舌を巻く」全件の約1.5割を占めています。先の「…が 〜 に舌を巻く」といった文型(5割弱)に比べれば、使用率がやや低いですが、「あっけにとられる」などの、通常「と」節の文型をとらない慣用句に比べれば、この文型は「舌を巻く」の用法上の特徴の一つといえます。[8]

 

 5  むす

 以上、コーパスから個々の慣用句の用法に関する豊富な情報が得られることを示しました。どのような活用形や文型が好まれるか、どのような語句と一緒によく用いられるかなど、日本語の母語話者の直感や、手作業で集めた少数の用例だけではなかなか気づきにくい用法や傾向は、コーパスの用例を検討することにより、より容易に正確に把握できるようになります。

 また、コーパスから得られた情報をどのように役立てられるかというと、慣用句辞典にこうした情報を反映させることが重要な使い道として考えられます。辞典の役目の一つは、語句の用法を示すことなので、慣用句辞典を作る際には、コーパスから抽出した用例の量的な傾向を参考の上で、各慣用句の意味と用法を記述することが望ましいです。これまでにも、新聞や小説の実例を手掛かりに各慣用句の文型や用法の特徴に関する詳細な情報を盛り込んでいる辞典が、少ないながら、存在します(例えば、宮地裕編の『慣用句の意味と用法』(明治書院1982)や、米川明彦・大谷伊都子編の『日本語慣用句辞典』(東京堂2005))。今後は、大規模のコーパスを活用した慣用句辞典の開発が期待されます。

 

〈参考文献〉

Ishida, Priscilla (2011) “Corpus Data and the Treatment of Idioms in Japanese Monolingual Dictionaries.” In: Research on Phraseology in Europe and Asia: Focal Issues of Phraseological Studies (Vol. 1). Szerszunowicz, Joanna et al. (eds.). University of Bialystok Publishing House, pp. 101-27.

滝沢直宏(2007)「言語の慣習性とコーパス」『2007年日語教学国際会議論文集』61-73.

前川喜久雄(2008)「KOTONOHA『現代日本語書き言葉均衡コーパス』の開発」『日本語の研究』4.1: 82-94.

宮地裕(1982)「慣用句解説」『慣用句の意味と用法』238-65. 明治書院

宮地裕(1999)「慣用句の表現」『敬語・慣用句表現論―現代語の文法と表現の研究(二) 』213-339. 明治書院

 

 

〈著者紹介〉

石田 プリシラ(いしだ ぷりしら)

筑波大学人文社会系(文芸・言語専攻)准教授。カナダの出身。2002年に筑波大学で言語学博士号を取得。専門は慣用句論と日英対照研究で、言語教育や辞書学にも興味・関心がある。主な著書・論文として、「日英対照研究と日本語教育―対照研究の方法と視点」(『日本語教育研究への招待』〔分担著〕、くろしお出版、2010)、“Contrastive Idiom Analysis: The Case of Japanese and English Idioms of Anger” (Phraseology: An Interdisciplinary Perspective 〔共著〕, John Benjamins, 2008), 「動詞慣用句の意味的固定性を計る方法―統語的操作を手段として」(『国語学』55.4,〔単著〕、2004)など。

 

 


〈注〉

[1] 宮地(1982: 238)によれば、慣用句とは「単語の二つ以上の連結体であって、その結びつきが比較的固く、全体で決まった意味を持つ言葉」のことです。本稿では、宮地の定義を採用し、宮地が慣用句とみなしている表現を取り上げます(「目を盗む」「舌を巻く」「あっけにとられる」など)。

[2] この点は滝沢(2007: 67)にも指摘されています。

[3] DVD 版は有償です。純粋にデータだけを収録したものであり、検索ツールは含まれていません。

[4] 例えば、「舌をま」をそのまま検索したら、「陛下は私の長広舌をまじろぎもせず」などの無関係の用例が拾われてしまいますが、「後文脈」の検索条件を ^[かきくけこい] のように正規表現で指定すれば、「舌をま」の直後に「か」から「い」のいずれかが現れる用例、つまり「舌を巻く」の活用形のみが抽出されます(^ は文字列の先頭、[ ] は [ ] 内の任意の1文字を表します)。

[5] 中納言は現在無償で利用できます。有償化する場合は、事前通知が行われます。

[6] 「語彙素」とは、「舌」「呆気」「取る」のように、辞書の見出し語に相当する「代表形」のことです。中納言で語彙素を検索する場合は、表記は一般的な形で(例えば「舌」は漢字で、「取る」は漢字仮名交じり)、動詞や形容詞は「取る」や「高い」のように、基本形で入力します。

[7] 「手を早く打たないと…」や「…から足をきれいさっぱり洗った」のように、慣用句中に副詞句を挿入する場合があります。このような用例を拾いやすくするためにも、「キーから5語以内」と設定します。

[8] 筆者が以前『朝日新聞』のデータベースから無作為抽出で得られた「舌を巻く」の用例を検討したところ、86例のうち44例(5割)もが、この「…が『 〜 』と舌を巻く」といった文型のものでした。よって、この文型は特に新聞において好まれるといえそうです。原因としては、ニュースといったジャンルにはインタビューの報告が多く、直接引用法がよく用いられることや、スポーツ選手の優れた能力や技術を述べる記事が多いことがあげられます。


 

 

関連書籍
『研究社 日本語口語表現辞典』
『研究社 日本語コロケーション辞典』

キーワードで書籍検索
コーパス corpus 慣用句

▲ページトップに戻る

複写について プライバシーポリシー お問い合わせ

Copyright(C)Kenkyusha Co., Ltd. All Rights Reserved.