英語を習いはじめた頃、「今何時ですか」という疑問文は What time is it now? と訳す、と教わりました。ところがその後、実際の英語に接するようになると、ネイティブ・スピーカーが What time is it now? とは言わないことに気づきました。その代わりに耳にしたのは、now のつかない What time is it? という表現です。どちらが普通の言い方なんだろうと疑問を抱いたとき、どうしたらよいでしょうか。ネイティブ・スピーカーに直接尋ねることができるならば、それもよいでしょう。ですが、ネイティブがいつも身近にいるとは限りませんし、母語話者が教えてくれることがすべて正しいという保証もありません。そういう時に、コーパスが役に立ちます。 それでは、コーパスに助けを求めてみましょう。Bank of English[1] という大規模コーパスのひとつで当該表現を検索してみると、全部で176例見つかりました。そのうち、now を伴うものが13件でしたので、表で示すと以下のようになります:
一目瞭然ですね。What time is it? という表現は、now のつかない形で用いられることが圧倒的に多いことがわかります。What time is it now? という言い方がないわけではありませんが、はるかに頻度が低いということを事実として指摘できます。 これは「学習者」という立場に立ってのコーパスの使い方のひとつですが、どういう表現が普通に使われているのかを知りたいと思った時にコーパスが活用できるということを示しています。このような事実を把握した上でネイティブに意見を求めると、さらによい答えが得られるやもしれません。
「学習」と「教育」は表裏一体の問題ですが、今度は教育という観点からの活用例を考えてみたいと思います。 私はもう長いこと、映画やテレビを見ながら、これはと思う表現に出会うと「語法ノート」に記して来ました。その際、風変わりなものにばかり目が行ってしまいがちで、普通のこと/当たり前のことには無頓着になる傾向があります。一例として、How about some coffee? というのを聞いても、ごく当たり前の表現なので、聞き流してしまいますが、How about we go get some coffee? というのに出会った時に、これはと思って一生懸命書き留めた記憶があります。about は前置詞ですので、このように文(正確には「節」と言います)が続くのはいわゆる「破格」な構文となります。 英語教師であれば、このような表現を教えるべきなのか/教えないほうがよいのかと思案をめぐらすところです。私自身は辞書を書く仕事をしていますので、はたしてこの表現を辞書に載せるべきか/載せざるべきかを考えねばならない立場にあります。こういう場合にもコーパスの力を借りると、問題解決の糸口が見つかります。 それでは、コーパスから採った how about を含む用例を覗いてみましょう(これも Bank of English からのものです):
how about の使用例は全部で3,861件見つかりました。その中から無作為に100例を選び、その一部だけを示しました。how about に続く語句には様々なものがあるのがわかりますが、(if 節を別にして)「主語+述語」が続くパターンはここでの100例中1文しか見当たりません。さらに、すべての用例3,861で詳しく調べてみると、How about we go get a drink? という、先に示した例文と極めて近い用例を含めて、同パターンのものが20例見つかりました。このデータ内での生起率は20/3861ですので、0.518%です。1%にも満たないわけですから、ランダムな100例中に1例しか出て来なかったという事実にもうなづけると思います。 さて、これらのデータからどういうことが言えるでしょうか。まず、事実として How about . . . ? には名詞句が続く例が大半を占めるということです。How about you? のようなごく単純な名詞句もあれば、How about writing . . . ? のように動名詞が続く場合もかなりありますが、いずれにしても、「How about+名詞句?」のパターンが主流であり、普通であり、典型的であるということです。したがって、まず最初に教えるべき「型」はこれだと言えます。上で問題にした How about we go get . . . ? のようなパターンは(中心から離れた)いわゆる「周辺的な」表現であることがわかります。ですので、高校生を対象とした辞書であれば、このパターンは外すという判断になるでしょう。また、一般の利用者ないし上級の学習者を対象としたものであれば、エントリーさせると思います。なぜならば、「中にはこういうパターンもありますよ」と教えることで、このような表現に出会った時に戸惑うことがないようにするほうが親切であろうと判断するからです。以上のように、「教育」という観点に立った場合にもコーパスの利用価値は同じように高いと言えます。
コーパスを利用する価値/意義をまとめておきたいと思います。そのひとつは、類似の表現をたくさん集めて観察してみることにより、そこに型/パターンが見えてくるということです。個々の表現をただ一つひとつながめているだけでは見えないものがあり、それを浮かび上がらせることが可能になってくるわけです。そして、そのパターンの中で何が一番普通に使われているのか、どれが典型的なのかを知ることができるという点も同じく、あるいはそれ以上に重要です。普通のこと、当たり前のことは意外に見逃してしまいがちです。それに気づかせてくれる、あるいは再認識させてくれるのがコーパスです。
話の順番が逆になりましたが、コーパスとは一般に次のように定義されます:言語を分析/研究することを目的として、実際に使われた言語をコンピューターで読み取れるような形で大量に集めたもの。早い話、たくさんの実例を収めたデータベースです。 インターネットの世界では英語が主流です。それと呼応するように、コーパスも英語のデータが中心を占めています。ただし、種類の異なるコーパスも徐々に増えてきました。最近公開された日本語の大規模コーパスもそのひとつで、今後の展望はますます明るくなったと言えます。
現在、利用可能なコーパスには様々な種類と相当な数があります。ここでは、今後取り上げられることになる4種類のコーパスごとに、複雑な手続きなしに誰でもアクセスできる、無料のコーパスをごく簡単に紹介することにします。
今回のお話は以上です。イントロですので、表面をさらっとなぞっただけですが、次回以降は、それぞれの分野のエキスパートが具体的に解説をします。手取り足取りとまではいかないまでも、わかりやすさを旨として、できるだけ平易にお話しさせていただくつもりです。 この連載を読みながら、実際にコーパスをいじってみてはいかがでしょうか。水をただながめているだけでは決して泳げるようにはなりません。やはりドブンと水につかってみることが一番大切です。
〈注〉 [1] Bank of English は Collins 社と University of Birmingham の共同プロジェクトにより構築され、COBUILD 英英辞典の編集に主に利用されているコーパス(現在、6億5千万語)である。Collins Corpus(現在、45 億語)の一部を成すもので、一般には公開されていない。今回利用したバージョンは4億5千万語が検索対象となっている(http://www.titania.bham.ac.uk/)。HarperCollins 社のコーパス・データの一部は以下のオンライン検索サービスで利用できる(いずれも有料)。
|