前回は、特定の言語項目(時制)のエラーについて、学習者コーパスを用いて分析する方法を紹介しました。今回は、エラー分析の結果を品詞とエラータイプごとにまとめることによって見えてくる学習者言語の実態について紹介します。
使用する学習者データは、前回と同じです。中高一貫校に通う中学1年生から高校3年生までの英作文3万語です(JEFLL コーパスとして公開されているものの一部に著者がエラータグを付与しています)。分析の手順も前回と同じです。 (1) 各品詞の使用頻度を算出するために、CLAWS C7 tagset を用いて品詞タグを自動付与します。そしてコーパス分析用ソフト(AntConc)を使って、品詞ごとの総数を出します。 以下は、品詞タグを付与した学習者データの例です。たとえば、冠詞の総数を出したい場合は、“AT” のタグを検索します。 <s>Through_II the_AT school_NN1 festival_NN1 ,_, each_DD1 of_IO our_APPGE classmates_NN2 became_VVD friendly_JJ ._.</s> (2) エラーの頻度を出すために、手作業でエラー情報を付与します。前回と同様、NICT JLE コーパス[1] に用いられているエラータグを使います。[2] 何が誤りで何が正しいかの判定は難しいので、明らかに誤っているものにだけ着目します。そして、なるべく最小限かつ簡単に正しい英文として訂正できるような修正候補をあげます。 以下は、エラータグを付与した学習者データの例です。この例文は、作文の一番初めに出てくる文でしたので、定冠詞の the ではなく、不定冠詞の a を使うべきでした。 <s>Our school had <at odr="1"crr="a">the</at> festival.</s> (3) コーパス分析用ソフト(AntConc)を使って、エラーの総数(例: 冠詞のエラーであるならば <at> を検索)を出したのち、エラー率を計算します。 (4) 分析対象としたすべてのエラー項目の正用法と誤用法の比率を品詞ごとにまとめ、学年別に出します。
図1. 品詞ごとの正用法比率の変化(阿部、2007)
結果をまとめた図1. の正用率の変化を見ると、品詞によって以下の4つの傾向があることがわかります。
この傾向を見ると、品詞によって正用率の変化に差があることが明らかです。しかし、品詞という枠組みだけで学年別の変化を見ていて、エラーの種類との関連は見ていません。そこで次に、エラータイプという分析観点を取り上げます。
ここでは、James(1998)を参考にして、エラーを3つのタイプに分類してみます。
(A) 誤形成(misformation): 誤った品詞や語形などが使われている。 分析対象としたすべてのエラー項目を上記3つのタイプに分類して、品詞ごとにエラータイプの内訳を100%に換算したのが、以下の図です。
図2. 品詞別エラータイプの内訳(阿部、2007)
結果を見ると、以下のようなことがわかります。
1. 誤形成のエラー率が高い品詞と、脱落のエラー率が高い品詞がある。
それでは次に、学年別の正用率の変化(図1)と、品詞別のエラータイプの内訳(図2)について、合わせて考察してみましょう。エラータイプごとに順番に見ていきます。
このタイプのエラーが多いのは、「名詞」、「形容詞」、「動詞」、「副詞」、「代名詞」でした。これらの品詞は、中学1年生における動詞をのぞくと、全般的に正用率が高いのが特徴的です(90%以上の正用率)。
名詞
動詞
さらに、動詞の誤形成エラーの中で大きな問題となると思われる「主語・動詞の人称・数の一致」のエラー率は、中学高校の6年間を通してほとんど変化しませんでした。これは話し言葉のデータを対象としたエラー研究[3] の結果と異なります。話し言葉においては、「主語と動詞の人称・数の一致」のエラー率は習熟度が上がるにつれて減少する傾向がありました。
形容詞、副詞
代名詞
また、何を指しているのかが明らかでない代名詞の it は日本人英語学習者の作文によく見受けられるものであり、読み手が悩まされますが、図2を見ると、脱落のエラーも多いことがわかります。これは主語や目的語として必要な代名詞が文章の中から脱落しているためといえるでしょう。しかしながら、代名詞と同じく文の主構成要素となる名詞と動詞は、代名詞ほど脱落するエラーの比率が高くありません。代名詞の正用率は他の品詞に比べると低くはありませんが、主語や目的語となる代名詞の指導には注意が必要であると思われます。
このタイプのエラーが多いのは、「名詞・動詞・形容詞などに続く従属前置詞」、および「冠詞」でした。どちらも中学・高校の6年間で、大きく正用率が上昇している品詞です。また接続詞もこのグループに入ります。
名詞・動詞・形容詞などに続く従属前置詞
冠詞
冠詞に関しては、話し言葉のデータを用いた研究[5] においても、脱落タイプのエラーが多いことが明らかになっています。
接続詞
文中で and が抜けている(脱落エラー)だけではなく、不必要に挿入されている(余剰エラー)両方の傾向があるので、 and の使い方については注意して指導する必要があるといえます。
「一般的な前置詞」は、誤形成のエラーと脱落のエラーとの比率が比較的近いことが特徴的です。
一般的な前置詞
このタイプのエラーに関しては、どの品詞もそれほど高くありませんが、「接続詞」のエラー率が比較的高いことがわかりました。
接続詞
以上、誤形成エラーは、全般的に正用率が高めの品詞に多いけれども、脱落エラーは、正用率が低めである品詞(冠詞、前置詞1、前置詞2、接続詞)に多いことが明らかになりました。後者の品詞は、中高生の学習者にとって文中における必要性を認識するのに時間がかかるのかもしれません。 しかしながら、「名詞・動詞・形容詞などに続く従属前置詞(前置詞2)」の脱落のエラーに見られるように、増減はありながらも学年を追うごとに正用率が上昇しており、そのうちエラーが消滅するのではないかと思われる項目もあります。ですので、どのエラーが学習者にとってより深刻であるかを把握した上での指導は大切です。また異なるタイプのエラーが見られる品詞もありました。誤形成と脱落(例: 代名詞と一般的な前置詞)、誤形成と脱落と余剰(例: 接続詞)などは、注意が必要といえるでしょう。 これまでの結果を品詞ごとにまとめてみましょう。
「代名詞」、「形容詞」、「副詞」、「名詞」、「動詞」 品詞によって学年を追うごとに正用・誤用の出現傾向に違いがあることがわかりました。また、品詞とエラーのタイプには関連性の強いものがあり、品詞の誤用率とも関係があることが明らかになりました。 ここで紹介したエラー分析は、手作業で3万語分のデータに9つの異なる品詞(前置詞1、2を二つと数えて)に関するエラー情報を付与していますので、規模としてはあまり大きくありません。より大規模なデータを用いて、誤形成、脱落、余剰のエラータイプと品詞の関係を分析した研究に関しては、Tono(2013)があります。 二回にわたって、コーパスを使って、学習者言語の実態についてエラーという観点から分析する例を紹介しました。しかし、何を誤ってしまうのかについてばかりではなく、何ができるのかという分析も必要です。さらには、使うことはできるのだけれども、必要以上に使いすぎている語・句・構文についても理解したいところです。また使用頻度が少なすぎる、あるいは全く用いられていない語・句・構文に関する情報を得ることも重要です。日本人英語学習者が用いている言語がどのような状態にあるのかを理解することで、英語教材やシラバスの開発、そして指導が効果的に行われるようになるのではないでしょうか。
〈参考文献〉 Abe, M. (2007). “A corpus-based investigation of errors across proficiency levels in L2 spoken production.” JACET Journal, 44 (pp. 1-14). James, C. (1998). Errors in language learning and use: Exploring error analysis. Harlow: Longman. Tono, Y. (2013). “Criterial feature extraction using parallel learner corpora and machine learning.” In A. Díaz-Negrillo, N. Baillier, and P. Thompson (Eds.), Automatic treatment and analysis of learner corpus data (pp. 169-203). Amsterdam: John Benjamins. 阿部真理子(2007).「JEFLL コーパスに見る品詞別エラーの全体像」投野由紀夫(編著)『日本人中高生一万人の英語コーパス “JEFLL Corpus”――中高生が書く英文の実態とその分析』東京: 小学館、146-58頁。 和泉絵美・内元清貴・井佐原均(編)(2004). 『日本人1200人の英語スピーキングコーパス』東京: アルク。
〈注〉
|