2006年03月19日
ボキャブラリーのはなし--どういった単語をいくつ覚えるべきなのか、効率よく覚えるにはどうしたらいいのか
英語を勉強している人たちはだいたいが文法とボキャブラリーを二本の柱として進めているかと思いますが、文法に関して何をやるべきかは、基本的な文法書の目次を見ればだいたいわかるのに対して、ボキャブラリーとなると、どの単語に力を入れるのかが判然としないものです。
かと言って、手当たり次第に覚えるというのも考えものです。エビングハウスの忘却曲線 (Ebbinghaus' forgetting curve) が教えてくれるとおり、放っておけば、10個単語を暗記したとしても、4時間後に半分は忘れてしまうに決まっていますから、忘れようとする脳をいわば騙して記憶に定着させるためには、重点単語に絞って、反復練習するほうがいいわけで、滅多に使わない単語までやみくもに覚えようとするのは非効率です。何事によらず順番はあるものです。
そこで、(1)英語のボキャブラリーというのはどのぐらいあり、(2)どの種の単語をいくつ覚えなければならないとされているのか、その一覧表はあるのか、そして、(3)こうして見定めたボキャブラリーを身につけるには何が効果的とされているのかを見ていきたいと思います。(後半はボキャブラリーの増強に役立つリンク集です)
★ 英語のボキャブラリー
Oxford English Dictionary の見出し語数は約50万、対するアメリカのWebster's Third New International は約45万です。しかし、Webster'sの 45万という見出し語も、、動詞 agreeとその名詞形 agreement を一つのワードファミリーという単位(以下、一つ一つ数える単語と区別して「基本単語」と称することにします)に整理して数えなおすと、およそ11万だそうです (Nation, P. Learning Vocabulary in Another Language. CUP)。たしかシェークスピアの全作品で使われている基本単語数は20,000弱ですから、その分量のすごさがわかります。
しかし、英語の使い手がこのすべてを知っているはずもなく、Nationによれば大卒社会人の基本単語数は、約20,000とのこと。他面、こうした教育のある人々は、毎年 100万単語、つまり、本なら10-12冊、Newsweekのような雑誌なら25冊程度を読み、新たに1,000語程度仕入れていると言います。(ちなみに、毎月1冊読めば、1,000語程度ボキャブラリーが拡大するというのは、これはこれで興味をひかれるデータです)
しかし、ビジネスや研究の世界で英語圏の人々と互角にわたりあう人々は別として、学習者としては、ひとまず達成可能なレベルを中間目標とした方が現実的であり、そのレベルとしては、頻出単語をベースにまずは3,000とされています。
それでは頻出単語とは何ぞというのが次のテーマです。
★ おさえるべき単語=頻出単語
ビギナーはまずこれだけは覚えなさいとか、英語で大学レベルの教科をこなすためにはこれだけ覚える必要があるといった話になると、常に頻出単語 (high frequency words) が基準になりますので、まずは、この頻出単語がどういうものかを見てから、具体的な単語数の話へと進めていきます。
ボキャブラリー研究の世界で頻出単語が語られる際、必ずと言っていいぐらい引き合いに出される基本的な資料が三つあります。Brown Corpus、GSL (=General Service List) そして、AWL (Academic Word List)です。
Brown Corpus は、ブラウン大学の Francis と Kucera という研究者が、1967年に公表した100万単語から成るデータベースです。2000単語程度の文書500通を15の分野から収集してデジタル化したもので、その時点のアメリカ英語の静止画像とも言えるような性格のものです。頻出度で整理してあるので、これを元に最頻出単語いくつという形で整理するのによく使われます。なお、これのイギリス英語版は、British National Corpusというもので、こちらは何と1億語ベースです。
次に、GSL は、1953にWest が「学習者にもっとも役立つ単語集」として発表したもので、含まれている単語数は2000強です。母体となる単語群を頻度順に整理して、上位2,000をみきわめたというものではない上、果たしてバランスよく英単語を収集しているかという見地から批判も多いものの、何かと引き合いに出され、あるいはよりどころとされるリストであるのは確かです。実際、学習者向けに使用単語数を限定してある読み物 (graded reader) の多くがこのGSLに則っていたりするものです。
現物は、ここにあります。
↓
http://jbauman.com/gsl.html
三つ目のAWLは、Victoria University of Wellington(ニュージーランド)の Coxheadが編纂したもので、大学の教科書など専門文献に頻出する基本単語が570語カバーされています。あとで見るとおり、2000単語覚えていると英語のテキストの80%が理解できる理屈なのですが、80%ですと、5単語に1単語はわからないという計算になります。それが、AWL をマスターすることで、専門文献のテキストの95%を理解できるようになるとされています。知らない単語の割合を10単語に1単語まで引き下げることができるのですから、費用対効果で見たら抜群のパフォーマンスと言えます。(単純に2,000単語にもう1,000単語追加しても、2倍カバーできるわけではありません)
なお、早とちりされると困るのですが、このAWLだけを単独で暗記したりしても余り効果は期待できません。飽くまで、その前段階に当たる基本2,000単語をマスターしていてこそ初めて役立つ単語群なのです。なお AWL 自体は、上の GSL をもって、基本 2,000 単語としています。
AWL は ここにテキストがあります。
この AWL を「社会人のコアボキャブラリー」と位置づけ、リストの見出し語を10個ずつ取りあげた上、活用形や派生形を含んでいる例文をご紹介し、最後にオンラインクイズで腕試しができるAWL短期集中講座を始めましたので、よろしかったら、のぞいてみてください。
ちなみに、TOEICは、神崎正哉先生によると、3,000単語強の世界。そのうち AWL は5%ぐらい占めているそうです。5%と聞くとたいしたことなさそうですが、問題文や選択肢の理解などにおいて大きな役割を果たしており、その意味でAWLの学習はスコアアップにも結びつくようです。
★ 具体的な数字
以上のデータベースをもとに、普通、ボキャブラリーとしてどの程度のものが必要かについては、以下の数字がよく出てきます。
A. 2,000
最頻出2000単語をマスターすれば、新聞記事などのテキストについては80%、会話なら90%理解できるとされます。文書の場合、わからない単語が1行当たり2単語出てくるというイメージです。また、Paul NationとRobert Waring のペーパー、Vocabulary Size, Text Coverage and Word Lists (以下、Nation/Waring)を見ると、2,000から3,000あれば、スピーキングとライティング両方で、ひとまず用が足りるとも言っています。
ところで、80%という数字だけ聞くと、あと20%は何とか文脈から推測できるからいいと考えてもしまいますが、Liu Na と I.S.P. Nation らの研究により、95%前後の単語(わからない単語が2行当たり1単語というレベル)をおさえていないと、そもそも推測などできないということがわかっています。このことは、聞くだけで英語ができるようになるはずがないのと同じ理屈で、ボキャブラリーが貧弱なままではいくら多読しても無駄に終わるということをも意味します。「わからない単語は文脈から想像すればいい」といったことを言う人がいるようですが、あれは大ウソです。
どの2000単語かについては、GSLが一つの目安とされていますが、他に、上のBrown Corpusの頻出単語上位2000もよく引き合いに出されます。
この頻出単語上位2000単語のリストは、
http://www.angelfire.com/wi3/englishcorner/vocabulary/vocabulary.html#lists
に行ってから、目次の最初のブロック、下から4番目にある Word Lists をクリックし、開いたページを見ると、以下のものが並んでいますので、pdfファイルをダウンロードできます。
Brown Corpus - 2000 Most Common Words 1[a to dust]
Brown Corpus - 2000 Most Common Words 2[duty to lines]
Brown Corpus - 2000 Most Common Words 3[lips to roof]
Brown Corpus - 2000 Most Common Words 4[room to yourself]
B. 3,000-5,000
Nation/Waring は、英語を理解するためには、基本単語で、3,000-5,000は必要だとしています。なぜ最低でも3,000かと言うと、3,000程度覚えていれば、テキストの95%はわかるからです。上で触れた Liu Na と I.S.P. Nation らの研究が正しいとして、このレベルにまで達して初めて、残りの5%の単語について何とか推測できるようになるのです。
具体的には、一般の人であば、Brown Corpusの最頻出単語3,000ということになるでしょうし、英語で大学レベルの勉強をする人にとっては、最頻出単語 2,000プラスAWLということになります。
ちなみに、ドイツの英語教育では、10年生時点で、話したり、書いたりできる、つまり使える単語数で3,000、見ればわかる程度の単語数で4,000というものを到達目標にしていますから、この3,000-5,000というレベルは納得できます。なお、ドイツの場合、小中高の8年間に960時間かけて英語を教えています(わが国の中学・高校の場合、英語の授業時間数は850から1300時間)。
いずれにしろ、学習者としては、まずは頻出単語の上位3,000を出発点にしないとお話にならないということです。この点、Nation/Waringは次のように言っています。
Clearly the learner needs to know the 3,000 or so high frequency words of the language. These are an immediate high priority and there is little sense in focusing on other vocabulary until these are well learned.(学習者が3,000前後の高頻出単語を覚える必要があるのは明らかだ。まずは他に優先して進めるべきことであり、この種の単語を十分マスターしないうちは、他のボキャブラリーにまで手を広げてもあまり意味がない)
C. 5,000-10,000
Nation/Waring は、大学で指定される教科書を読みこなして行くためには、5,000から10,000は必要になろうとしています。と言うことは、大学生の場合、最低限のレベルとして、3,000レベル(最頻出単語2,000プラスAWL)は必要で、まともに授業についていき、課題をこなしていくためには、5,000から10,000は必要だということになります。
この10,000ぐらいは必要だろうとされる根拠は、長文の経済関係のテキストを調べると、基本単語数で5,000強がカバーされていること、また短めの専門文献を各種集めて並べてみると、基本単語数で、約13,000になることに求められます。(Sutarsyah, C., I.S.P. Nation and G. Kennedy. 1994. How useful is EAP vocabulary for ESP--A corpus based case study. RELC Journal 25, 2: 34-50. )
加えて Nation は、Learning Vocabulary in Another Language の中で、To read with minimal disturbance from unknown vocabulary, language users probably need a vocabulary of 15,000 to 20,000.(知らない単語が大した妨げにならない程度に読む力となると、おそらく 15,000から 20,000程度のボキャブラリーは必要になろう)としています。最終的には、上で触れた英語圏の大卒社会人並みのボキャブラリーにまで持って行く必要があるということです。
★ まとめ
以上を要するに、英語を使えるようになりたいと思うなら、まずは最頻出単語3,000をおさえるということです。その場合、高頻出単語から覚えて行くこと、そして、単語を孤立しておぼえるのでなく、できるだけ違ったコンテクストで「出会う」ように図るというのがポイントです。実は多読の効用はこの点に求められるのですが、3,000単語もマスターしていないうちに多読を試みても、文脈から未知の単語の意味を当てること自体無理なので、結局は徒労に終わるということです。言い換えれば、まずは3,000単語を目指しながら、新たに知った単語との「つきあいを深め」かつ、前から知っている単語との「旧交を温める」ようにするのが効率的と言えます。
また、大学生の場合は、同じ3,000単語でも頻出2,000単語プラスAWLという組み合わせによった方が、英語の専門書を読めるようになるので得策です。ただ、この3,000も、飽くまでも出発点であり、きちんと読めるようになるには、5,000から10,000レベルにまで達するよう継続して努力していく必要があります。
なお単語力強化に特化している学習サイトとしては、Wordengine がおすすめです。語彙学習論の大家である Paul Nation の協力のもと、Charles Browne という専門家が監修しているようで、ざっと見て、「すばらしい!」と感じました。特にいいなと感じたの基礎単語 2,342 単語をマスターするように構成されているコースです。世の中、使用頻度が低く、したがってコミュニケートする上で知らなくても済むような単語で英語力を測る傾向がありますが(例えば英検がいい例です)、このサイトは、まずは基本からというオーソドックスで、しかも費用対効果から考えても効率的なアプローチによっており、きわめてまっとうです。ちなみにどのコースも年間わずか 1,000円です。
・
・
・

この記事、役立ちましたか?よろしかったら、応援の一票をお願いします。人気blogランキングへ
- [英語学習法]
- Comments (2)
- Trackbacks (1)
Trackbacks
Trackback URL:
- »そのおとこ、和田につき: [web]単語力をつけるには - 2006年03月20日 15:23
ところで、80%という数字だけ聞くと、あと20%は何とか文脈から推測できるからいいと考えてもしまいますが、Liu Na と I.S.P. Nation らの研究により、95%前後の単語(わからない単語が2行当たり1単語というレベル)をおさえていないと、そもそも推測などできないということがわかっています。このことは、聞くだけで英語ができるようになるはずがないのと同じ理屈で、ボキャブラリーが貧弱なままではいくら多読しても無駄に終わるということをも意味します。「わからない単語は文脈から想像すればいい」とい...
Comments
>最頻出2000単語をマスターすれば、新聞記事などのテキストについては80%、会話なら90%理解できるとされます。文書の場合、わからない単語が1行当たり2単語出てくるというイメージです。
このくだりですが、テキスト中の既知語の割合/理解度/テキスト中で使用されている語彙中の既知語の割合がごっちゃになっているように思われます。
頻出2000語をマスターすれば、
テキスト中の既知語の割合:95%=2行に1個未知語
テキスト中で使用されている語彙中の既知語の割合:せいぜい30%
といったところと思います。
一方、Liu Naさんの研究で言う95%は、テキスト中で使用されている語彙中の既知語の割合と思いますので、それだけ知っていた場合、
テキスト中の既知語の割合:99.7%=未知語1ページ1個以下程度
となると思います。
細かい話で恐縮ですが、気になりましたのでご指摘させていただきました。一度ご確認いただけたらと思います。
[返信]
コメントありがとうございます。後日、勉強し直してみます。
- yamasina
- 2006年06月29日 16:16



80%では確かに足りているようで実際は足りていないという感じがしますね。単語レベルの高い本を辞書を引かずに読むということにチャレンジしたことがありますが、2行に1度分からない単語が出てくるという感じで、まさに雲をつかむような感触で読み進んでいったことを覚えています。
こちらのブログ、詳細な説明が読み応えありますね。これからも読ませていただきます。
私も及ばずながら英語を勉強される方の役に立つブログを・・・と思って始めてみました。新参者ですがよろしくお願いいたします^^
[返信]
コメントありがとうございます。
alfred2000さんのブログ、パラグラフライティングのお手本としていいですね。きちんとトピックセンテンスがあり、そのあと、その枠内で展開というセオリーどおりのもので、英語を勉強している人に役立つと感じました。また、ネットを英語の勉強に使う上でのアプローチにおいても共感をおぼえます。加えて、分量も毎日気楽に読める程度におさえてあり、こちらが反省させられます。
日本人の英語力向上のため、一緒に頑張っていきましょう。
今後ともどうぞよろしくお願いします。