一般的な英文の頻出語のみを掲載した基本英単語リストNGSL、NAWL、TSL、BSL。これら英単語リストを覚えることで、洋書やTOEICの英文をどれほどカバーできるのか確認してみました!
目 次
英文カバー率の確認
カバー率を確認する基本英単語リスト
各英単語リストの特徴
NGSL、NAWL、TSL、BSLおよびNGSLとNAWLの基となったGSL、AWLについての概要は以下の通りです。
種類 | 概要 |
---|---|
GSL (General Service List) | 1953年に公開された基本英単語リストです。英単語の頻出順が考慮された約2000語の単語リストです。一般的英文の8割をカバーすると言われています。 |
AWL (Academic Word List) | 2000年に公開発表された、学術的な英文向けの基本英単語リストです。570語あり、GSLの後に覚えるべき単語と言われています。 |
NGSL (New GSL) | GSLを最新の手法で大幅にアップデートした約2800語の単語リストです。2013年に公開されました。一般的英文の9割をカバーすると言われています。 |
NAWL (New AWL) | AWLを最新の手法で大幅にアップデートした約960語の単語リストです。2013年に公開されました。NGSLとMAWLで学術的英文の基本英単語の92%カバーすると言われています。 |
TSL (TOEIC Service List) | 2016年に公開された、TOEICに頻出する約1200の単語リストです。NGSLとTSLでTOEICの99%の英単語をカバーすると言われています。 |
BSL (Business Service List) | 2016年に公開された、ビジネスで良く使われる基礎単語のリストです。NGSLとBSLを覚えることでビジネス基礎英単語の97%をカバーすると言われています。 |
なお、NAWL、TSL、BSLはそれぞれ単体で利用するのではなくNGSLと組み合わせることが前提となっています。各リストについてはそれぞれの紹介記事を参照ください。
英単語リスト間の重複について
英文カバー率を測定する前に、まず単語の重複について確認しました。NGSLとNAWL・TSL・BSLそれぞれの組み合わせでは単語の重複が存在しません。また、GSLとAWLにもほとんど単語の重複は存在しません。これらはそれぞれ組み合わせて利用することが想定されているからです。
しかしながら、NGSLとAWL・GSL、およびNAWL・TSL・BSLの英単語では重複語が多く存在します。この単語の重複をイメージ化すると以下のような図になります。
NGSLはGSLとAWLを参考にしているため、この2つとは多くの単語が重複しています。NAWL、TSL、BSLはそれぞれの目的のために独立して用意されたためか、この3つの英単語リスト間では多くの単語が重複してるようです。したがって、NGSL、NAWL、TSL、BSLの掲載語は重複を除外すると5619語となりました。
カバー率計測の対象となる英文
NGSLらの英単語リストが実際にどの程度英単語をカバーするのか、ジャンルの異なる以下8パターンの英文を対象に英文カバー率を計測していきます。
種類 | レビュー記事 | |
---|---|---|
小説 | ① ハリーポッター1巻 (米国版) | |
マンガ | ② よつばと! 13巻 | レビュー&語彙レベル解析 |
ドラマ | ③ フラーハウス 第1シーズン 1話 | レビュー&語彙レベル解析 |
英語試験 | ④ TOEIC公式問題集 | 語彙レベル解析 |
⑤ 英検準1級 | 語彙レベル解析 | |
学術向け | ⑥ TED講演 x 12 | |
ニュース | ⑦ NHK ニュースで英会話 x 18 | |
⑧ CNN ニュース記事 x 10 |
一般英文のサンプル
一般英文のサンプルとして英語の娯楽作品 (①小説、②マンガ、③ドラマ) を選び、英文のカバー率を計測しました。
TOEIC英文のサンプル
TOEIC英文のサンプルとして、④TOEIC公式問題集 (2017年2月発売 ) の1回目の模試の英文を対象とします。また、参考として、⑤英検準1級試験 (2017年6月実施) の英文のカバー率も計測してみました。
学術的英文のサンプル
学術的な英文として、TED公開されている言語に関する講演のスクリプトを対象とすることにしました。TEDは様々な議題がありますが、今回は学術的な英文のサンプルとするため、「言語」に関する講演のスクリプトを選びました。具体的には以下の講演のスクリプトです。なお、スクリプトは英語、日本語どちらでも公開されているので、時間があればご覧になってみてはいかがでしょうか。「What makes a word “real”? 」なんか結構面白いですよ!
-
⑥TED のプレイリスト 「Talks for people who love words」にある12講演
- What makes a word “real”?
- Why is ‘x’ the unknown?
- An ode to envy
- What our language habits reveal
- Txtng is killing language. JK!!!
- What we learned from 5 million books
- The joy of lexicography
- Massive-scale online collaboration
- Why people need poetry
- Let’s simplify legal jargon!
- Please, please, people. Let’s put the ‘awe’ back in ‘awesome’
- Could your language affect your ability to save money?
ビジネス英文のサンプル
最後にビジネス向けの英文として、NHK WordのニュースとCNNニュースの英文を採用します。
- ⑦NHK ゴガク掲載の「ニュースで英会話」で、2017年8月に提供された放送内容 (全18回)
-
⑧CNNのニュース記事の英文 (10記事分)
- Jay-Z slams Trump’s ‘shithole’ comment as ‘hurtful’
- What happened when a public school student sued over prayer
- Special prosecutor to investigate ‘every corner’ of Michigan State University
- Woman who bought the Turpins’ Texas home found feces everywhere
- The fallout from Larry Nassar’s sexual abuse is just beginning
- How to write a letter to your abuser
- Settle in with these weekend reads
- Jury convicts man in shooting death of ex-NFL player Joe McKnight
- Michigan State students march for sexual assault survivors
- Mosque threat charge dropped in court but not in news release
カバー率計測方法
英文は単語単体に分解し、各英単語リストに掲載されている単語に該当するか否かを確認します。なお、動詞の活用形や名詞の複数形は原形に戻していますが、his、us、yourなど代名詞の活用形はその形のまま残しています。また、固有名詞や造語、数値は計測対象から除外しています。
英単語リスト | 代名詞 | 動詞 | 人名 | ||
---|---|---|---|---|---|
he | his | delete | deleted | Yotsuba | |
NGSL | 該当 | 該当なし | 該当なし | 該当しないのでdeleteとして判定 →該当なし | 人名なので除外 |
TSL | 該当なし | 該当なし | 該当 | 該当しないのでdeleteとして判定 →該当 |
大まかな流れは、「英文の語彙レベル解析手順について」の記載内容と同等です。
カバー率計測結果
対象 | GSL | GSL | NGSL | NGSL | NGSL +TSL +NAWL +BSL | |||
---|---|---|---|---|---|---|---|---|
+AWL | +TSL | +NAWL | +BSL | |||||
英単語リストの掲載語数 | 2284 | +565 | 2801 | +1259 | +963 | +1754 | 5619 | |
小説 | ① ハリーポッター | 85.3% | 85.6% | 86.7% | 87.8% | 87.3% | 87.6% | 88.6% |
マンガ | ② よつばと! | 88.4% | 88.9% | 88.9% | 90.6% | 89.4% | 89.6% | 91.2% |
ドラマ | ③ フラーハウス | 84.5% | 85.0% | 88.4% | 89.7% | 89.0% | 89.2% | 90.0% |
英語試験 | ④ TOEIC | 80.0% | 84.8% | 89.5% | 93.9% | 91.0% | 92.5% | 94.2% |
⑤ 英検準1級 | 81.3% | 85.3% | 88.8% | 91.2% | 90.2% | 90.7% | 92.4% | |
学術向け | ⑥ TED講演 | 85.8% | 88.1% | 89.6% | 90.8% | 91.4% | 91.4% | 92.6% |
ニュース | ⑦ NHKニュース | 79.2% | 82.5% | 86.2% | 88.5% | 88.1% | 89.1% | 90.3% |
⑧ CNN ニュース | 80.2% | 83.4% | 86.7% | 88.3% | 87.8% | 90.0% | 90.6% |
NGSL、TSL、NAWL、BSLそれぞれの英単語リストで英文カバー率を計測した結果は上記の通りです。なお、TSL、NAWL、BSLはNGSLと組み合わせて利用する英単語リストなので、それぞれNGSLと組み合わせた時のカバー率と、NGSL+TSL+NAWL+BSLの4つの英単語リストすべて合わせた時のカバー率も掲載しています。また、参考としてGSL、GSL+AWLでのカバー率も掲載しています。
結果、公式サイトで言われているほどではありませんでしたがNGSLはどの分野でも高いカバー率があり、かつTSL、NAWL、BSLはそれぞれの分野で頻出する英単語が掲載されているのは間違いなさそうです。
なお、公式の英文カバー率の計測方法は、his、herなどの代名詞は見出し語のheやsheなどでカウントしているのではないかと思います。本記事ではhis、herなどはその単語のまま扱っている分カバー率が低く出ているとお考えください。
語彙レベル解析
概要
解析の対象にする単語
NGSL公式サイトで公開されているNGSL、TSL、NAWL、BSLに掲載されている英単語を対象とします。なお、TSL、NAWL、BSLでは単語の重複が存在するため、重複を除いた単語の合計数は5619です。
語彙レベル比較
各英単語リストの掲載語を12000語レベルで分類
まず、各英単語リストに掲載されている英単語を12000語レベルで分類した結果を併記した結果が上記グラフです。NGSLが4000語レベルまでの基本英単語をカバーしており、ついで、TSL (TOEIC向け) 、NAWL(学術英文向け)、BSL (ビジネス向け) と掲載語の語彙レベルが徐々に高くなっていることが分かりますね。
全ての英単語をまとめて26000語レベルで分類
NGSL、TSL、NAWL、BSLの英単語をまとめ、重複を除外した5619語を26000の語彙レベルで分類した結果が上記グラフです。
英単語リスト | 語数 |
---|---|
NGSL | 2801 |
+TSL | +1257 |
+NAWL | +728 |
+BSL | +833 |
計 | 5619 |
各英単語リストの割合が分かるように色分けした結果が上記グラフです。なお、ここでは掲載されている語彙レベルが低い順にNGSL→TSL→NAWL→BSLという順番で学ぶことを想定して、TSL以降は差分で覚える単語の数を表しています。
基礎英単語リストを学ぶ価値はあるか?
本記事でNGSL、TSL、NAWL、BSLでの英文カバー率を確認しました。公式サイトの主張よりはカバー率が低かったですが、それでも約9割の英単語がカバーできていることがわかりましたので、これら英単語リストの英単語を優先して覚えることは効率的であると思います。
専用のスマホアプリやブラウザで利用できるQuizletなどもありますし、TOEIC L&Rでスコアを伸ばしていきたいのであれば、NGSLとTSLの掲載語は確認して損はないでしょう。他の英単語集で語彙を増やしてきた方でも、暗記漏れの単語が無いか確認するのに利用するのも良いかと思います。
なお、本記事で紹介した英単語リストは「最低限の英単語で最大の効果を発揮をする」という考えを元に作られています。しかし、最終的に10000語、15000語と語彙を増やしていくのであれば、市販の英単語集などでも最終的に覚える英単語は大きく変わらないため、これら英単語リストを絶対利用しなくてはイケナイというものではありません。やりたい単語集をやるのが一番です!