この連載では、頻出語句(2000+AWL+MSDN Wordlist)を身につけた方が実際にMSDN Magazineを読み進めるためのフォローアップを目的としています。最新号の記事から、頻出語句に漏れた語彙を紹介します。今回は2013年6月号の"A Modern C++ Library for DirectX Programming"を取り上げます。

はじめに

Windows開発者の必修語彙をAnki学習する方法ではMSDN Magazineの過去の記事からコーパスを作り、MSDNに特有な語彙の頻出表を作りました。 一般的な英語の頻出語彙表(頻出2000語とAWL)と組み合わせると、MSDNの記事の98%をカバーできるものです。

日本の高校で英語教育を受けた方にとっては、このリストが非常に物足りなく感じるかもしれません。 実は、このリストを超えた98%以降頻度の語彙に興味深い語彙が多数含まれています。

記事が読めるためには、頻出語句(2000+AWL+MSDN Wordlist)を学習していただくのが必須です。

この連載では、MSDN word listのフォローアップとして、頻出語句の学習は終了した人を対象に、実際の記事の中に現れた頻出語句から外れたの語彙を紹介していきたいと思います。 低頻度といっても、MSDN Magazineは98%レベルで8000語で作成されているので、一般の英語の語彙としては、高頻度ではないとしても頻出語句です。このような語句に慣れ親しんで、MSDNの原典にあたる習慣をつけるのに役立てばと思っています。

MSDN Magazineの日本語版の最近の制作状況を見ると、特集記事全てとコラムから1つ程度、翻訳されているようです。日本語化されているものは当然日本語で読むでしょうから、翻訳対象にならないコラムとオンライン限定の記事を取り上げたいと思います。scriptjunkie{}は今のところ対象外です。毎回一つの記事を、語彙分析して低頻度の語句を紹介していきたいと思います。

おことわり

この連載は、英文で読み進めるための支援を目的としています。

  • 日本語訳の補完する意図はありません。

  • 日本語への翻訳の仕方を解説することはありません。

  • 語義の解説はしません。

  • 内容解説もしません。

  • 読解力向上も目指していません。

この記事の内容は私(Luminous Spice)の私見を示すものです。Microsoft Corporationの見解を示すものではありません。

MSDNは、Microsoft Corporationの商標であり、MSDN Magazineは、1105 Media, Inc.の出版物です。

使うもの

今回は、先週公開になった最新号MSDN Magazine June 2013からDirectXとC++についてのコラムを取り上げたいと思います。

このツールは語彙水準を調べるのに使います。

この記事の語彙水準

代表的なイギリス英語のコーパス BNC(British National Corpus)頻出2万語を使って、この記事に使われている約2000語の語彙の分布を調べてみました。

表 1. BNCの頻度表に基づいた語彙水準分析
頻度水準 累積カバー%
K1 Words : 82.7%
K2 Words : 91.2%
K3 Words : 93.2%
K4 Words : 94.4%
K5 Words : 95.3%
K6 Words : 97.1%
K7 Words : 97.9%
K8 Words : 98.5%
K9-K20 99.0%
リスト外: 100.0%
合計 100.0%

(Cobb,T. VocabProfilers Classic VP English v.3より作成)

K8=98.5%でMSDN Word Listを作成した時に検証した記事と同程度の結果を得ました。頻出8000ワードファミリーの語彙力があれば、使用語彙の98%をカバーできることに変わりありません。

ネイティブ並みの2万語の語彙力を持ってしても1%は未知語になります。

MSDN Magazineのバックナンバーから作成した、頻出語彙表MSDN word listの効果を見てみましょう。

表 2. 頻出語彙集 MSDN word listの効果
語彙分類 Families Types Tokens 割合 累積
GSL K1 Words (1-1000): 339 431 1700 81.03% 81.03%
GSL K2 Words (1001-2000): 55 68 108 5.15% 86.18%
AWL Words (academic): 67 85 158 7.53% 93.71%
MSDN Words (technical): 58 119 5.67% 99.38%
リスト外: ? 11 13 0.62% 100.00%
合計 461+? 653 2098 100.00%

(Cobb,T. Web VP / BNC-20 v 3.2より作成)

99.38%という結果を得ました。GSL(2000)+AWL(570)+MSDN Word list(720)=3300 ですから、MSDN Magazineを読む場合には、MSDN Magazineに特化した頻出3300語で英語全体の頻出8000語と同じパフォーマンスを発揮します。

日本の高校生の語彙水準が3000語レベルとの研究発表が多数出ていますので、GSL+AWLの中の不足分をチェックして、更にMSDN Word listを学習すれば、MSDNを読む分には98%のカバーが実現できます。

GSLとBNC Top2000について

上記2つの結果で、頻出2000語にGSLとBNCが使い分けられています。単体で比較するとBNC2K(91.2%)>GSL(85.85%)でパフォーマンスの面で差が出ていますが、AWLと組み合わせた時には差はほとんど出ません。

その理由はAWLの作成基準にあって、AWLはGSLと重複しないように語彙を選択しています。一方BNCは単純にコーパスから頻度順に選んでいますので、BNC上位2000語とAWLには重複が発生しています。 結果として、AWLと組み合わせた時には効果に差が出ないのです。

残りの未知の語彙ってどんなの

そこで本題です。それでも分からない語彙、13語はどんなものか調べてみましょう。

表 3. リスト外の語彙の語彙水準
語彙レベル 語彙_[出現頻度]
BNC-4000 types: intimidating_[1]
BNC-5000 types: dizzying_[1]
BNC-6000 types: overheard_[1] prevalent_[1]
BNC-7000 types: concise_[1] embodied_[1]
BNC-8000 types: prerequisite_[1] prerequisites_[1]
BNC-9000 types: palatable_[1]
BNC-12000 types: hardcore_[1]
OFFLIST: nonvirtual_[3]

上の表は、表2でリスト外になった単語を再びVocabProfile BNCにかけて、その言語水準を調べた結果です。 全体を見てみると"hardcore"と"nonvirtual"は例外ですが、やはり8000語程度の語彙に収まっています。

  • "concise"と"hardcore"はカタカナ英語になっています。

  • "virtual"はAWLに含まれている頻出語彙に接頭辞"non-"がついた造語なので容易に意味が類推できます。

  • "prerequisite(s)"は、開発系のインストール文書には頻出語句です。

残るは6語です。活用形を原型に直しました。 "dizzy","embody","intimidate","overhear","palatable","prevalent"

この文書は約2000語の長さです。頻出2000語+AWL+MSDN Word Listの語彙力があれば、 この6語が仮に乱丁で読めなかったとしても文書全体の意味は理解できる語彙力は既に持っています。 きっと、辞書で意味を調べなくても分かるはずです。まず、読んでみてからあとで時間があったら辞書を引いてみるのが良いでしょう。

この記事が難しく感じるとしたら、その一つは内容の専門性です。日本語で書いてあったとしても難しく感じるでしょう。それからMSDN Magazineは難しいという先入観、最後に英文の慣れが不足していることです。

先入観は、今この場で捨てましょう。

慣れについては、今からたくさんのMSDN Magazineの記事を読んでいけば解決します。

専門性については、開発の経験値を積むことと、たくさんの品質の高い技術情報を読んで知識を高めることによって培われます。高い質の情報を得る近道は、実際に製品や技術を作り出したその人の書いた一次情報、原典を読むことです。 MSDN Magazineはこの目的に最適な専門誌です。 もちろん開発者ブログもおすすめです。

未知語彙の学習単語帳

この記事で紹介した最初の未知語13語は、Anki単語帳にしました。Ankiを使って学習することができます。Anki単語帳パッケージ wordsinmsdn.apkgをダウンロードしてお使いいただけます。

連載毎に単語帳のノートが追加できるような仕組みを作っていきたいです。

この単語帳を使うにはAnkiのインストールが必要です。Ankiサイトから最新版をダウンロードできます。Ankiは、Windows、Mac、Linux/BSD、iOS、Androidに対応しています。その他のデバイスからはAnkiWebを通じて利用可能です。詳しくはAnkiサイトをご覧ください。

このAnkiの使い方全般については、はじめてのAnki をご覧ください。

おわりに

子どもの頃、補助輪を外して自転車を乗り始めたことを思い出してください。 きっと、ご両親や兄弟、友だちが後ろで支えてくれたのではないかと思います。 この連載は、MSDN Magazineを原文で読むためにそのようなサポートの役割を果たしたいと思います。

皆さんが、ペダルを強くこぎ続けて前に進めば、自分の持っている語彙で記事の英文を読み進める意欲があれば、知らない間に、一人で自由に乗り回せるこつが掴めるでしょう。英文も同じように読んでいるでことでしょう。

ある時後ろを振り向いたら、支えてくれているはずの人がいないのに気がつきませんでしたか。 この連載も同じです。 連載だからといって、読み続ける必要はないです。皆さんが自然に記事を読めるようになったら役割を果たしたことになります。また、この連載も予告なく終了する予定です。

好きな記事をたくさん読んで、楽しんでください。