Anki用のCSVファイルはPDICとメモ帳またはExcelさえあれば作成することができます。 他のツールは必要ありません……! 他にも、学辞郎と英辞郎は何が違うのかなど、疑問に感じそうな点も説明しています。

学辞郎と英辞郎とAnkiとSVL

概要

英辞郎付属のPDICの機能で、Anki用のCSVファイルを出力する

本記事では、英辞郎・学辞郎 (書籍版) の辞書データからアルクのSVL12000とSIL6000の英単語を抽出する方法を説明します。あまり知られていませんが、英辞郎付属のPDICの機能を活用すれば、Ankiですぐに取り込める形式でファイルを出力することができますよ!

出力したCSVファイルは、Excelやメモ帳などで文字コードを変更する必要あり (設定を変更して上書き保存するだけ)
Ankiのレイアウト、フォントの大きさは変更可能

SVLとSIL

SVL12000: アルクが作成した頻出順の英単語リスト

SVL 12000 (Standard Vocabulary List 12000、標準語彙水準12000) はアルク社が公開している12000語の英単語リストです。英単語の頻出順に 1000語/1レベル で区切られており、SVL 1 ~ 12 の12レベル存在します。また、単語集として究極の英単語 SVL Vol.1 ~ Vol.4 の4冊に3000語ずつ収録されています。

英単語集は数多く存在しますが、12000もの英単語を重複無しで網羅しているものはSVLしかありません。英検1級以上の英語力を身に着けたいという方には必須と言っても良いほど重要な英単語リストです。そして、この英単語をより効率よく覚えるために、AnkiやP-Study SystemにSVL12000に取り込む方法が昔から話題になることがあります。

SVL12000の詳細は本サイトのレビュー記事を参照ください。

SIL6000: SVL12000の熟語版

SIL6000 (Standard Idiom List 6000、標準熟語水準6000) は、SVL12000の熟語版のようなものです。アルクが選定した6000の熟語が600語/1レベルで区切られており、SIL 1~10の10レベル存在します。ただし、現在ではSIL関連の書籍は出版されていないので、入手するにはSILが掲載されているPower Idiomsを古本で購入するか、学辞郎からデータを抽出するしかありません (英辞郎からはSILを抽出できない)。

SIL1~10の掲載語の例は以下の通りです。

レベル掲載語例
入門SIL 1中学3年間で必須の600語A as well as BBと同様にAも、Bと同じように上手く、Bに加えてさらにA
・He’s been to Cairo as well as Athens.:彼はアテネと同様カイロにも行ったことがある。
初級SIL 2高校3年間で必須の600語a bunch ofひと束の~、たくさんの~
・I have sent her a bunch of flowers as a token of my apology.:お詫びのしるしとして、彼女に花束を送った。
SIL 3センター入試に頻出の600語a range of一連の~
・They had to tackle a range of difficult issues.:彼らは一連の難題に取り組まなければならなかった。
中級SIL 4難関大学に必須の600語a bit of aちょっとした~、取るに足らぬ~
・Brian can be a bit of a tyrant at times.:ブライアンは、ちょっとした暴君のようになることがある。
SIL 5超難関大学 & 英検準1級の600語a desk plan机上の計画、机上論
・It’s just a desk plan and is difficult to put into practice.:それは机上の理論に過ぎず、実行するのは難しい。
SIL 6TOEIC高得点を狙う600語a pain in the neck悩みの種、腹立たしいこと・人・もの
・For me, Tracey is nothing but a pain in the neck, and I’m happy when she doesn’t come with us.:私にとって、トレーシーは厄介者でしかないので、一緒に来ないときはほっとする。
上級SIL 7英検1級合格を狙う600語a black eye恥・不面目の印、敗北、不評
・The scandal was a black eye to his reputation.:そのスキャンダルは、彼の名声に傷をつけた。
SIL 8TOEFL高得点を狙う600語a bed of nails針のむしろ
・My last work environment was a bed of nails.:私の最後の仕事環境は針のむしろだった。
SIL 9英文雑誌が読める600語a bed of roses安楽な境遇
・You can’t expect marriage to always be a bed of roses.:結婚すれば、いつも安楽な境遇にいられるとは期待できない。
最上級SIL 10世界をさらに広げる600語a baker’s dozen13個組
・I have to buy a baker’s dozen of eggs for dinner.:夕食に13個組の卵を買わなければならない。

学辞郎と英辞郎

学辞郎とは

学辞郎とは、SVL12000とSIL6000を収録した辞書データです。英辞郎と比較すると、「SILが掲載されている」「SVL、SILすべてに例文がついている」という利点があります。一方、「発音記号がついていない」「単語の訳の情報が古い」という点には注意しておきましょう。また、オフライン辞書として使えるほど語彙が収録されているわけでもありません。SVL、SIL専用といっても良いぐらいです。

出版は2003年ですが辞書データはWindows 10でも利用できます。

ポイント
  • SVL12000とSIL6000を収録。SIL6000は学辞郎にしか収録されていない
  • SVL12000とSIL6000のすべてに例文が付属
  • 発音記号はついていない。また、単語の訳は古い
  • 2003年発売だがWindows10でも辞書データは使える

英辞郎とは

英辞郎とは翻訳家たちの団体 EDP (Electronic Dictionary Project) が編纂している辞書です。アルクが提供している「英辞郎 on the Web」で利用することができますが、パソコンなどで使える辞書データとしても販売されています。日々掲載語数が増えているため、最新の英辞郎ほど掲載語数が増えています。また、書籍版の英辞郎には「略語郎 (略語データ)」、「例辞郎 (英和形式の例文集)」、「和英辞郎」も収録されていおり、総合的な辞書として活用されている方も多いようです。

この英辞郎にはSVL12000の英単語も掲載されているのですが、第九版以降は仕様が変わったため、SVL12000が抽出できるのは第八版までの英辞郎です。第九版以降からデータ出力の機能が使えないので注意してください。

なお、英辞郎の辞書データのダウンロード販売は終了したという情報もありますが、英辞郎 第八版相当のテキストデータは、Pixiv Boothにて販売されています (2018年5月時点)。Pixiv Boothで購入できるテキストデータの形式は未確認ですが、おそらく英辞郎第六版に収録されている以下テキストデータと同等だと思われます。SVL12000の英単語には【レベル】という表記がついているので、頑張ればこのテキストデータからSVL12000の一覧を作成することもできますが、それなりに面倒なので書籍版の英辞郎を購入した方が良いでしょう。

英辞郎 第六版のテキストデータ

英辞郎 第六版のCDに収録されているテキストデータ (一部抜粋)

ポイント
  • 第八版まではSVL12000が抽出可能。第九版以降は抽出できない。
  • 全ての英単語に例文が付いているわけではない (例文付きの英単語もある)
  • SVL12000の殆どの英単語には発音記号がついている (古い版ほど発音記号がない単語が多い)
  • 略語郎 (略語データ)、例辞郎 (英和形式の例文集)、和英辞郎が付属しているので、辞書として活用の幅が広い

特徴一覧

種類データ出力出版年見出し
項目数
対応OSメディア同梱のPDIC
SVLSILWinMac
学辞郎2003年対応CDPDIC for Win32
英辞郎第一版未確認2002年100万95~XP8.1~9.1CD
第二版未確認2005年130万98SE~XP9.2.2~10.3.6CD
第三版未確認2007年150万2000~Vista9.2.2~10.4.8CD
第四版2008年166万XP~Vista10.4~10.5CDPDIC/Unicode
第五版2010年172万XP~710.4~10.6CD
第六版2011年182万XP~710.5~10.6CD
第七版2013年190万810.8CD/DVD
第八版2014年195万7~8.110.7~10.10DVD
第九版2016年202万7~1010.7~10.11DVDPDIC-R/Unicode
第十版2018年205万7~1010.10~10.13DVD

上記情報はAmazonの商品ページの情報、およびネット上の情報をまとめたモノなので、(特に英辞郎の第一版~第三版については) 情報が不正確な場合があります。対応OSには商品ページに記載のあるバージョンを記載してありますが、Windowsの場合は基本的に最新のOS環境でも利用できるようです。少なくとも私のPC (Windows 10) では学辞郎の辞書データ、英辞郎 第六版を利用することができます。

それぞれの掲載内容の違いについては、「accent」を例にすると以下の通りです。

種類英単語発音記号訳/用例
学辞郎accent【変化】《動》accents | accenting | accented
【名】なまり、アクセント、口調
・His Japanese has a Nagoya accent.彼の日本語には名古屋なまりがある。
【他動】~にアクセントをつける、~を強める、強調する
英辞郎 第六版accentǽksent【名-1】アクセント、強勢
【名-2】口調、訛り
【名-3】〔目立つ〕特徴
【他動-1】~にアクセントを置く[つける]
【他動-2】強調する
【@】アクセント、【変化】《動》accents | accenting | accented、【分節】ac・cent
英辞郎 第十版accentǽksent【他動-1】~にアクセントを置く[つける]
【他動-2】強調する
【名-1】アクセント、強勢
【名-2】口調、訛り
【名-3】〔目立つ〕特徴
【名-4】アクセント記号◆母音字の上に置かれることがある「`」のような記号や、それに似たいろいろな付加記号。必ずしも「発音上そこにアクセントがある」という意味ではない。◆【類】diacritic
【@】アクセント、【変化】《動》accents | accenting | accented、【分節】ac・cent

学辞郎には例文が掲載されていますが発音記号が無く、また訳も簡素であることが分かるかと思います。やはり辞書としては英辞郎 最新版の方が優れているのが分かりますね。ただ、ボキャビルを行う場合は1単語につき1~2個程度の訳をまずは覚えていくことになるので、学辞郎でも問題は無いかと思います。

学辞郎と英辞郎、どちらを選ぶべきか

SVL、SILの一覧が欲しいだけなら学辞郎

ボキャビル用にSVLとSILの一覧が欲しいだけであれば学辞郎で良いでしょう。特にSILを入手したい場合は学辞郎一択です。中古しか存在しないのでAmazonや楽天に在庫がある内に購入することをオススメします。ただし、Windows 10などでの動作保証はされていませんし、在庫切れの場合もあるので、その場合は潔く英辞郎を購入しましょう。

SVLの英単語には発音記号がついていないので、必要な場合は英単語を発音記号に変換するサイトを利用しましょう。詳細は後述します。

オフライン辞書としても活用したいなら英辞郎

英辞郎の特徴は膨大な掲載語数ですが、書籍版で購入した英辞郎には例辞郎 (英和形式の例文集) も付属しています。この例辞郎の例文数は第六版の時点で30万を超えているので、英文を書く際の参考となる例文が欲しいと思っている方に向いているのではないでしょうか。

なお、SVL12000を抽出するのであれば第八版以前の英辞郎が必要です。値段と相談しつつ第六版~第八版あたりを購入すれば良いでしょう。第一版~第五版でも問題ないとは思いますが未確認です。 (本記事の内容は学辞郎と英辞郎 第六版で確認)

あ、CD/DVDを読み込める環境が必要なので、PCにCD/DVDドライブが無い場合は外付けドライブが必要ですよ!

学辞郎

SVL12000とSIL6000を収録

英辞郎 第六版

辞書データVer.128/2011年4月8日版

PDICとは

Windows 向け辞書ソフト

英辞郎、学辞郎には辞書データを閲覧・編集するためのPDIC (Personal Dictionary) というツールが付属しています。このPDICには検索・出力機能がついているためSVLやSILの英単語一覧を出力することが可能ですが、いくつか種類があるので注意が必要です。

種類同梱している版補足
PDIC for Win32学辞郎
英辞郎 第一版~第三版
更新停止の旧バージョン。
発音記号を表示するには専用のフォントが必要。
PDIC/Unicode英辞郎 第四版~第八版現在も機能追加などが行われている現行ツール。
発音記号も表示できる。
PDIC for Win32の辞書データも利用できる
PDIC-R/Unicode英辞郎 第九版~英辞郎 第九版以降にのみ同梱されている機能制限版。
データ出力はできない。
PDIC for Win32、PDIC/Unicodeの辞書データを利用することはできるが、英辞郎第九版以降の辞書データは、PDIC-R/Unicodeでないと利用できない。

PDIC Ver 5.0より前のバージョンはPDIC for Win32、バージョン5.0以降はPDIC/Unicodeと呼称されています。変更点は「PDIC for Win32との違い」にまとまっていたので参照ください。

本記事で利用するのはPDIC/Unicodeです。学辞郎を購入した場合は自分で作者のホームページから最新版をダウンロード・インストールする必要があります。PDIC/Unicodeには旧バージョンの辞書を読み込む機能があるので学辞郎の辞書データも利用することができます。

ちなみにPDICはシェアウェア (有料) ですが、学辞郎・英辞郎購入者は支払いが免除されているため、別途支払いをする必要はありません。

Ankiとは

忘却曲線を利用した暗記補助ツール

Ankiとは忘却曲線を利用して効率よく暗記を行うためのツールで、世界中で利用されています。単語カードをソフトウェア化したようなものですが、単語の復習間隔を自動で管理してくれるため自分は暗記することにだけ集中できます。

同じようなソフトにP-Study Systemがありますが1台のPCで利用することが前提です。一方AnkiはWindows/Mac/Android/iOS版があり、データの同期が簡単な点が魅力です。つまり、単語カードの作成はパソコンで、自宅での暗記はタブレットで、外出中の暗記はスマホで、といった使い方ができるので、スキマ時間を活用したいとう方にはAnkiの方がオススメです。

AnkiはiOS版のみ有料 (どちらかと言えばiOS版の収益のおかげで他を無料にできているという状況)


学辞郎・英辞郎からAnki用のCSVファイルを作成する

概要

PDICのユーザー定義形式を活用してSVL一覧を出力する

あまり知られていませんが、PDICにはファイルの出力形式を自分で設定できる「ユーザー定義形式」という機能があります。この機能を活用することで、[英単語]「発音記号」「訳」「レベル」の出力有無や順序を任意に変更することができます。

以下、詳細を記載していきます。

事前準備

PDIC/Unicodeをインストール

PDIC/Unicodeのユーザー定義形式を設定してファイルを出力するわけですが、今回利用する機能は学辞郎に同梱されているPDIC for Win32では使えません。そのため、学辞郎を利用する場合は事前にPDICのホームページから最新版のPDIC/Unicodeを入手し、インストールを行ってください。その後、学辞郎の辞書データをPDIC/Unicodeにインポートする作業も行ってください。作業内容は「学辞郎のPDICをアップデートする方法」を参照ください。

英辞郎第四版以降の場合は付属のCD/DVDからPDIC/Unicodeをインストールしておいてください。なお、本記事の内容はPDIC/Unicode Ver 5.5.16 (英辞郎 第六版 同梱) で動作確認を行っています。英辞郎 第四版、第五版のPDIC/Unicodeで上手くいかなかった場合はPDIC/Unicodeを最新版にして試してみてください。

動作確認環境
学辞郎
英辞郎 第六版
PDIC/Unicode Ver 5.5.16 (英辞郎 第六版 同梱版)
PDIC/Unicode Ver 5.10.57 (2018年5月時点の最新版)
Windows 10
Excel 2016

学辞郎からSILを出力したい場合のみ、一部見出し語を修正

全ての環境に当てはまるか分かりませんが、私の環境では学辞郎のSILの8種類の熟語の見出しの先頭に「ダブルクォーテーション (“)」が含まれていました。これを残しておくとCSVファイルのレイアウトが崩れるので削除します。

PDICを起動し、学辞郎の辞書データが含まれる辞書グループを選択します。

以下熟語を検索したら検索結果の見出し語をクリックし、「登録語編集:修正」画面を表示します。

  • “A is one thing, B is another
  • “day in, day out
  • “hook, line, and sinker
  • “lock, stock, and barrel
  • “some ~, others …
  • “the 64,000 dollar question
  • “the more ~, the more …
  • “Tom, Dick, and Harry

見出語先頭のダブルクォーテーション (“) を削除し、OKボタンを押します。

8種類の熟語についてこの作業を行えば準備は完了です。

ファイル出力手順

① PDIC: 辞書グループの確認

辞書グループ選択

PDIC/Unicodeを起動し、[File]-[辞書設定<詳細>] を選択します。

英辞郎、または学辞郎の辞書が含まれている辞書グループを選択し、辞書設定画面を閉じます。

名称を自分で変更していなければ、英辞郎は「EIJI-xxx.dic」、学辞郎は「gakujiroU.dic」というファイル名となっていると思います。

② PDIC: 出力条件設定

全文検索設定

PDICの[Search]-[全文検索]を選択し検索画面を開きます。SVL/SILどちらを出力したいかによって、次のように条件設定が変わります。

SVLを出力する場合
検索対象訳語にチェック
検索文字列【 を含む
SVLの訳には必ず【】で品詞情報が記載されているので、【で検索することでSVLが特定できる
SILを出力する場合
検索対象見出語にチェック
検索文字列(半角空白) を含む
SILは熟語なので単語間には必ず半角空白が含まれてる。そのため、半角空白で検索することによりSILを特定できる
辞書の選択

条件設定画面の[検索辞書対象]ボタンを押し、辞書の選択画面を表示します。英辞郎、または学辞郎の辞書を選択し、OKを押します。

他の辞書にチェックが入っていても問題はありませんが、ファイル出力時の処理時間が長くなります
全文検索 – 詳細設定

条件設定画面の[詳細設定]ボタンを押し、詳細設定画面を表示します。以下のようにそれぞれ設定してください。

単語レベル制限チェックを入れる。1~12まで任意に設定
出力先ファイルへ
出力先ファイル名任意
出力形式ユーザー定義形式
ユーザー定義未定義の番号 (6~9) を選択

単語レベルは1レベルずつでも1~12 (SILの場合、レベルは1~10) をまとめてでもどちらでも構いません。ただし、複数範囲を指定した場合は、出力したファイルをExcel等で開き、レベル別に並べ替えてください。

ファイル名の拡張子は、Excelがある場合はcsv、無い場合はtxtにしてください。(svl.csvやsvl.txt など)

全文検索 – 詳細設定

詳細設定画面で[編集]ボタンを押し、テンプレート編集画面を表示します。以下いずれかの書式をコピー&ペーストし、OKを押してください。

書式の最後に改行が入らないように注意
SVL 2項目$w\t&N($p,|) &N($j,<br>)(SVL$l)
SVL 4項目$w\t&N($p,|)\t&N($j,<br>)\tSVL$l
SIL 2項目$w\t&N($j,<br>)(SIL$l)
SIL 3項目$w\t&N($j,<br>)\tSIL$l

2項目の書式 ([見出語]、[発音記号+訳+レベル])か3・4項目 ([見出語]、[発音記号 (SVLの場合)]、[訳]、[レベル])の書式どちらを選ぶかはAnkiの設定に合わせてください。Ankiの初期設定では2項目しか受け入れられないので、よくわからない場合は2項目用の書式をご利用ください。また、この書式の詳細については補足の項目で説明しているので、自分でカスタマイズしたい場合はそちらを参照の上変更してください。

ファイル出力実行

全ての設定が終わったら、条件設定画面の[OK]ボタンを押します。するとファイルの出力が始まります。

これでファイル作成は完了ですが、このままではAnkiで読み込むことができません。次で説明するようにメモ帳やExcelで文字コードの変更だけ行う必要があります。

③ PDIC: 文字コード変更

メモ帳で変更する場合

出力したファイルをメモ帳で開きます。文字が改行されていなくても問題ありませんので、そのまま[ファイル]-[名前を付けて保存]を押します。

保存画面が表示されるので、文字コードの設定を「UTF-8」に変更して上書き保存を行ってください。これで作業は完了です。

完成したファイルはタブ区切りのCSVファイル
Excelで変更する場合

Excelでファイルを開いたら、[ファイル]-[名前を付けて保存]を選択し、CSV UTF-8 (コンマ区切り)を選択して保存してください。これで作業は完了です。

完成したファイルはカンマ区切りのCSVファイル

Ankiで読み込めるSVL、SILの英単語一覧の作成は以上で完了です。



補足情報

英辞郎にはSVL12000が全て揃っていない…?

理由は不明ですが、英辞郎第六版にはSVL12000のうち、11967語しか掲載されていませんでした。不足している単語は以下の通りです。

SVL 1will
SVL 2jean
SVL 3politics

アルクが公開している単語一覧や書籍版・スマホアプリ版の究極の英単語 [SVL12000]には掲載されていますが、英辞郎 第六版および英辞郎 on the Webでは上記単語はSVLのレベルが削除されるか、掲載自体されなくなっています。気になる場合は手作業で単語を追加してください。

また、SVL 1のMissという単語も最新の英辞郎では削除されています。英辞郎 第六版では見出し語のみ掲載されていますが訳は空欄になっていました。このようにSVLの単語は英辞郎の版に若干変更が加えられているようですが、わずか数語なので気にしなくても良いかと思います。

発音記号を付ける

英単語を発音記号に変換してくれるサイトを利用

ファイルの出力自体は上記までの作業で完了しましたが、学辞郎でファイルを作成した場合は発音記号がありません。もし発音記号が欲しい場合は以下サイトを利用し、英単語を発音記号に変換してファイルに追加してください。

IPAとジョーンズ式発音記号の対応は「発音記号 Jones 式 と IPA 式 について」や「Phonetic Symbols」が参考になるかと思います。

SVLの音声はどうするべきか

自動音声読み上げ機能で対応

市販のSVL12000の音声は1単語ずつトラックが分かれていないため、Anki用に音声を分割するのは手間です。Ankiにはコンピュータの自動音声読み上げ機能を利用する方法があるので、そちらを活用しましょう。

もしネイティブ音声も確認したいという場合は、個人的にはAndroid/iOS用の究極の英単語アプリがオススメです。このアプリは\2400という価格ながらも12000語の音声、単語が収録されています。Ankiと合わせ、移動中などの隙間時間には音声で復習をすると良いのではないでしょうか。アプリについては本サイトのSVL 12000レビュー記事中で言及しているのでそちらを参照ください。

究極の英単語 【All-in-One版】 © PlaySquare Inc.

Ankiでファイルを読み込むときの注意事項

出力したファイルの項目とAnkiカードのフィールドを対応させる

英辞郎からSVLを見出し語、発音記号、訳、レベルに分けてファイルを作成した場合、Anki側でもこの4つの項目を受け入れる設定が必要です。概ね以下のような感じになるかと思います。

ファイル読み込み時

ファイルを読み込む際、改行を<br>に置換した場合は「フィールドに HTML を使う」にチェックを入れておく必要があります。

ユーザー定義形式について

PDICのユーザー定義の仕様

本記事で紹介したユーザー定義の書式について説明しておきます。

PDICでは検索結果をファイルに出力する機能がありますが、どのような形式で出力するかいくつか選択肢があります。ここでユーザー定義形式を選ぶことで、自分の好きな形式で出力できるようになります。1~5まではテンプレートとして事前に登録してあるので、基本的には6~9番を選び、自分で好きな書式を設定していくことになります。

例えば書式に「あいう」と設定した場合、検索にヒットした単語の数だけ「あいう」という文字が出力されたファイルが出来上がります。

書式として直接文字を指定すると、その文字がただ出力されるだけで使いものになりません。そこで、検索した単語の「見出し語」「発音記号」「訳/用例」「レベル」を指定する特別なキーワードを利用します。

例えば、見出し語を指定するキーワードは「$w」、発音記号は「$p」です。これらを使い「$wあいう$p」と書式に設定してファイルを出力すると、以下画像のように「見出し語+あいう+発音記号」が出力されます (1行目のaの発音記号は英辞郎 第六版に登録されていないので空欄)。

さて、ここで訳/用例のキーワードは「$j」、SVL/SILのレベルは「$l」なので、全てつなげて「$w$p$j$l」と設定すればよさそうに思えますが、この設定では以下のように出力されます。

ここで問題なのは、辞書に登録されている改行はそのまま出力されてしまう事です。このままではAnkiで読み込むことができないので、改行を別の文字に置換する書式「&N()」を利用します。

例えば、&N($j,★★★★★) と設定すると、訳/用例に含まれる改行が★★★★★に置換されて出力されます。

加えて、Ankiで読み込むために「見出し語」「発音記号」「訳/用例」「レベル」を区別できるようにする必要があります。一般的に区切り文字としてカンマ (,) が使われるのですが、英語の例文の中でカンマが使われているためここでは使えません。そこでタブを代わりに利用します。タブを表すキーワードは「\t」です。

したがって、本記事で利用しているSVL 4項目用の書式「$w\t&N($p,|)\t&N($j,<br>)\tSVL$l」は以下のような意味になります。

項目をタブで分けているのは、CSVファイルとしてExcelで開いたときに列が分かれるようにするためです。また、訳/用例の改行を<br>に置換しているのは、Ankiで読み込むと<br>は改行に変換されるためです。

その他のPDICのユーザー定義の仕様は「ユーザー定義フォーマット」に記載されています。ただし、内容が古いのか、そのページに記載されていない書式もあるようなので注意してください (発音記号の $p など)。

もっと細かく編集したい場合

正規表現を利用する

本記事で紹介した方法では英辞郎の内容をそのまま抽出しているため、かなり長い文章となる部分もあります。例文だけ別に抽出したい、英単語の活用形の情報は不要なので削除したい、という場合はPDICの機能では対応できないので、自分で編集するしかありません。

正規表現を利用すれば一括で編集ができるようになるので、興味があれば以下の情報などを参考にしてください。

英辞郎の別の活用方法を考える

任意の英単語一覧に訳を結び付ければ…

英辞郎を購入したのであれば、SVLを抽出する以外にも活用したいものです。

まず、英辞郎の項目数は第六版の時点で182万に達しています。これは熟語なども含んだ数で、純粋に単語単体 (空白やハイフンを含まない見出し語) の数は約22万語ほどでした。182万からは随分減りましたが、それでも22万語もあれば日本人の英語学習者が必要とする英単語はほぼすべて含まれていることでしょう。

つまり、任意の英単語と英辞郎の訳を結び付けることができれば……この辺りの具体的な方法については近日中に記事にまとめる予定です。

終わりに

できるだけ不明点が無いように多くの情報を掲載

学辞郎・英辞郎からSVL12000のデータをAnkiやP-Study Systemに取り込む方法は既に色々情報がありますが、そもそも学辞郎・英辞郎の違いが良く分からなかったり、紹介されているツールがすでに使えなかったりするなど、色々不明点があった方も多いのではないでしょうか。

なるべく疑問が残らないように多くの情報を掲載しましたので (その分長くなりましたが)、お役に立てば幸いです。

あくまでも個人利用に限る

英単語およびその発音記号、訳には著作権はありません。しかしながら、特定の意図をもって作成された「英単語リスト」「例文」および「訳のレイアウト」には著作権が発生します。

したがって、SVLの英単語リストや英辞郎の例文、訳などをそのままインターネットに公開することは著作権を侵害する行為です。本記事で紹介した方法で作成したファイルは、あくまでも個人利用に留めるようにしてください。

学辞郎

SVL12000とSIL6000を収録

英辞郎 第六版

辞書データVer.128/2011年4月8日版