2006/04/18 Tue 21:29:36
単漢字ごとの練習にも限界を感じてきたのと、もう少し丁寧に練習をしたくなり始めたので、単語ごとの練習も始める事にしました。
単語練習は一番バランスがいい気がするのですが、いい問題集が作れないので、今まであまり手をつけてませんでした。でも今回は、このソフト! KH Coderを使って自分の頻度からの単語練習問題を作ってみます。(☆KH Coderについては
過去の参照記事)
KHCoderのいいところは、「分かち書き」、つまり品詞ごとの形で認意の文字を含む単語を取り出してくれるので、きちんとした日本語の形でデータを扱えるところです。
それに、特定の品詞を結索結果に含めないことが出来たり、コンコーダンスで、認意の文字が使われている文脈を取り出したりも出来るので、多彩な問題集の作り方が考えられます。
で、チャレンジ。まずは自分の文章をかたっぱしから一つのテキストに集める。
それから、「前処理の実行」をするのですが、ここでエラーが続発してしまった。
どうやら集めたテキストにUnicode文字が混じった事が原因のようです。タグなどで長い文字列があってもエラーになります。
それらを何とか取り除いて、再開。まずは正解率の悪い二打鍵漢字を、抽出していくことにしました
。「活用形を表示」のチェックを外して実行。
こんな感じで結果が出ます。

――「覚」の抽出結果です。
この作業は非常に楽しいです。上のキャプチャの検索結果はわりと普通だけど、かなりかたよった検索結果が出ることの方が多く、こんな単語を書いた事あったっけ? とか、あーなつかしいなつかしい、とか。
どんな文脈で使ったのかを知りたくて、左下にある「コンコーダンス」を押して確認してしまう事もしばしば。すると断片的に過去が蘇る……。
KHCoderの長所の一つとして、最初に「前処理の実行」をしたあとは、大量のファイルでも短時間で検索結果を出してくれる点があげられます。10Mあるテキストファイルでも、詳細な分析結果が出るまで、およそ1~2秒くらい。次々に気軽な気持ちで検索出来るので、配列とか関係ない人でも、このソフトで自分の文章を試してみたら面白いかな? と思います。
抽出した結果はエクセル形式でコピーされるので、楽にPSS問題形式に加工出来ます。

練習中の様子。あやっぱり単語ごとだと打てないのが多いなあ。
今のところは特定の漢字ごとにやっているけど、全体的に頻度の高い品詞から練習をしてもいいかもしれない。

――これは「漢字」の連関規則。練習問題には使えなそう? だけどつい色々試してみたくなってしまう。
スポンサーサイト
- P-Study System
-
Trackback(-)