fc2ブログ

漢直ノート

日本語入力方法の一つである、漢字直接入力(漢直)の練習日記や、日々のつれづれ事を書いています。

ひらがな1-gram表

2005/10/08 Sat 00:57:34

「全ひらがなに直した」 1文字頻度表を出しました。(2-gramはやり直し中)
ソースは約一年分の日記やメモからです。

順位 文字 使用回数 頻度(%)
1 い 57935 5.155
2 ん 42701 3.799
3 う 36148 3.216
4 。 35952 3.199
5 か 35851 3.190
6 し 33494 2.980
7 な 32795 2.918
8 、 31925 2.841
9 と 30033 2.672
10 た 29796 2.651
11 っ 27479 2.445
12 の 26369 2.346
13 て 25363 2.257
14 ・ 24611 2.190
15 SPC 20195 1.797
16 も 19892 1.770
17 く 18983 1.689
18 き 18544 1.650
19 で 18312 1.629
20 が 18209 1.620
21 こ 18158 1.616
22 に 17914 1.594
23 ー 17901 1.593
24 は 17621 1.568
25 る 17416 1.550
26 だ 17202 1.531
27 あ 16108 1.433
28 す 15279 1.359
29 ま 14967 1.332
30 ら 14576 1.297
(表がズレてるのが直らない・・・)

いんう。かしな、とたっのてもくきでがこにーはるだあすまらおりれさょじよけわつどそちえをやねろみせゃほめ!ひばふむぶゅげ?ごずぎぱ(「」)びぜぐ~べゆへぼ ぷざぽぞぃぴぬづぁぇぺぅヴぉぢ

……ふむふむ。やはり「。」が多いなあ、という印象です。これは、
・「。。。」と、語尾にたくさんつける事がある。
・メモ書きも多いので、一文が短い。

――この二つが原因かな、と思います。

そして、「ん」が漢カナ交じりの表と比べて多い。
あと「か」「う」ですね。Uジローさんがコメント欄で推察してくれたように、漢語が原因なのでしょう。それにしても、こんなに増えるとは思わなかったです。
☆おまけ
順位や頻度つきの全データをダウンロード
hiragana1gram.txt
スポンサーサイト



  1. 配列関連

≪ 個人による1-gramの差 | HOME | タグとか配列とか >>

Comment

Post Comment

管理者にだけ表示を許可する
Calendar
08 ≪2023年09月 ≫ 10
S M T W T F S
- - - - - 1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
Categories
漢直とは : 3
漢直色々 : 61
漢直練習日記 : 66
日常 : 97
はじめに : 4
配列関連 : 57
P-Study System : 24
音楽と漢直 : 5
奏コード : 23
ソフト : 21
アウトラインプロセッサ : 7
未分類 : 0
Recent Entries
05/06/27の日記 2
05/06/27の日記
3打鍵漢字
ちょこっと練習と練習方法
05/06/26の日記 2
Recent Comments
Recent Trackbacks
Archives
2006年10月 : 1
2006年09月 : 8
2006年08月 : 13
2006年07月 : 15
2006年06月 : 13
2006年05月 : 14
2006年04月 : 16
2006年03月 : 17
2006年02月 : 33
2006年01月 : 51
2005年12月 : 58
2005年11月 : 62
2005年10月 : 39
2005年09月 : 28
Introduction
Author:みのり
みのりです。このブログは漢直に関する話題を書いています。taffy632@yahoo.co.jp
「漢直ノート出張版」
(ファイルやタイピング動画があります)
RSS
Search