忍者ブログ
サキヒットベー♪
 このブログは、昭和36年3月に宮崎県小林市の中学校を卒業した、同級生146名の近況報告をはじめ、同級生同士の情報交換や同窓会開催連絡、昔の思い出などを語り合うためのものです。総ての記事は同級生からの投稿で運営していきます。ブログ記事の文字を大きく表示して見易い画面フォーマットに変更しました。パソコン画面を横に広げると、ブログ記事も横方向に広がり、1行当りの文字数が増えて読み易くなります。【平成27年3月23日】



  
忍者ブログに乗り換えたのが2010年4月。
その忍者ブログ『サキヒットベー』の電子化編集作業が終了した。
己の使命だと思って休むことなく、真面目に編集作業に取り組んできたので予定通り3月20日で完了した。編集は投稿者別に集約。
その主なものは、①ブログ管理者(以下順不同・敬称略)②Y-守夫③K-秀之④H-靖子⑤M-民子⑥K-洋子⑦都わすれ⑧匿名希望⑨同窓会関係⑩忠さん写真集⑪還暦同窓会写真集となった。

編集が終了した時点で、USBメモリーに移したところ、約400MB(メガバイト)でブログと住所録が格納できた。
USBメモリーは4GB(ギガバイト)を用意したのに、その10分の1で収まったのである。
当初は、ブログに添付している写真だけでも、軽く1GBは超えるだろうと想定していたので、添付写真は総て500KB(キロバイト)以下に縮小してサイズを減らしたのが奏功したものである。
紙にプリントアウトすると3000枚は超えるボリュームだったのに、電子化したら僅か400MBに収まったのである。
想定外の好結果になった。嬉しい誤算である。電子化の素晴らしさを改めて再認識した。

そこで、こんなことを考察してみた。(脳活:頭の体操)
岩波書店発行の『広辞苑』という国語辞典(写真)がある。
これは昭和57年10月15日発行されたもので、そのボリュームは2,448頁に及んでいる。
広辞苑の辞書の部分の文字数を数えると、1頁当り5,000字(50行*25字*4段)となっている。(写真下)
この広辞苑の1冊分の文字数の合計は12,240,000字(2,448頁*5,000字)となる。

これを電子化(コンピュータ化)して、USBメモリーに保管した場合のディスク容量は.....
コンピュータ上の『漢字』や『ひらがな』は『倍角』と言い、1文字当り2byte(バイト)を割り当てなければならない。
従って、広辞苑1冊分の12,240,000字は、24,480,000B(バイト)が必要となる。
気の遠くなるような数字だが、これを分かりやすい単位に変更していくと.....24,480,000B/1,024=23,906KB(キロバイト)となり、更に23,906KB/1,024=23.35MB(メガバイト)となる。
広辞苑1冊分は、電子化すると23.4MBで収まることになる。
つまり、このUSBメモリー(4GB=4,096MB)には、広辞苑175冊分を収納できることになる。
これが、コンピュータ(電子化)の凄いところである。

しかしここで、ある疑問が湧いてくる。
それは、広辞苑とブログを比較した場合、誰が見ても広辞苑のほうがデータ量(文字数)は多い筈なのに、ブログの方が逆転して更に16倍の差が出ていてる事である。
これには、以下に示す2つの大きな要因がある。
①ブログには写真を添付しているが、広辞苑にはない。
サイズ500KB(512,000B)の写真1枚は、漢字の何文字に相当するのか......漢字(倍角文字)1文字は2B必要なので、512,000Bは、漢字256,000文字に相当することになる。
更に、この漢字256,000文字は広辞苑の51頁分に相当する。
②ブログは読みやすくするために、改行しているが広辞苑にはない。
1行分の空間を設けることは、1行分の”スペース”というデータを入れているのである。
以上2つの要因から、広辞苑よりもブログの方がディスクを大量に使用することが分かる。

上記の通り、広辞苑での数字は文字をびっしりと詰め込んだときの状態なので、このままでは人が見ても分からない。
そこで、使えるデータとして管理するには、検索項目毎に空間や改行を設定しなければならない。
例えば、2行毎に改行することを加味すれば、辞典文字数の50%増を付加することになる。
従って175冊の約50%減(87冊前後)が妥当かもしれない。いずれにしてもこの小さな器(USBメモリー)に、広辞苑87冊分が収納できるなんて想像できないほどの優れものである。

【参考】漢字やひらがなは『倍角』だが、『半角』の文字(『カタカナ』や『数字』)などは、1文字当り1byteとなる。
1KB(キロバイト)は1,024B。1MB(メガバイト)は1,024KB。1GB(ギガバイト)は1,024MB。
通常10進数は10の3乗で『単位』を区切っていくが、コンピュータは2進数なので、2の倍数で区切っていくことになる。
つまり、1,2,4,8,16,32,64,128,256,512,1024となるので、1024で単位を入れ替えている。
通常世間一般ではディスク容量管理の単位は、10の3乗区切りで表現しても何の問題もない。【K-正人】

【写真】広辞苑とUSBメモリー(上)。見開きの2頁分だけで1万文字ある(下)。物理的には広辞苑のケースの中にUSBメモリーが100個以上は軽く入りそうだ....。

PR
この記事にコメントする
お名前:
タイトル:
文字色:
メールアドレス:
URL:
コメント:
パスワード:   Vodafone絵文字 i-mode絵文字 Ezweb絵文字
- HOME -
Powered by      忍者ブログ | [PR]
カレンダー
09 2017/10 11
S M T W T F S
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31
画面編集変更(RSS)
来訪者数(カウンター)
過去の月別記事
最新コメント
[03/28 未記入]
[01/06 あゆみ]
[06/12 未記入]
[01/26 あゆみ]
[08/20 古賀秀之。]
ブログ内検索
バーコード