資料/本のデジタル化方法とコツ
*著作権の問題がありますので、自分の資料や本をスキャンして自分で見るということにご活用ください。
「大量にたまった資料、本棚や押し入れを圧迫している本を整理したい!」「また、自宅でゆっくり読めない大量の資料や重いマニュアルなどをモバイルPCで見られれば!」そんな方のためにその方法とコツを公開!
これらの本をJPEG形式やPDF形式でデジタル化しておけば、今日では、いつでもどこでもパソコンで見ることができます。また、見開きソフトを使えば、本当の本のように見開きで読むこともできます。
さらに、近い将来、電子ペーパーなどを素材にした雑誌ザイズで150グラムを切る軽い端末が登場することは間違いないでしょう。
そうであれば、なにも本棚や押し入れを占領させておく必要はないですし、重い本をバックに詰め込んで歩く必要もないわけです。
普通の紙資料のスキャンはご想像できると思いますので。ここでは、本のスキャンを中心に書いていきます。
★では、そういう本を、簡単に安価にデジタル化できるか?★
企業向けの大量資料のデジタル化サービスは存在します。しかし、本のように閉じてある資料をスキャンしてくれるサービスは見あたりません。図書館向けに書籍をデジタル化する機械が、2500万円で販売されてはいますが論外でしょう。
★普通の家庭用フラットベット型スキャナーで読み込ませる?★
ご自分で、本をそのまま家庭用のフラットベット型のスキャナで読み込ませるとなると、本を開いて、スキャナのふたを押さえながら、スキャンすることになります。
特に、見開きがA4サイズを超えるサイズの場合は、家庭用のスキャナは概ねA4サイズまでですから、見開き一度にというわけにはいきません。半分ずつスキャンできるように、微妙にずらして押さえながらやることになります。
その場合、微妙な本の曲がり具合と盛り上がりで、まっすぐ、傾かないように読ませるのは、至難の業です。そして、スキャンの速度はスキャナーをお持ちの方ならお分かりのように、機種や解像度にもよりますが、一枚30秒〜3分ほどかかってしまうものですから、数冊ならともかくも、たとえば、30巻シリーズの漫画本なんて、読み込もうものなら、とても大変な作業になります。
では、もうすこし、スピーディーにできないかと考えると、業務用のスキャナーの利用です。すでに一部のコンビニにはあるかも知れませんが、すでにオフィスのコピー機はアウトプットが、紙ではなく、デジタルのものがあります。
しかし、この場合でも、おそらく、コピー機のビジネスモデルからすると、紙代やトナー(インク)代がいらないから安くなるなんて期待しないほうがいいでしょう。もともと、紙とかトナーなんて、原価は安いわけですから。
おそらく、A3サイズまでで、白黒8円、カラー50円というところが限界でしょう。
400ページのカラーの本が20冊あったとすると一冊200スキャン(見開きですので)×20冊×50円=20万円。
う〜ん、高い!そして、これではコンビニで寝泊まりしないといけなくなってしまいますね!
★かつ、大きな欠点が!★
ここまで、説明しながら、今更言うのも申し訳ないのですが、ここまでのフラット型スキャンでの最大の欠点は、本の中心部がどうしても歪んだ文字になってしまうということにあります。
中心部はどうしても、浮き上がります。英語辞書なんてフラット型のスキャナーで読み込んでも、中心部はページの真ん中部分が黒くなって読めないでしょう。
「本のデジタル化のポイント」
★本は分解し、一枚一枚の紙にしてしまうこと!★
本は概ねどのような本でも分解できます。
分解し、一枚一枚同じサイズの紙にして、自動両面読み込みのローディング型スキャナーで読み込ませるのが一番早くできます。
そういう自動読み込みで、両面同時に読み込ませ、スピーディにやりたいなら、FUJITSUのScanSnapというスキャナーがあります。
★どうやって本を分解するのか★
(1)表紙を剥がす
厚い表紙を「ゆっくり、じわじわ」と、表紙だけを引っ張って剥がしてしまいます。
ほとんどの本がこれで表紙、背表紙、裏表紙ともに剥がされ、糊付けだけされた裸の本になります。
多くの本は、ボンドのような、弾力がある接着剤でとめられていますので、表紙をとってもバラバラにはなりません。
*表紙はがしのコツ:ゆっくりとやることです。急にやると破れます。それでも、だめな場合は、ドライヤーで背表紙の方から暖めてやると、接着剤がやらかくなるので、暖まっている間に、剥がしてゆきます。それで剥がれない場合は、ドラウバーやカッターで切り込みを入れながら剥がします。もともと、自動ローティングのScanSnapでは、厚いものは読めないので、その部分は、あきらめるか、別途フラットベッド型スキャナで読ませることになります。
(2)カッターで正確にページをカット
まず、定規を、本の縁(糊付けされているほう)から、のり付けされていなさそうなところまで、定規で正確に計り、そこで、カッターで少しずつカットします。さすがに一度では切れませんから、切るたびに、パラパラと離れていきますので、最後の裏表紙が切断されるまで、何度かカッターを走らせます。
この方法はシンプルなのですが、最大の欠点は、見開きでつながっている部分がカットされてしまうことです。
*カットのコツ:定規がカットする毎にズレたり、カッターの刃が直角になっていないとズレてカットされます。それによりページのサイズが異なったり、正四角形でないものが出来上がります。 そうするとスキャナーのローディングで、傾いてスキャンされる場合がでてきます。ですから、面倒でもページを分けて、少しずつ、定規を正確にあて、カッターを90度にたて、すべてのページが正四角形かつ同じサイズになるように努力します。
また、手で押さえて定規をあてるだけでは、不均一なサイズの紙ができそうであれば、定規と本がずれないようにいろいろな工夫をしてみてください。私の場合は、簡単にいうと、本と定規がずれないような枠をつくり、カットする長さを可変で調整できるように木材とクランプ(モノを固定するもの)で専用の台を本に合わせてその度に作っています。
参考)ここで紹介したように、カッターでカットせず、糊の部分をきれいにとって剥がしていくという方法もあります。この方法ですと、カットしたページのサイズが異なるということもありません。
しかし、実際にやってみると、糊のカスが各ページに残り、自動スキャンするときに、エラーが多発して、その度に、やり直しになることが多くあります。いくらきれいに糊カスをとっても、なかなか、取り切れません。その糊カスが、次のローディングを待っているページを引き込んで、斜めに読み込ませたり、二枚重ねてローディングしたり、ひどい場合は、コピー機が詰まったときのように、ビリビリやぶれてしまいます。リスクがありますし、手間もかかります。
そして、普通の本では、のり付けされた余白もスキャンされ、かえって片方の空白が多い違和感のある画像になってしまいます。
以上の理由で、私はカッター切りをおすすめしているわけです。
ただ、写真集をはじめとして、見開きつながっているものをスキャンする場合は、このカットなしで手で剥がす方式しかありません。さらに、見開きの写真をきちんと左右つなげるには、画像編集作業が必要となります。
(3)雑誌などでホチキスでとめられているもの
まず、雑誌を破らないように、ホチキスを外します。そうすると、見開いた形でバラバラになります。その丁度真ん中をカッターでカットするわけです。バラバラでかつ、紙がカーブして盛り上がっている場合が多いですから、丁度真ん中でカットするのは意外に難しいものです。
★では、どうやってスキャンするのか★
ここでは、ScanSnapを使った方法を紹介してゆきます。(メーカ側で新しいソフトにバージョンアップされたような場合は操作のイメージとして見てください)
(1)ScanSnapの設定のポイント
@「原稿サイズ」>「カスタマイズ」
読ませたい本の縦横を物差しで測り、それをScanSnapのマネージングソフトで「原稿サイズ」>「カスタマイズ」で登録します。「サイズ自動選択」というのもありますが、ページごとにサイズが異なったり、また、空白ができたりしますので、実際より2〜5ミリくらい小さめのサイズで固定させて登録しておきます。だたし、両ページ見開きで完璧につながっていることを望む場合は、その逆で、すこし、実際のページよりも横幅は大きなサイズでスキャンし、すべてのページを編集ソフトで、余分なところをカットし、きちんと左右整合するように編集操作することになります。
A「読み取りモード」
「画質の選択}:ノーマル、ファイン、スーパーファイン、エクセレントとありますが、本の文字サイズ、自分のパソコンの画像サイズや閲覧するソフトによって、同じ写真でも、読みやすさが異なりますので、まずは、ノーマルでためして、だんだん、上に上げていきましょう。
「読み取り面の選択」:両面を選択
B「読み取りモード」の「オプション」
「文字をくっきりします」はONでもOFFでもやってみて較べてください。私はOFFにしています。読み込ませる本によって異なります。
「白紙ページを自動的に削除します」:OFFがおすすめです(これは親切な機能なのですが、目次の裏、中表紙の裏、章の区切りなどでは白紙のページになる本では、勝手に白紙をスキップされると、見開きの漫画などでは、ページがズレますので、見開きでみたい場合は、OFFにしておきます)
「文字列の傾きを自動的に補正します」:やってみてください。私はOFFにしています。(写真集や写真や絵があるページでは、かえってこれが仇になり、逆に斜めにしてしまうので注意が必要)
「原稿の向きを自動的に補正します」:OFFがおすすめです(上と同じく、逆に逆さまにする場合があります)
C「ファイル形式」:
読み込ませるファイル形式ですが、JPEGかPDFが選べます。私はJPEGをとりあえずおすすめします。PDFはアクロバット(有料)を持っていて、かつ多少の傾きは気にしないならば、最初からPDFでもよいでしょう。事実、私の個人の資料はPDFで読ませてしまっています。ただ、アクロバットでは、微妙な傾きを修正できないようです。傾いた資料は許せないという場合には、まずはJPEGにしておいて、あとで、一括してPDFに変換するほうが安全でしょう。一括でPDFにするフリーのソフトがあります。
原稿のカットで歪んでいたり、紙質によって、何度スキャンしても歪みや湾曲がでるものがありますので、そういう微妙な傾き修正が可能なJPEG形式でまずはスキャンすることを、ここではおすすめしておきます。
以上がScanSnapの設定での主なポイントです。
(2)ScanSnapで読み込ませる時のポイント
ScanSnapの読み込みトレイ(厚さにもよりますが30〜40枚は入ります)にいれて、ボタンを押します。エクセレントという高画質(カラー600DPI)でなければ、シャカシャカと素早く読み込んでくれます。
そして、傾いたり、二枚同時に読んだりした場合だけ、エラーの画像を消し、再度、そこだけスキャンします。
ただ、先ほどのページのカットが上手にされていないとか、滑る紙質の場合には、素直にスキャナーに置いておくだけでは、スキャン画像が傾いたり、歪んだりすることがあります。
そんな場合には、一工夫必要です。私の場合は、まず、紙がずれないように両脇から押さえているプラスチックのガイド(プリンタの用紙トレイと同じです)があるのですが、そこにクリップをつけ、ゴムで引っ張り合うようにしています。プリンタの紙のように完全均一であれば、ズレないのですが、カットした紙はいくらかの歪みやささくれがありますから、それをゴムで引っ張ることによってガイドが広がっても元に戻るようにするわけです。しかし、それだけでは、足りない場合もあります。その場合には、より上部のところにも自分で木材やプラスチックで、本のサイズに合わせてガイドつけたりします。意外に、原稿の向きを上下逆にすると綺麗に読めたりするので、うまくいかない場合は、工夫が必要になる場合があります。
★スキャン時と再スキャンのポイント★
特に、注意しなければならないのは、二枚重なってローディングされた場合です。両面読みですから、二枚同時に読み込まれた場合は、最初の紙の裏のページと、二枚目の表のページが読み込まれていません。そのまま、再度スキャンすると、連番をそのまま、後ろにつけていきますので、そのふり直しでページが前後しないようにファイル名をふり直す必要があります。私の場合は、スキャンするときはすべてきちんとスキャンされているかを見張っていて、斜めや二枚読みをした時点で一旦スキャンを中止し、失敗したファイルを消してから、再度スキャンしています。
以上で読み込み完了です。
そして、見開きでみたい場合には、このスキャンしたファイルの間に、ページ合わせの画像(白や黒のページ)を入れ込む必要があります。その時は、見開きの左右ページのページサイズが同じになるようにします。そうしないと、サイズが異なり開いた時に右左のサイズが違う段違いのページができてしまいますし、PDFにしたときに、大きなサイズで統一されてしまうため、他のページが小さくなってしまうということにもなります。私の場合は、ページ合わせの画像を作るときは、左右サイズが同じになるように、見開き一方の文字のある画像をソフトでコピーし、それを画像加工ソフトで減色>色の入れ換えなどで、白または黒ページをつくるようにしています。
★どうやって読むの?★
見開きにこだわらなければ、多数のソフトがありますし、すでにお使いのJPEGビュアーで見てください。
見開きにこだわるなら、フリーソフトで、Leeyesなどがおすすめです。
文字が小さい場合、モバイルPCなど小さい画面の場合で、横書き文章であれば、PDFにしてアクロバットリーダー(無料)で見るのが良いようです。
無料の一括PDF変換ソフトが数多くありますので、それらをつかって一つのPDFファイルに統合してください。
さて、私の場合、人から頼まれてスキャンを代行してあげることもあるものですから、きちんとズレなく綺麗に完成させる方法を工夫し、そのことを書いてきましたが、あまり細かいことを気にしなければ、手を抜くところもたくさんあります。
ぜひ、ご自分でTRYして、ご自分のやり方を発見してみてください。
ご質問があれば、お答えしたいと思っています。



test