残しておきたい雑談がある

リニューアルしたなぽりんブログ。(日常報告よりちょっとまとまったネタ)

ScanSnapS1500レンタル日記

こんにちはなぽりんです。名古屋の小さなレンタルショップに自家用車でのりつけて借りてきました、ちょっぱやシートスキャナー。(フラットベッドみたいにばたばたしなくていいやつです。詳しくはスキャンスナップ速さでググればでてくるとおもいます)
4日分の行動を1日にまとめているので、長文注意ですぞ。

借りるとき

・今回レンタルするのは名古屋で数少ないシートスキャナレンタルショップでこれもぐぐればでてくるかと。郵送貸し出しもやっているので全国対応。
・自営と名乗ると実家の住所をかかされて面倒なのでおとなしく主婦にしておけばよかった
・自動車は店前にキチンと寄せてとめよう…(駐車ヘタです)
・畳むとA4のばせばA3くらいのサイズの本体についてひととおり使い方は教えてもらった
・あとで気づいたが、OCRの最終手段であるはずの、アドビアクロバット(リーダーではなくアクロバット9本体)が付属しているはずだが、さすがにライセンス数の都合でか、そもそも未バンドル品だったのか、そのDVDは貸し出してくれなかった。

セットアップ

ScanSnap よくあるご質問 (PFU)
・意外と簡単そう。ファイルのありかは、ドライバーはスキャナ本体に。ユーティリティであるスキャンスナップマネージャその他4本のソフトの本体は、DVD内に*1。ぐぐってでてくるドライバは、アプデ分であって、DVDインスコしたあとにみたら「更新いりません」とのこと。ネットにはソフトは落ちていません。
・セットアップ。特にライセンス数のしばりはなさそうでさすがレンタル。いくら早くてもソフトがわるければつかいづらい製品となるから全部いれる。4種類。
1.ScanSnap Manager (スキャナ設定用。画像データ各種を作成)
2.ScanSnap Organizer(pdfとjpgで保存したもののOCRと閲覧。)
3.名刺ファイリングOCR (tifベースに変換し閲覧。OCRあり)
4.ABBYYFineReaderforScanSnap (ワード・エクセル・パワポに変換)
(5.幻のアドビアクロバット=貸出不可)
それとなぜかアドビアクロバットDCとやらもどこからともなくインストールされました。(同タイミングだったせいかもしれない)
・USBコードはしっかり根本まで挿すこと。しばらくスキャンスナップマネージャが赤い未接続マークつきででるので慌てる。でも、しっかり差し込んで再起動後10分くらい放置してログインしてみたらいつのまにか認識して接続してくれてるので焦らないほうがよい。最初接続できなくていろいろやった。*2
・接続したスキャナのフタをあけたときに「スキャンスナップフォルダ」のご案内がでたらスキャンスナップマネージャがうまくスキャナ本体と接続された証拠である。
・接続されたらスキャンスナップマネージャのタスクトレイアイコンを右クリックして、スキャンボタンを押したときの保存先やdpiなどの設定ができる。

OCR認識

・スキャナの青いスキャンボタンおしてスキャン動作(以後シャーシャーと呼ぶ)が終わったら「どのアプリに投げます?」と聞いてくる。名刺だったら名刺OCRとかに投げる(未確認だが、名刺サイズでスキャンしてしばらく放置すると勝手に名刺OCRが立ち上がる気もしている)。そちらのアプリでのとりこみOCR認識作業がおわると、なんと保存データは消してしまう、かと思いきや。
・スキャンスナップマネージャのタスクアイコンを右クリックででてくる「Scanボタンの設定」からのデフォルト保存先はマイドキュメント直下の「¥ScanSnap」フォルダである。そしてスキャンスナップオーガナイザもこのフォルダをデフォルトとして使用する*3
・さらにスキャン後多アプリアイコンを選択させる青枠画面の左上隅「このコンピュータに保存する」(どこに)もこのデフォルト保存先にぶち込むことを意味する。そしてワードなど他の連携を選択したときも、スキャナが読んだ画像そのものはマネージャで決めた場所にバックアップが取られる。

そんじゃーまずは名刺から。

・説明書はこちら
https://www.pfu.fujitsu.com/meishi/downloads/v22-ug-function.pdf
・(前もってスキャンボタンの動作を設定しておき)→スキャンボタンポチッ→連携は楽ちん。
・せっかくスキャンで(pdf設定でもjpg設定でも)両面読み取りしてもOCR側が両面認識してくれなさそうなど不満があったが、名刺OCRの説明書を読むと全部あとから修正できることがわかった。たとえば裏返しにいれた名刺は、16ページにより名刺右クリックで編集から表裏変更し、もういちど右クリックから認識しなおすとちゃんと表になるなど。
・明朝以外のフォントは壊滅的(丸ゴシックの白抜きの人がいたので)・カラーにはまあ強いほう、縦横判定にも強く便利である
・だがソフト自体は更新中止されており、OSものりかえるだろうから、何らかのエクスポート手段を残しておくことが重要。
・インポートはcsvxml形式のみだが、エクスポートはこれら以外に筆まめなど各種宛名ソフトへの形式変換がある。すごい。中でもJアドレス形式というのが汎用性が高いようだ。これにはcsv形式の認識済みデータと、画像がtif形式で入っているということで、tifを一括でjpgに変換するソフトを通じて変換しておけば、他のものでも利用できる形になるそうだ。詳しくはこちらspen.cocolog-nifty.comblog.hmm.jp
(外部サイトです。参考になりました、ありがとうございます。でも5年前だから今はいろいろ違うかもしれません。)
その他の細々した情報は注*4にて。

オーガナイザーをつかってみよう

スキャナScanSnap PDF・JPEGファイル 整理・閲覧ソフトウェア「ScanSnap Organizer」 : 富士通
・アップデートが存在する。オプションのリソースから確認してアップデートしよう。
・機能としては、iOSでいうファインダー、winでいうエクスプローラとブラウザアプリが合体したもの。jpgかpdfでよみとったものをOCRしたりブラウジングしたり変換したりいろんなクラウドの保存先に保存したりできる。グーグルドライブやevernoteはそれ自体OCRサービスがある。機種によっては、画面の背景色除去をしてくれるバージョンがバンドルされている場合もあるが、S1500にはついてないみたい。*5

ABBYYつかってみよう(後日推奨)

・有料版だとEPUB使えるらしいですが、スキャナ付属のバンドル版にはパワポ・ワード・エクセルのみ。ワードやってみたけれど、挿絵以外の本文はおおむね良好。認識に時間がかかるだけのことはある。「ツ→シ」や「っ→つ」の読みミスが多いが、「下訳」程度にはつかえる。グレー600とカラー300ではほぼ似たような読み取り結果になる。
・セミナーでくばられたパワポ資料をそのままパワポにもどしたり、ワードーpdf化したーワード、というために使うものかも。
・どのOCRソフトでもそうだが、400ページくらいを一篇ににんしきさせると、メモリ不足でダメになっちゃう。認識させる予定の読み込み物は小分けファイルにする。
・スキャン本体がつながっていなくても周辺ソフトは動作する。

スキャンしたもの

名刺:◎:作業目標「名刺スキャンOCRで使える形」((スーパーファイン、カラー自動、両面、オプションは原稿向き補正以外全部オフ。正直名前OCRと原画像さえあれば。
年賀状:◎:年度ごとにpdfファイル化。
雑誌の切り抜き:対処が必要:「高解像度グレー読み込みデータを保存し高度OCRソフトを待つ」「カラー挿絵だけカラーで再スキャン」。手間がかかった。人の目に灰色の再生紙は、ScanSnapには黄色く日焼けした紙にみえるらしい。絶版はグレーとカラー両方保存しようかな。
小説の本:ページ数が多いので「継続読み込みを有効」オン、それとあとで圧縮するのが吉。ファイルサイズが圧倒的に小さくなる!ビジネス書を自炊する際のScanSnapのオススメ設定 by @tsubasamatio | ごりゅご.comアドビの有料アクロバットがあればOCR圧縮が効くとか。
コミック本:
銀塩写真
配布物:B4をB5に折ってあるものが多かったので、折り目(輪)を裁断機でばっさり、両面読み取り、かつ白紙ページを無視するオプション使用でざっくりいける。すてき!
公文書:?:e-scanというお役所通達による自炊推奨設定モードがあるらしい。マネージャのアップデート分ってこれか。

いずれにしても、ホチキスや糊残りがあるといけないのでよくさばいてから読ませること。

スキャン設定逆引き辞典

新聞記事→スーパーファイン/グレー/jpg
雑誌記事の切り抜き→スーパーファイン~エクセレント/グレー/pdf/OCR
コミック雑誌→スーパーファイン~エクセレント/グレー/pdf
名刺・年賀状→スーパーファイン~エクセレント/自動判別/pdf/名刺OCR
コミック単行本→表紙と口絵のみカラー、本文は白黒pdf/ファイン~エクセレン
手書きノートや落書きレシートなど→ノーマル~スーパーファイン/グレー
銀塩写真→これは片面で。
ネガフィルム→
その他(メモ、給与明細、移行済み通帳、クレジットカード明細、健康診断結果通知、)→自動判別で

よみとり解像度
f:id:NAPORIN:20151101160654p:plain
※解像度がエクセレントだけ、スキャン速度が1/4になる。ノーマルだけはどうしても結果がぼやけたりキタナイ。ので、ファインかスーパーファインからえらべばよいです。これをふまえて
判断1:マンガは本文グレーで読むとモワレやすいのとスマホで読むなら軽量化したいから上のようにしました。
判断2:人力をかけずにOCRしたいもの、印刷するものはスーパーファイン以上の高解像度が必要です。
判断3:紙に色がついているものは、グレーを選択すると目に優しい。
判断4:手書きの鉛筆文字、明朝以外の文字、マンガはどうせOCRできないから人目で読むしかない

スキャンオプションのつかいどころは少ない

文字をくっきりします →ノーマルやファインの低解像度のブロックノイズをとる
白紙ページを自動的に削除します →見開きで読まない人(非推奨)
文字列の傾きを自動的に補正します →OCR(非推奨)
原稿の向きを自動的に補正します →OCR時に推奨
原稿を上向きにしてセットします →非推奨だが、頭から読ませるとササクレがひっかかりそうな原稿に

感想

…としては、「本当に手間の少ないスキャナー」に「ケチらないソフト」をバンドルしたことでスナップスキャンが首位を取ったことに納得がいきました。*6

カメラもそうですが、新しい製品を買うたびにバンドルソフトが増えるのつらい。フォトショ重複購入もおかしいけど、自分で正解にたどりつきやすいともっとマーケットが広がるとおもいます*7。間を埋めるのが、わたしたちのようなブログのお仕事かな。自腹を切ってばかりで、なにひとつもうけてませんけどね!

あとは切ってお鍋で煮込んでお皿洗いまでが自炊なので、お鍋かっただけでできるんじゃないということを実感していますね… 原稿のバラし、原稿にあわせた調整、とゴミ捨てが面倒です!

あっ、楽天で安いとこみつけた…

*1:というわけでDVDドライバがないタブレットPCへはクラウドから送付するしかなくて不便。DVDドライバは無くせないじゃないですか

*2:いろいろとは、スキャンスナップマネージャのタスクトレイ内アイコンを右クリックすると、「接続できない」から「接続の修正」にいけて、そこにあったことを順次ためした。でも効いたとすればうっかりワクチンを無効化するのを忘れてたからやりなおした程度。ドライバは二種類入って片方有効だったりして、かなり焦ったけどマシンが自己解決したみたい

*3:「フォルダの割り当て」で他のフォルダを追加可能だけど、なぜかマイドキュ内にぶらさがってみえるのでちょっと不愉快。

*4:最新世代のスキャンスナップでは「CardMinder V5.1」というソフトを添付している。そちらのほうが使いやすいのかもしれないし、バンドル価格が安いだけかもしれない…別途インストールするならどうしようかしら。[名刺をスキャンするだけ!「名刺管理アプリ」のおすすめ4選|エンジョイ!マガジンによれば人力OCRにもあるらしいけど、なんか社会保険庁を思い出すわ

*5:マイクロソフトシェアポイントサーバー(MOSS)というもの(MSオフィスの周辺製品)と連携できるらしいです。なぽの家にはそんなものはない。

*6:価格.com - PFU ScanSnap iX500 FI-IX500 のクチコミ掲示板によれば、後継機種も、OCRソフトのバンドルが変更されるときに品薄になったりしたそうです。アドビがサブスクリプションにしたからねえ…

*7:とはいえアドビひとりがちもなあ…