2010年8月20日金曜日

iPhone3G、軽くなった

iOS4に上げて以来、重いを通り越してしばらく無反応になることが良くあって非常に使い難くてちと困っていた。iPadなら快適だが持ち歩くにはでかいし、家では使おうとすると娘が騒ぎ出すし。
さすがに機能アップ他の理由で重くなったってレベルを超えてるので、何かミスってるんだろうなーとは思ってたし、Appleが問題を把握して対策しようとしてるって噂はあったので云々。
で、iOS 4.0.2。記事ではセキュリティフィックスしか書いてなかったので操作感については期待してなかったんだけど、updateしたら無反応がかなり改善された。
さすがにさくさくと言うほどではなく、嫁様のiPod touch(中身iPhone3GS世代)と比べてもはっきり重くて、アプリやFEPの立ち上げ時などに待たされることはあるんだけど、困るほどでは無くなった。
正直iPhone4に買い換えたいけどもう少し我慢して様子を見る。

2010年8月15日日曜日

スキャンサービス比較

何冊か自炊してみて、意外に時間がかかる、こりゃ大量にはやってらんねぇな、と思ったので、ちょっと裁断&スキャンをやってくれるサービスを調べてみた。と言っても少し前に見つけたまとめ

http://www.bookfire.net/
BookFire - 書籍スキャン サービス比較まとめ

からいくつか(半分ぐらい?)拾ってサービス案内を見てみただけ。

結論:ここ↓が良さげ
http://www.scanbridge-books.com/index.html
書籍電子化のスキャンブリッジ

100円/冊が多いなか、ここは200円と少しお高めなんだけど、他が(100円より高いとこ含めて見たとこ全部)、(おそらく作業の効率化のために)本の端から1cm程度を裁断すると明記 or 裁断についての細かい記載が無いのに対し、スキャンブリッジだけは

# 書籍は本文ページに適度な余白が残るように1冊ずつ目視確認しながら裁断位置を決定します。ただ書籍の構造上、やむを得ず印字部分ギリギリになったり、カットされる可能性があります。
# 裁断時に書籍本体の表表紙と裏表紙はデザイン上、どうしても印刷の一部分はカットされてしまいます。

と書いてある。良い。
というか、手元の文庫本何冊か見ただけでも、一律1cm裁断では本文ぎりぎりだったりイラストや写真が少し切れたりしそうな感じ。コミックスの見開きとかだと1cm+1cmはちょっと悲しそう。作業性(=人件費)を考えると安いとこがその辺に手を抜きたいのはわかるが、その手のところは出す本を選ばないと悲しいことになりそう。
逆に言えば、そういうとこでも良さそうな本(本文が読めればOKな小説やら実用書やら、真ん中に余白があることがわかってる4コマ漫画とか)は安いとこに、ちょっと裁断に気を使って欲しい本はスキャンブリッジに、てのが良い気も。
微妙に謎なのは、カバー表紙の扱い。スキャンブリッジの注意事項は「書籍本体の表表紙と裏表紙は~一部分はカットされてしまいます」なんだけど、カバーはきっちりスキャンできるって思っていいんだろうか?
駄目なら駄目で、自分でそこだけスキャンしてから出して後で合成すればOK。
まあ、そこに限らず、こだわるなら自分でやれって話ではある。
それはそうと、注意事項がほとんど同じサイトがいくつもあるのは、やっぱり先達をパクって参考にしてるとこが多いってことなんかね。
どこぞのサイトの注意書きにあった裁断後の書籍の転売目的の類似業者ってのがよくわからんかった。既にデータで持ってる書籍が来たらデータだけ渡して書籍は古本屋に転売すれば丸儲けで、さらにスキャン自体も自分とこではやらずにスキャン業者に出しちゃえば初期投資も不要って手はありそうだが、それは「裁断後の書籍の転売」じゃないし。
そう思うと、原則5年以内の本に限るって注意書きは(以下邪推を削除)。
お金払ってやってもらうにせよ、時間と手間を使って自分でやるにせよ、スキャンする本は選んで、もっと捨てないとな。。。

2010年8月14日土曜日

ファイルサイズを縮小

雑誌と実用書のPDFをiPadに転送したら表示できなかった。。。

最初は解像度が無駄に高過ぎて蹴られてるのかと思ったが、同じような解像度の小説(文庫を300dpiでスキャンしてそのままPDFにしただけのファイル)が普通に表示されてる。
で、ふと気付く。Acrobatの「ファイルサイズを縮小」が駄目なんじゃね?試した。
  • 「ファイルサイズを縮小」を使うなら
    • 「Acrobat 5.0~」を指定するのが吉
    • 「Arcobat 6.0~」から先は駄目(表示できない)
そこで出力ファイルのPDF 1.4と1.5が切り替わる。どうやら(今の?)iPadはPDF 1.5には対応していないらしく、表示させても真っ白。
今回試したアプリはCloudReader。おそらくOSかSDKで用意してるPDFライブラリを使ってる。
iBookでは先日Acrobat7.0向けに「ファイルサイズを縮小」したファイルが真っ白になるのだけ確認してる。たぶん同じPDFライブラリを使ってるだろうから、結果も同じじゃないかと。
ちなみに、縮小前の元ファイルを表示させてみたら、表示はできたが、重い上に落ちた。 よって解像度が問題だったわけではなく、でも解像度は落としておかないと実用にならない。
でもって、他のアプリは知らない。独自にPDFレンダリングエンジン抱えてたら結果は変わるだろうけど云々。
あと、iTunes上でもサムネイルが出なくなる。表示はAcrobat Readerを呼び出すだけなので無問題。
それはそうと、やってみて不思議に思ったのが、
  • 元ファイル(600dpiでスキャンしたJPEGから作っただけ) - 290MB
  • PaintShop Proで1/3に縮小してからPDF化 - 23MB
  • 元ファイルをAcrobat 5.0向けに縮小 - 5MB
  • 元ファイルをAcrobat 6.0向けに縮小 - 83MB
なんで新しい形式の方が16~7倍もでかいんだろう。
新しい方が画質重視で解像度をあまり落としてないのかなとか思って画像をペイントにこぴぺしてbmpにしてみたけど、解像度とかはどっちも同じ。画質はぱっと見では区別つかず。うーむ。
ちなみに、解像度は元の1/4ぐらいになってたけど、これの算出基準は突っ込んで見てない。今回試した雑誌だと150dpiぐらい相当な感じで、きれいじゃないけど読むのに不自由はしない、ぐらい。
というわけで、とりあえずPDFの場合には「Acrobat 5.0~」向けに「ファイルサイズを縮小」するのをデフォルトにして、読んでて気になったら画像を別手段でサイズ調整とかしてからPDF化、と。
追加。Acrobat 7.0向けに縮小してあった実用書のPDFをAcrobat 5.0向けに縮小し直してみたら、ファイルサイズが3/4ぐらいになって、iPad(CloudReader)でも読めるようになった。
小さくなるのが解せんけど、サイズ的にはこんなもんかと思う。というか雑誌の83MBや16~7倍の方が不思議で、どうしてまだ解像度では大きい1/3縮小よりも数倍でかいのかと。
(JPEGのパラメータが恐ろしく高画質寄りとか、「ファイルサイズの縮小」をしたいのにそれは無いだろう的な理由はいくつか思いつくが・・・)

2010年8月11日水曜日

実用書の自炊

とりあえず古い本でやってみた。
AcrobatにもOCR機能はあったが、何故か画像が荒くなるような。とりあえずパス。必要なら後から(以下略)。
書き忘れてる気がするが、手持ちのAcrobatもv7と古い。新しいの買うべきか。
O'REILLYのは英語なら電子書籍があるんだよなー、とか思いつつふと検索してみたら、まだ数は少ないけどオライリージャパンで日本語PDFを売ってた。恥ずかしながら知りませんでした。。。
まあ紙のは紙ので持ってても悪くないと思うことにしよう&最近買った奴でもEBOOKになってないのがあったからそれは仕方ない。というわけで、英語版を買うか日本語版を(まだ?の奴は待って)買うかは考えるとして、O'REILLYの自炊はなしで。
ちなみに要PayPalアカウント。未だに持ってない。えーかげん作っとくか。
過渡期にしか需要は無さそうだけど、ある本の電子版が入手可能かどうかを調べるサービスがあったら便利そうな気がした。ブラウザ拡張とかでAmazonの見るだけで表示されたらなお良し。
試しにパブリ他で検索してみたけど、先日買って自炊した文庫の小説の電子版は見つからなかった。

2010年8月9日月曜日

漫画と雑誌を自炊

前の日記で文庫を自炊した後で、ここ半月ぐらいの土日休日を使って漫画と雑誌の自炊をしてみた。
漫画。カバーを外して糊付け付近を裁断してドキュメントスキャナ。
見開きをできるだけ生かしたいと思うと切り落としをできるだけ少なくしたいが、あまり狙うと糊付け部分が残ってしまう。手で多少バラす必要が出てくる、だけなら大した問題では無いかと思ったが、やってみると糊でドキュメントスキャナの読み取り部が汚れてしまう。
特に表紙と裏表紙のとこの糊付け幅が広いので要注意。狙うなら、そこだけ別処理するという手もあるかも。今回はそこまでしなかったけど。
カバーと、何度やっても斜行してしまう一部のページ(糊が残ってるせい?)はフラットベッドスキャナで取った。読むのに不自由はしないが、色味が(グレースケールでも黒の濃さが)違ってしまうのが難点。後から調整で揃えるとかできなくは無いだろうけど面倒そうだしパス。
PDFではなく連番画像のZIPにしてみる。最初スキャン画像(無駄に600dpi設定で取ってる)そのまま使ったら一冊500MBぐらいになったので、iPadの解像度に合わせて縦を1024に変換(PaintShopProのバッチ処理で)したら40MB以下になった。B6サイズの漫画ぐらいならそれで十分読める。
雑誌、の付録の小冊子を丸ごと一冊。できればばらさずに、という要望だったのでフラットベッドスキャナで、サイズ的に見開きでは無理なので1ページずつ。さすがに時間かかる。小冊子ならまだやろかって気になるが。
解像度は600dpiで。無駄に高過ぎるかとも思うが、後から解像度落とすことはできるけど云々。
試験的にOCRかけてみた。ちと、いやかなり古いe.Typist v9(updaterは当てた)。日本語の認識率が思った通りに低いのはともかくとして、そっから透明テキスト付きPDFを出力させたらどっかおかしいファイルを吐いてるようで、AcrobatやReaderがエラーになる。データでかすぎるんだろーか。前にCDのライナーを処理してた時は普通に出来てたんだけど。
今日のとこはOCRはあきらめて画像からPDFにするだけにしとく。んでAcrobatのサイズ縮小機能で縮小。それで400MB→90MBぐらいになった。カラーで写真入りとは言え、ページ数考えると、これでもまだ画質が不必要に高過ぎるのかも知れず。
・・・ところでAcrobatにOCR機能付いてなかったっけ。
httpでのファイル取得に対応してるiPad/iPhoneのビューアへのファイル転送用に、居間PCにhttpdを入れた。デフォルト設定だとSkypeとぶつかるので80とSSLの設定を潰しとく。
USBで繋いで同期させた時についでに放り込むんでもいいし、そっちのが転送速度は早いっぽいけど、線で繋ぐより無線で行けた方が楽だとか、線で繋ぐと充電も兼ねてしまうのが電池の充電サイクルを進めてしまうので嫌だとか。
アプリによって使える転送方式や対応ファイル形式が違ってて、見る時の使い勝手にも一長一短があって、使い分けが必要そうな感じ。
次は実用書の類を自炊して、うまく出来たら持ち歩きたい本を自炊しまくりたいが、今回OCRして透明テキスト付きPDF作成がうまくできなかったのでちと困っている。どーしたものか。
まあ、検索するかとゆーと、できりゃ便利だが、そもそも認識率がアレでは検索もアテにならんし、紙でもできてないんだからそれより不便ってわけでもないし、スキャン画像を保存しとけば後からやり直しも可能だし。