6 返信 最新の回答 日時: Dec 17, 2014 12:59 AM ユーザー:田園都市

    OCR後の文字が粗い

    Jinn_m

      OCR(デフォルト設定)後のテキストが粗くて使えません。もっと詳細な文字(フォント?)を使う方法を教えてください。ver9の問題だと思ってXIにアップグレードしましたが、何も変わっ ていません。助けてください。

        • 1. Re: OCR後の文字が粗い
          assause Most Valuable Participant

          OCRの精度が良くない、ということでしょうか。

           

          OCRは光学的に文字を読み取って変換をかけますので、

          元々の文字の精度も影響しますし、また100%の精度で変換できるということはありません。

          これはどのOCRを利用しても同じです。

           

          Acrobatに付属するOCRについても同様かつ、個人的にはそれほど変換精度が良いとは

          思いませんので、別のソフトを使ってみるなどが良いと思います。

          • 2. Re: OCR後の文字が粗い
            田園都市

            OCR(デフォルト設定)後のテキストが粗くて使えません。


            との質問は、OCR処理をすると、OCRエンジンが勝手に文字を太く(粗く)してしまうということではないでしょうか。

            たしかに小さい文字の文書では汚くなって使い物にならなくなってしまいます。


            DocuWorksではこんなことは無いのですが。。。。

            だから官庁はDocuWorks派が多いのかも。。。


            今でもOCRエンジンは読んでココを使用しているのでしょうか?


            私も強く改善を望みます。

            • 3. Re: OCR後の文字が粗い
              Jinn_m Level 1

              ご返事ありがとうございます。

              最近クレジットカードの明細をOCRしたのですが、1ページ目だけA4縦の原稿が横になってしまうんです。

              Acrobat9では問題ないのですが。

              いきなりPDFのパナソニックのOCRのほうがいいんでしょうか?

              • 4. Re: OCR後の文字が粗い
                田園都市 Level 1

                いろいろなOCRソフトを試した経験上、どれも一長一短です。


                AcrobatOCR------傾き補正してからOCR処理。

                                        結果として文字が荒くなったり90度傾いたりする。

                                        しかし、傾き補正された文書には注釈などの線が引きやすく、パソコン画面上で見る分には快適

                                        EXCEL変換はほとんど使い物になりません。


                他社OCE----------傾き補正せずOCR処理することが多い

                                       注釈などの罫線は傾いたままの文字に沿って斜めに引くことになる。    

                                       ファィル変換を全面に出したOCRソフトはEXCEL変換にも強いです。


                文字の認識結果は、どれも性能に差はありません。

                1ページ目のみ傾くのであれば、1ページの前にダミー原稿を追加するのも一つの方法で、カラー白黒の認識も向上します。

                ※クレジットカード明細は、カード会社からPDFをダウンロードできたりします。

                • 5. Re: OCR後の文字が粗い
                  Jinn_m Level 1

                  アドバイスありがとうございます。

                  クレジットカードのPDF明細をテキスト化するのが一番の目的なんです。

                  ダミー原稿を挿入するのをやってみます。

                  パナソニックのOCRを使われたことがありますか?

                  • 6. Re: OCR後の文字が粗い
                    田園都市 Level 1

                    いきなりPDFのパナソニックのOCRは、ソースネクスト製品ですよね?

                    全てにおいてAdobe Acrobat Iより劣ると思います。


                    wev上で取得したpdf明細は透明テキスト付きなので、そのpdfのEXCEL変換したい範囲を右クリック-選択範囲を書き出しのほうが速いです。


                    大量にあるのであれば、同じ様式のものを集めて単一フアィルとし、ファィル変換ソフト(瞬簡PDF変換など)を使用すると、あっという間にEXCELフアフィルが生成されます。更に、Adob e Acrobat XI Proをお持ちであれば、事前にヘッダーフッター等を隠すヨハン調整をすれば、更に快適です。 Acrobatでも面倒ですが工夫次第で快適に変換できます。


                    クレジットカードのPDF明細をテキスト化が最大目的ということは経理処理でしょうか?

                    そうであれば、スキャンしてOCR変換という手法はリスクが大きすぎるので極力避けたほうが良いと思います。