0 返信 最新の回答 日時: Sep 4, 2017 2:15 AM ユーザー:masayan24

    日本語OCRと外部viewerの連携について(現状把握とレポートのためのスレッド)

    masayan24 Level 1

      Acrobat Pro DC における日本語 OCR について、不都合な挙動があるので、レポートします。

      (同様なスレッドは自身のものを含めて複数ありますが、まとまった情報を整理することで、Adobe 中の人に気がついて、確認して、できれば対応してもらいたいです。)

       

      【問題】

      Acrobat Pro DC で日本語 OCR を「検索可能な画像」モードで実行し、保存した場合、Acrobat 以外の pdf viewer では OCR の恩恵 (検索、コピー&ペースト) を受けることができません。

       

      【望むこと】

      以下の情報を求めます。

      上記問題は、他の環境 (OS、ソフトウェバージョン等異なる環境を含めて) でも確認されますでしょうか。

      上記問題は、直されるべきバグでしょうか。それとも仕様 (対応の予定は将来的にもない) とされているでしょうか。> Adobe の中の人

       

      【環境】

      OS: macOS Sierra 10.12.6

      OS 言語: English (日本語でも)

      Acrobat Pro DC version: 2017.009.20044

      Acrobat Pro DC 言語: 日本語

       

      【調べたソフトウェア】

      以下のソフトで pdf の検索はできません。

      preview.app (macOS 純正 viewer)

      skim.app (macOS 3rd party pdf viewer)

       

      【付随的な情報】

      ・Acrobat Pro DC にて、アプリケーションの言語と OCR の言語が異なる場合において、OCR を「検索可能な画像」モードで実行すると、Acrobat 内でも OCR に失敗します。Acrobat Pro DC にて OCR を行う際には、現状、言語を揃える必要があります。

      ・今回の問題は、言語を揃えて OCR を実行しても、Acrobat 以外の viewer では OCR レイヤーが見えないことを指摘しています。

      ・ちなみに、日本語 OCR をかけた後、半角英数字は Acrobat 以外の viewer でも検索可能です。日本語に起因した問題が発生しているように思います。

      ・他のソフトウェア (Canon のスキャナー DR-C225W で OCR 処理込み) で読み込んだ pdf はどの viewer でも日本語文字検索が可能です。Acrobat Pro DC で OCR 処理したものだけが使えません。

      ・Acrobat Pro DC にて、「編集可能なテキストと画像」モードで OCR を実行すると、どのソフトウェアでも検索可能となります。また、アプリケーションと OCR の言語が異なっていても問題ありません。