5 返信 最新の回答 日時: Jan 17, 2007 9:15 AM ユーザー:(zivago)

    縦書き文書の検索

      日本語縦書き文書を「pdfで検索」に日本語を入れて検索しても結果が0で返ってくる。
      アルファベットを入力すると無意味な結果が返ってきます。
      縦書きの正しい検索は不能なのでしょうか?
      Adobe Reader7.0.5
        • 1. Re: 縦書き文書の検索
          tyatya@ Level 1
          「pdfで検索」ですか?
          「pdfを検索」、編集−検索のことでいいでしょうか?
          試してみたところではWord2003やInDesignCSから作成した縦書き文書のPDFは正しく検索できていますが???
          元文書は何のソフトで作成されたものでしょうか?
          話が違っていたらごめんなさい。

          WindowsXP+SP2
          Acrobat7.08
          • 2. Re: 縦書き文書の検索
            Level 1
            >「pdfを検索」、編集−検索のことでいいでしょうか?
            yesです。
            Winでも確認しましたが同じでした。 
            元文書は下記サイトからダウンロードしたpdf文書です。
            http://web.kyoto-inet.or.jp/people/kbys_ysm/tategaki/tategaki5.pdf
            Mac osx Adobe Reader7.0.5
            Windows XP+SP2 Adobe Reader7.0.8
            • 3. Re: 縦書き文書の検索
              Level 1
              > 元文書は下記サイトからダウンロードしたpdf文書です。
              > http://web.kyoto-inet.or.jp/people/kbys_ysm/tategaki/tategaki5.pdf

              プロパティをみれば分かるが、このPDF文書はAcrobatなどAdobe製品で作成されたものではない(GhostScriptを使っている)。
              縦書きを表示できるのはフォントを埋め込んでいるから。

              PDF文書内で部分選択あるいは全部選択し、テキスト文書に貼り付けると化ける。

              上記のPDF文書のもとになったのは以下のHTML文書のようだ。
              このサイトをふつうにAcrobatでPDF化するれば、文字検索が出来た。

              http://web.kyoto-inet.or.jp/people/kbys_ysm/tategaki/tategaki1.html
              • 4. Re: 縦書き文書の検索
                Level 1
                文書のプロパティ、フォントタブを見ると、

                エンコーディングが「ビルトイン」になっていますね

                90pv-RKSJ-H(V)
                83pv-RKSJ-H(V)
                90-ms-RKSJ-H(V)
                Identity-H(V)
                といった一般的な日本語エンコーディングではなくて、
                PDF 生成ソフトの独自のエンコーディングなので、
                文字列が抽出できないのでしょう。

                文字の検索が出来ない時、、
                文字のコピペで文字化けしてしまう場合は
                PDF ファイルに依存する問題です。
                • 5. Re: 縦書き文書の検索
                  Level 1
                  なるほど、ファイル作成ソフトに依存するわけですね。回答ありがとうございました。

                  自分のやりたいことは、
                  縦書き本を全頁スキャナーで読み込み透明テキスト付PDFファイルで保存する。
                  そうすれば随時Adobe Readerで検索できるのではと思ったのです。
                  この場合もPDF化するソフトの選択が問題になりますね。