6 返信 最新の回答 日時: Nov 19, 2008 2:23 PM ユーザー:(bestie)

    HTMLの罫線不統一について

    Level 1
      HTMLからPDF変換を行うと、表罫線の太さが不統一になって変換されます。
      変換方法:印刷コマンド時にAdobePDFを使用して変換。

      参考:金融庁のHTML(どこの会社でも発生)
      https://info.edinet-fsa.go.jp/E01EW/BLMainController.jsp

      罫線を不統一にならない変換方法、不統一を修正できる方法(別会社のApuri含め)を
      ご存じの方がいたら情報提供お願いします。

      ちなみにこちらで調べた限りだと、XML_Formatterでは罫線を統一できる。(XMLがあれば)
      Adobe社に聞いてみてもできないと言われる。何故か印刷部数まで確認されました…

      環境
      OS:WindowsXP_SP2
      HTML_Ver:IE6.0
      Acrobat_Ver:Acrobat Pro 6〜9(全てもっていますが、どのVerでも発生)
        • 1. Re: HTMLの罫線不統一について
          Level 1
          # 参考:金融庁のHTML(どこの会社でも発生)
          「どこの会社でも」というのは大袈裟のような(全会社のWEBサイトを調査するのは永遠に無理かと)。少なくとも金融庁サイトでは確認できたということしょう。

          実際のURLは「http://info.edinet-fsa.go.jp/E01NW/」になるのでは?
          問題にしているのは、下部のダウンロード一覧のうち「XBRL一括」をクリックしたものでいいのでしょうか?
          そこのページは外部CSSファイルによって定義されてますね。テーブルの背景色とか罫線もCSSで設定されているのでしょう。

          # 表罫線の太さが不統一になって変換されます
          Acroba 7.1.0 ProとクセロPDF2で変換してみましたが、「不統一」というほどの違和感はありません。
          「不統一」というのであれば、一番差がある罫線の幅はいくらかは調査されましたか?

          # XML_Formatterでは罫線を統一できる
          これはアンテナハウス社の製品を指していますか? であれば「XSL Formatter」です(XMLではなくアンダーバーも不要)。
          この製品は基本的にXML文書からDTP用組版を作成するアプリケーションではないでしょうか? ローカルPCにXHTML文書があればできるかもしれませんが、一般WEBサイトのPDF変換が主たる目的ではないのでは?
          あるいは作成したPDFをXML形式に書き出してXSL Formatterを使って再度PDF化という流れもあるでしょうが、そこまで時間とお金をかける必要もないような。

          XSL Formatterの後継アプリとして開発されているという「AH Formatter V5」は、「HTML/XMLの自動組版とPDF化に」という謳い文句があるので、どちらかというとこちらでしょう。

          http://www.antenna.co.jp/AHF/

          # Adobe社に聞いてみてもできないと言われる。
          Adobe社ができないというのであれば、出来ないのでは?

          個人的にAcrobatのPDF変換機能はあまり信用していません。
          [ファイル/PDFの作成/WEBページ]では、HTML文書の解釈をAcrobat独自でやっているみたいなので、ブラウザ表示と一致するような変換はほとんどできません(少なくとも過去に 変換した例で問題なしと感じたのはごく稀です)。
          最近のWEBサイトはCSSで装飾される場合が多いですが、そういったサイトにはAcrobatは弱いという印象があります。

          下記サポート文章(Acrobat 3D 8.0:入出力ファイル対応形式)には「HTML 4.01 with CSS 1.00」という文字があります。CSS2以降への対応はできているのでしょうか?
          以下は読み込みと書き出しについてなので、WEB変換機能の仕様とは違うかもしれませんが。

          http://support.adobe.co.jp/faq/faq/qadoc.sv?6799+001

          先ほどの「HTMLの下線について」というご自身の投稿への返信にあった[へアラインの修正]で対応できませんでしょうか?

          AcrobatよりもWEBスクラップツールで対応したほうがいいような。
          有名なものだと「Webox」とか「紙copi」とかありますね。一昔だと無茶に思えましたが、いまでは大容量HDDも安くなり、敷居は低いように思えます。

          http://www.forest.impress.co.jp/lib/inet/browser/webextn/webox.html
          http://www.kamilabo.jp/index.html

          有名なものですが「WebページやHTMLをPDFに変換するWebサービス」があります。

          http://www.html2pdf.biz/
          • 2. Re: HTMLの罫線不統一について
            tyatya@ Level 1
            >表罫線の太さが不統一になって変換されます。

            線の太さは数値で確認したのですか?単に見た目上の太さですか?

            私の環境でもPDFに変換してみると、その表中の罫線の何本かがかなり「不統一」と言える程太く見えます。
            でも、拡大すれば同じ太さではありませんか?

            今までも、拡大して見ると線の太さは同じ、印刷でも問題無し、単なる画面上の見え方の問題だというのがこのフォーラムでよくあるパターンでした。 kiraさんの場合もそうではないかと想像するのですがどうでしょうか?

            環境設定のページ表示/ラインアートのスムージングのチェックを入れたり外したりしてみて下さい。多少見やすくなる場合もあるかもしれません。別の線が太く見えたりするだけの可能性もあります が・・・。
            • 3. Re: HTMLの罫線不統一について
              Level 1
              kikiさんへ

              >線の太さは数値で確認したのですか?単に見た目上の太さですか?
              TouchUpでは同じ数値になっています。
              6400%で印刷時に罫線の太さを測ってみるとズレが出ています。
              6400%で3mmのズレなので、0.1mm以下のズレです。(今回はAcrobat8,9で確認。おそらく全Verだと…)

              >私の環境でもPDFに変換してみると、その表中の罫線の何本かがかなり「不統一」と言える程太く見えます。
              >でも、拡大すれば同じ太さではありませんか?
              そうですね。
              拡大すれば罫線の不統一の見かけは綺麗になってきますが、確認した限りだと若干ずれているようです。(Acrobat6〜9にて確認)

              >今までも、拡大して見ると線の太さは同じ、印刷でも問題無し、単なる画面上の見え方の問題だというのがこのフォーラムでよくあるパターンでした。
              >kiraさんの場合もそうではないかと想像するのですがどうでしょうか?
              印刷でも若干でています。(上記に質問返答有り)
              TouchUpで表を分解すると、ただの四角のオブジェクトでもいくつもの罫線で変換されています。
              いくつもの罫線で構成されているため、それによる違いで発生しているのではないかと思っています。

              >環境設定のページ表示/ラインアートのスムージングのチェックを入れたり外したりしてみて下さい。
              >多少見やすくなる場合もあるかもしれません。別の線が太く見えたりするだけの可能性もありますが・・・。
              確かにこれだと若干綺麗になるのですが、エンドユーザーのことまで考えるとできればPDF自体に設定をかけたいのです。
              ちなみに目的のことは書いていませんでしたが、印刷用とホームページ掲載用の2種類を作成しています。
              ちょっとホームページ掲載用の際に、顧客からの質問があまりにも多いので、PDF自体に設定ができないか調査しています。
              • 4. Re: HTMLの罫線不統一について
                Level 1
                > HTMLからPDF変換を行うと、表罫線の太さが不統一になって変換されます。

                これはブラウザの仕様でしょう。整数座標系でGDIベースの描画を行うブラウザに印刷用の精度を求めるのは無理があります。

                HTML内で1 pixelと指定されたボーダー(罫線)を96 dpiの画面上で1 pixel幅の矩形の塗りつぶしを行います。印刷時にはプリンタの解像度にあわせてスケーリングするわけですが、1pix@96dpiは12.5pix@1200dpiとなり、整数座標系で は描画位置しだいで12に切り捨てられたり、13に繰り上げられたりします。

                プリンタのプロパティで解像度を極端に高くすれば、若干改善はみられますが、根本的な解決にはなりません。ブラウザ以外の精度の高いアプリケーションなりサービスなりに頼る以外ないと思います 。

                試していませんが、プリンタの解像度がディスプレイの解像度の整数倍になるように双方の解像度を調整すれば、スケーリングによる端数がでなくなるので、ブラウザから印刷してもうまくいくかもし れません。
                • 5. Re: HTMLの罫線不統一について
                  Level 1
                  satoskiさんと意見が異なりますが、Acrobatの仕様のような気がします。
                  WORD→PDFでも同様現象が発生していますし、
                  HTML→紙、WORD→紙は綺麗に印刷されるからです。(Canonの600dpiで印刷)
                  もしかするとsatoskiさんの言われるとおり、全て解像度が関係しているのかもしれませんが?

                  ただWORDに限っては、罫線不統一箇所周辺をTouchUPオブジェクトで選択すると白いオブジェクトが選択されるので、
                  それを選択すると罫線は綺麗に表示されます。

                  HTMLからPDFは白いオブジェクトが存在していませんので、綺麗にできません。
                  なので修正は困難な気がします。

                  ご自身で言われている、XMLFormatterとやらはXMLのソース上の罫線の太さを把握しているのではないでしょうか?
                  ソース上から読み込む変換ソフトではない限り変換時は難しい気がします。
                  • 6. Re: HTMLの罫線不統一について
                    Level 1
                    表示で不揃いなのはAcrobatの問題で、
                    印刷で不揃いなのはWindows(のGDI)の問題です。 (理由はsatoski氏の説明の通り)

                    最近のAcrobatは知りませんが、Acrobat 5で言うとDistillerでPDFを作成し、PostScriptプリンタを用いれば、印刷の問題は解決するんじゃないでしょうか。

                    #ところで「XML_Formatter」って何だろう?
                    #アンテナハウスのXSL Formatterのコト?
                    #JavaのXMLFormatterクラスのコト?