ソールテック

お問い合わせ03-6226-4074

blogBlog

  • オリジナルギフト作成
  • POST SCRIPT PDF
  • PDF編集ライブラリ
2017.03.30
導入の背景

PDFをSVG変換した場合、テキストを認識できるのか

svg

今回も事例に関する話題です。
内容は「PDFのSVG変換」です。

 

SVGというのは画像形式の一種なんですが、
わたくし、そもそもSVGというのはベクター画像なので座標情報の
集合体というイメージしかなく、ほんと馴染みがないものでした。

 

あることをきっかけに調べてみるといろんなことが表現できるフォーマットと
いうことが理解できました。

 

ほんと以前はベクター情報だけという印象しかなかったんですが
テキストも認識できますね。

 

SVGで表現された、一見イラストっぽいカッコよいデザイン文字も
テキストとしてコピペできたりします。
#勉強不足ですみませんでした。。。

 

本題に戻ります。

 

お客様が開発・販売されている文書管理システムがありまして、
PDFを含む様々なファイルフォーマットを閲覧するための
ビューワー(閲覧ソフト)も開発していらっしゃいます。

 

元々は、弊社にてPDFよりテキスト・画像の描画情報を抽出しお客様の
ビューワー側で閲覧用に表現されていました。
描画情報のみなのでテキストの表示はできてもテキストを認識することは
できませんでした。

 

かれこれ10年以上ご利用いただいているのですが、システムの大幅リニューアルを
計画されており、このビューワーをSVGベースにして開発されるようです。

 

やはりお客さまが扱っているのは文書管理システムなので、文書の中にあるテキストを

検索用に利用するニーズが高まっているみたいです。

 

PDFのSVG変換を実現するツールは世の中に有償・無償問わず存在しており、
実際に試用されたようですが、文書の表現はできてもテキストが認識できなかったり
抽出できなかったりするようです。

 

仮に世の中のPDFのSVG変換ツールにてお客様がやりたいことを実現できても、
万が一の事象が発生した際のサポートが非常に心配だったことも事実のようです。

 

弊社では、テキスト情報を認識できるようPDFをSVG変換できますので
お客様のリニューアル計画にぴったりフィットしました。

 

PDFの変換や加工でお困りのことがあればぜひご相談ください。
お力になれると思います。

 

info@soul-tech.jp
03-6226-4074