pdf 画像保存の最速ガイド:数クリックで画像を抽出&保存方法

まずは目を引く画像をそのまま手元に!

PDFに埋め込まれた写真や図表をスピードで取り出せる方法を、いずれのOS・ツールでも実践できるよう一気にまとめました。
ページの画像だけでなく、複数ページにまたがる大きな図も、クリック数またはコマンド1行で取得。
「抽出するときに画像が失われる」「PDFが暗号化されている」「手順がわからない」など――検索者の抱える疑問をすべて解消します。


PDFから画像を抽出する基本概念

PDFに組み込まれた画像は、XObject(外部オブジェクト)として保存され、ページの描画命令で呼び出されます。
通常の閲覧者はページを描くときに画像を解釈しますが、画像のみを取り出すときは

  1. 画像の位置・サイズ
  2. 画像データ自体
    を知る必要があります。
  • 埋め込み画像:JPEG, PNG, GIF, CMYK等の圧縮形式で保存されています。
  • スキャンPDF:画像がそのままページ背景になっているので、OCRを使うとテキストも抽出できます。

上記を踏まえて、以下ではGUIツール・オンラインサービス・CLIツール・OCRを組み合わせた実践的手順を紹介します。


GUIツールを使った高速抽出

ほとんどのユーザーが持っている「Adobe Acrobat Reader DC」「MacのPreview」「Foxit Reader」などのPDFリーダーも、画像抽出機能を兼ね備えています。

1. Adobe Acrobat Reader DC

  1. PDFを開く。
  2. **「ツール」→「PDFの編集」**を選択。
  3. 画像を右クリック → 「画像を保存」
    • 右クリックメニューに「画像を保存」がある場合も、選択状態で Ctrl+S で保存できます。
  4. フォルダを指定し、JPEG/PNGなど好きな形式で保存。

ポイント

  • 画像を右クリックできない場合は「編集ツール」が無効になっているか、PDFに埋め込みされていない可能性があります。
  • 画像サイズは元の解像度を保持します。

2. Mac Preview

  1. PDFをPreviewで開く。
  2. 「ツール」→「画像をコピー」(またはページ全体を選択してコピー)
  3. **「ファイル」→「画像としてコピー」**でPNG/JPGを選択。
    • 画像が切り取れない場合は、PDF全体を選択してコピー後、画像編集アプリ(Photoshop, Preview の「画像編集」)で貼り付けて保存。

3. Foxit Reader

  1. PDFをFoxitで開く。
  2. 「画像ツール」(アイコンに写真が付いたマーク)を選択。
  3. 抽出したい画像をクリック → 「画像を保存」

これらは1〜2クリックで完了し、外部ソフトの導入も不要なため、急ぎの場面で便利です。ただし大量ページのPDFには向きません。次のセクションでバルク処理に強いツールを紹介します。


便利なオンラインサービス

インストール不要で即座に画像を抽出したいときは、無料・有料のオンラインサービスがおすすめです。

サイト 特徴
ILovePDF 直感的UI、PDF → PNG、JPEG変換 https://www.ilovepdf.com/jp/pdf_to_jpg
Smallpdf 1枚ずつ保存、またはZIPでダウンロード https://smallpdf.com/jp/pdf-images
PDF2Go OCRオプション付き https://www.pdf2go.com/convert/pdf-to-images

使い方

  1. サイトを開く。
  2. 「ファイルを選択」からPDFアップロード。
  3. 「変換開始」ボタンを押す。
  4. 変換後に各画像を個別にダウンロードまたはZIPでまとめて保存。

注意点

  • ファイルサイズが大きいとアップロード・ダウンロードに時間がかかる。
  • 個人情報や機密文書はアップロードしないほうが安全。

コマンドラインでプロフェッショナルな抽出

大量ページや自動化が必要な場合は、Popplerpdfimages コマンドが最強です。

Poppler のインストール

OS コマンド
Windows winget install poppler.portable
macOS brew install poppler
Linux (Ubuntu) sudo apt-get install poppler-utils

pdfimages の使い方

# 例:sample.pdf のすべての画像を抽出
pdfimages -jpg -r sample.pdf outprefix
  • -jpg:JPEG形式で保存(既存のJPEG形式をそのまま)。
  • -png:PNG形式。
  • -all:すべてのフォーマットを保持。
  • -s:サブサンプリングを行わずに高品質。
  • -c:画像の圧縮率を制御。

出力ファイル名

  • outprefix-000.jpg, outprefix-001.jpg … のように番号付きで保存。

画像をフィルタリング(サムネイルサイズを除外)

pdfimages -list sample.pdf | awk '$4>1000 && $5>1000 {print $1}' | while read id; do
    pdfimages -j -i "$id" sample.pdf outprefix-"$id"
done
  • $4$5 は画像の横幅・縦幅(ピクセル)。
  • 高解像度画像のみを抽出。

DRM保護されたPDFを処理

qpdf --decrypt protected.pdf decrypted.pdf
pdfimages -jpg decrypted.pdf outprefix
  • まず qpdf で暗号化を解除。
  • その後通常通り抽出。

スキャン済みPDFの画像抽出(OCR)

スキャンされたPDFでは画像がそのままページ背景になっているため、OCRでテキストと画像を分離する必要があります。

Google Drive + Google Docs

  1. PDFをGoogle Driveにアップロード。
  2. 右クリック→「開く」→「Google Docs」
  3. OCR処理後、Google Docs 上で画像を右クリック→保存。

利点

  • 追加ソフト不要。
  • テキスト検索が可能になる。

ABBYY FineReader

  1. PDFを開き、「抽出」「画像抽出」
  2. 画像の品質をそのまま保持。

Tesseract + Poppler の組み合わせ

# PDFを画像(PNG)へ変換
pdftoppm -png -r 300 sample.pdf out
# OCRで文字情報を抽出(必要に応じて)
tesseract out-01.png out-01 -l jpn
  • 300dpiで保存した画像は高画質。
  • 画像だけを抽出したい場合は pdftoppm だけで完了。

画像を保存する際のファイル形式と圧縮設定

抽出した画像は、目的に合わせて形式を選ぶと品質とファイルサイズを最適化できます。

目的 フォーマット 推奨設定
ウェブ表示 JPEG 85〜90%圧縮、RGB
高解像度印刷 TIFF 無圧縮、CMYK
透明背景 PNG 8bit/24bit, 最小圧縮
フロントエンド WebP 80%, 透明保持可
  • pdfimages -png でPNG形式に変換。
  • convert(ImageMagick)で再圧縮:
    convert outprefix-000.png -quality 90 outprefix-000.jpg
    

よくあるトラブルとその対策

症状 原因 対策
画像が抜けている 画像がXObjectとして埋め込まっていない(テキスト化されている) OCRで再処理
画像が乱れた JPEGデータが破損している pdfimages -all で元ファイルを再取得
文字化け 日本語文字が埋め込まれた画像 tesseract -l jpn でOCR化
大量ページで時間がかかる 1ページ毎に処理を行っている -all オプションで一括抽出
許可が必要なPDF DRMが施されている まず qpdf --decrypt で解除する

おすすめワークフローまとめ

シーン 推奨ツール 具体的手順
数ページ以内の即時抽出 Adobe Acrobat Reader DC / Preview 右クリック → 「画像保存」
大量ページの高速抽出 Popplerの pdfimages pdfimages -all sample.pdf out
DRM付きPDF qpdf + pdfimages 1) qpdf --decrypt protected.pdf out.pdf 2) pdfimages -jpg out.pdf out
スキャン済みPDF Google Docs / ABBYY FineReader PDF → OCR → 画像保存
自動化・スクリプト化 コマンドライン + バッチ/シェル pdfimages + for ループで自動抽出

最後に

PDFに埋め込まれた画像を「最速で、かつ高品質に」取り出すには、目的とシーンに合わせてツールを使い分けることが鍵です。

  • 1・2クリックで済む場合はGUIツールを、
  • 大量・自動化が必要ならCLIツール(Poppler)を、
  • スキャンPDFならOCRが必須です。

作業に合わせて最適な組み合わせを選び、画像抽出をスムーズに行いましょう!

コメント