まずは目を引く画像をそのまま手元に!
PDFに埋め込まれた写真や図表をスピードで取り出せる方法を、いずれのOS・ツールでも実践できるよう一気にまとめました。
ページの画像だけでなく、複数ページにまたがる大きな図も、クリック数またはコマンド1行で取得。
「抽出するときに画像が失われる」「PDFが暗号化されている」「手順がわからない」など――検索者の抱える疑問をすべて解消します。
PDFから画像を抽出する基本概念
PDFに組み込まれた画像は、XObject(外部オブジェクト)として保存され、ページの描画命令で呼び出されます。
通常の閲覧者はページを描くときに画像を解釈しますが、画像のみを取り出すときは
- 画像の位置・サイズと
- 画像データ自体
を知る必要があります。
- 埋め込み画像:JPEG, PNG, GIF, CMYK等の圧縮形式で保存されています。
- スキャンPDF:画像がそのままページ背景になっているので、OCRを使うとテキストも抽出できます。
上記を踏まえて、以下ではGUIツール・オンラインサービス・CLIツール・OCRを組み合わせた実践的手順を紹介します。
GUIツールを使った高速抽出
ほとんどのユーザーが持っている「Adobe Acrobat Reader DC」「MacのPreview」「Foxit Reader」などのPDFリーダーも、画像抽出機能を兼ね備えています。
1. Adobe Acrobat Reader DC
- PDFを開く。
- **「ツール」→「PDFの編集」**を選択。
- 画像を右クリック → 「画像を保存」
- 右クリックメニューに「画像を保存」がある場合も、選択状態で
Ctrl+Sで保存できます。
- 右クリックメニューに「画像を保存」がある場合も、選択状態で
- フォルダを指定し、JPEG/PNGなど好きな形式で保存。
ポイント
- 画像を右クリックできない場合は「編集ツール」が無効になっているか、PDFに埋め込みされていない可能性があります。
- 画像サイズは元の解像度を保持します。
2. Mac Preview
- PDFをPreviewで開く。
- 「ツール」→「画像をコピー」(またはページ全体を選択してコピー)
- **「ファイル」→「画像としてコピー」**でPNG/JPGを選択。
- 画像が切り取れない場合は、PDF全体を選択してコピー後、画像編集アプリ(Photoshop, Preview の「画像編集」)で貼り付けて保存。
3. Foxit Reader
- PDFをFoxitで開く。
- 「画像ツール」(アイコンに写真が付いたマーク)を選択。
- 抽出したい画像をクリック → 「画像を保存」
これらは1〜2クリックで完了し、外部ソフトの導入も不要なため、急ぎの場面で便利です。ただし大量ページのPDFには向きません。次のセクションでバルク処理に強いツールを紹介します。
便利なオンラインサービス
インストール不要で即座に画像を抽出したいときは、無料・有料のオンラインサービスがおすすめです。
| サイト | 特徴 | 例 |
|---|---|---|
| ILovePDF | 直感的UI、PDF → PNG、JPEG変換 | https://www.ilovepdf.com/jp/pdf_to_jpg |
| Smallpdf | 1枚ずつ保存、またはZIPでダウンロード | https://smallpdf.com/jp/pdf-images |
| PDF2Go | OCRオプション付き | https://www.pdf2go.com/convert/pdf-to-images |
使い方
- サイトを開く。
- 「ファイルを選択」からPDFアップロード。
- 「変換開始」ボタンを押す。
- 変換後に各画像を個別にダウンロードまたはZIPでまとめて保存。
注意点
- ファイルサイズが大きいとアップロード・ダウンロードに時間がかかる。
- 個人情報や機密文書はアップロードしないほうが安全。
コマンドラインでプロフェッショナルな抽出
大量ページや自動化が必要な場合は、Poppler の pdfimages コマンドが最強です。
Poppler のインストール
| OS | コマンド |
|---|---|
| Windows | winget install poppler.portable |
| macOS | brew install poppler |
| Linux (Ubuntu) | sudo apt-get install poppler-utils |
pdfimages の使い方
# 例:sample.pdf のすべての画像を抽出
pdfimages -jpg -r sample.pdf outprefix
-jpg:JPEG形式で保存(既存のJPEG形式をそのまま)。-png:PNG形式。-all:すべてのフォーマットを保持。-s:サブサンプリングを行わずに高品質。-c:画像の圧縮率を制御。
出力ファイル名
outprefix-000.jpg,outprefix-001.jpg… のように番号付きで保存。
画像をフィルタリング(サムネイルサイズを除外)
pdfimages -list sample.pdf | awk '$4>1000 && $5>1000 {print $1}' | while read id; do
pdfimages -j -i "$id" sample.pdf outprefix-"$id"
done
$4と$5は画像の横幅・縦幅(ピクセル)。- 高解像度画像のみを抽出。
DRM保護されたPDFを処理
qpdf --decrypt protected.pdf decrypted.pdf
pdfimages -jpg decrypted.pdf outprefix
- まず
qpdfで暗号化を解除。 - その後通常通り抽出。
スキャン済みPDFの画像抽出(OCR)
スキャンされたPDFでは画像がそのままページ背景になっているため、OCRでテキストと画像を分離する必要があります。
Google Drive + Google Docs
- PDFをGoogle Driveにアップロード。
- 右クリック→「開く」→「Google Docs」
- OCR処理後、Google Docs 上で画像を右クリック→保存。
利点
- 追加ソフト不要。
- テキスト検索が可能になる。
ABBYY FineReader
- PDFを開き、「抽出」 → 「画像抽出」
- 画像の品質をそのまま保持。
Tesseract + Poppler の組み合わせ
# PDFを画像(PNG)へ変換
pdftoppm -png -r 300 sample.pdf out
# OCRで文字情報を抽出(必要に応じて)
tesseract out-01.png out-01 -l jpn
- 300dpiで保存した画像は高画質。
- 画像だけを抽出したい場合は
pdftoppmだけで完了。
画像を保存する際のファイル形式と圧縮設定
抽出した画像は、目的に合わせて形式を選ぶと品質とファイルサイズを最適化できます。
| 目的 | フォーマット | 推奨設定 |
|---|---|---|
| ウェブ表示 | JPEG | 85〜90%圧縮、RGB |
| 高解像度印刷 | TIFF | 無圧縮、CMYK |
| 透明背景 | PNG | 8bit/24bit, 最小圧縮 |
| フロントエンド | WebP | 80%, 透明保持可 |
pdfimages -pngでPNG形式に変換。convert(ImageMagick)で再圧縮:convert outprefix-000.png -quality 90 outprefix-000.jpg
よくあるトラブルとその対策
| 症状 | 原因 | 対策 |
|---|---|---|
| 画像が抜けている | 画像がXObjectとして埋め込まっていない(テキスト化されている) | OCRで再処理 |
| 画像が乱れた | JPEGデータが破損している | pdfimages -all で元ファイルを再取得 |
| 文字化け | 日本語文字が埋め込まれた画像 | tesseract -l jpn でOCR化 |
| 大量ページで時間がかかる | 1ページ毎に処理を行っている | -all オプションで一括抽出 |
| 許可が必要なPDF | DRMが施されている | まず qpdf --decrypt で解除する |
おすすめワークフローまとめ
| シーン | 推奨ツール | 具体的手順 |
|---|---|---|
| 数ページ以内の即時抽出 | Adobe Acrobat Reader DC / Preview | 右クリック → 「画像保存」 |
| 大量ページの高速抽出 | Popplerの pdfimages | pdfimages -all sample.pdf out |
| DRM付きPDF | qpdf + pdfimages | 1) qpdf --decrypt protected.pdf out.pdf 2) pdfimages -jpg out.pdf out |
| スキャン済みPDF | Google Docs / ABBYY FineReader | PDF → OCR → 画像保存 |
| 自動化・スクリプト化 | コマンドライン + バッチ/シェル | pdfimages + for ループで自動抽出 |
最後に
PDFに埋め込まれた画像を「最速で、かつ高品質に」取り出すには、目的とシーンに合わせてツールを使い分けることが鍵です。
- 1・2クリックで済む場合はGUIツールを、
- 大量・自動化が必要ならCLIツール(Poppler)を、
- スキャンPDFならOCRが必須です。
作業に合わせて最適な組み合わせを選び、画像抽出をスムーズに行いましょう!


コメント