導入
PDF ファイルは文書共有の定番であり、ビジネスや学術、個人利用に至るまで幅広い場面で使用されています。
しかし、ファイルサイズが大きすぎるとメール送信が遅くなる、クラウドストレージで容量が圧迫される、アップロード制限に抵触するなどの問題が発生します。
また、ページ数が多いと印刷先での紙代が増えたり、閲覧に時間がかかるといった課題もあります。
そこで、PDF の「ファイル容量」や「ページ数」を瞬時に確認したいときに便利な方法をまとめました。
コマンドラインからオフラインツール、オンラインサービスまで、誰でも簡単に使える手順をご紹介します。
1. まずは確認したい PDF をローカルに置く
どの方法を選択しても、最初に対象ファイルが PC もしくはスマートフォンに保存されている必要があります。
ファイルエクスプローラーや Finder で「*.pdf」のファイル名を確認し、必要ならば同じフォルダ内に複数のファイルがある場合は一括でチェックできるツールを選択しましょう。
2. ファイルサイズ(容量)を確認するだけの簡易ステップ
2.1 OS のファイル情報を使った方法
| OS | 操作手順 |
|---|---|
| Windows | ファイルを右クリック → 「プロパティ」 → 「全般」タブで「サイズ」と「圧縮後のサイズ」を確認 |
| macOS | ファイルを選択 → ⌘+I (情報ウィンドウ) → 「サイズ」と「圧縮済みサイズ」を表示 |
| Linux (GUI) | ファイルを右クリック → 「情報」または「プロパティ」ダイアログでサイズを確認 |
これらは非常に手軽ですが、ページ数は分かりません。
2.2 画像や埋め込みリソースが重い場合に注意
PDF のサイズは文字列だけでなく、画像、フォント、ベクターグラフィック、埋め込みオブジェクトにも依存します。
画像解像度が 300 dpi 以上の場合、サイズが 10 MB を超えることも珍しくありません。
そのため「ページ数を数える前に画像圧縮やフォント埋め込みの最適化を行う」ことも有効です。
3. ページ数・その他情報を瞬時に取得するコマンドライン
3.1 pdfinfo (Poppler)
pdfinfo は Poppler ライブラリに含まれるユーティリティで、PDF のメタデータを表示します。
インストール
| OS | コマンド |
|---|---|
| Windows | Chocolatey: choco install poppler |
| macOS | Homebrew: brew install poppler |
| Linux (Ubuntu) | sudo apt-get install poppler-utils |
使用例
pdfinfo sample.pdf
出力例
Document : sample.pdf
Pages: 12
Encrypted: no
File size: 245632 bytes
ページ数、アドバンスド情報(作成日、作成者)、ファイルサイズを一括で確認できます。
3.2 qpdf
qpdf は PDF を検証・結合・分割できるツールで、--list オプションでページ情報を取得できます。
qpdf --check sample.pdf
ページ数がターミナルに表示されます。
3.3 PowerShell (Windows)
PowerShell で簡単にページ数を取得するスクリプトがあります。
Add-Type -AssemblyName System.Windows.Forms
$path = "C:\Users\Name\Documents\sample.pdf"
$pdfReader = New-Object -ComObject AcroExch.PDDoc
if ($pdfReader.Open($path)) {
$pages = $pdfReader.GetNumPages()
Write-Output "Pages: $pages"
$pdfReader.Close()
} else {
Write-Output "ファイルが開けませんでした。"
}
※Adobe Acrobat がインストールされている必要があります。
4. GUI ツールで一括チェック
4.1 PDF-XChange Editor
無料版でも PDF のページ数、サイズ、各種メタデータを一目で確認できます。
- PDF を開く
-
ファイル→文書情報 - 「詳細」タブにページ数、ファイルサイズ、バージョンが表示
4.2 Foxit Reader
軽量で高速な PDF ビューワー。「ファイル」→「プロパティ」 でページ数やサイズが確認できます。
4.3 Adobe Acrobat Pro DC
業務でよく使われる場合、Acrobat の「プロパティ」だけでなく「ファイルサイズの要因(Large Size Report)」を使ってどのリソースが大きいかを分析できます。
ツール → PDF 分析 で詳細レポートを生成できます。
5. オンラインサービスで瞬時に確認
5.1 Smallpdf
- Smallpdf PDF Viewer
- 「PDFをアップロード」すると、ページ数、サイズ、解像度が自動で表示されます。
- ほぼ 1 秒で情報取得可能。
5.2 ILovePDF
- 上述と同様のインターフェース。ファイルサイズが大きいとアップロードに時間がかかる場合があります。
5.3 PDFinfo.net
- シンプルなインターフェース。ファイルを添付すると、ページ数・サイズ・フォーマット情報が表示されます。
注意:オンラインサービスはプライバシーとセキュリティの観点から機密情報を添付しないことをおすすめします。
6. 大きな PDF を短時間にチェックする裏技
大量の PDF を一括で確認したい場合は、以下のスクリプトが便利です。
6.1 バージョン 3.0 (Python)
Python で Poppler の pdfinfo を呼び出し、複数ファイルを高速に処理するスクリプト例です。
import subprocess
import os
import concurrent.futures
PDF_DIR = 'C:/Users/Name/Documents/PDFs'
files = [f for f in os.listdir(PDF_DIR) if f.endswith('.pdf')]
def get_pdf_info(path):
cmd = ['pdfinfo', path]
try:
output = subprocess.check_output(cmd, stderr=subprocess.DEVNULL, text=True)
size_line = next(l for l in output.splitlines() if 'File size' in l)
pages_line = next(l for l in output.splitlines() if 'Pages:' in l)
size = int(size_line.split(':')[1].strip().split()[0])
pages = int(pages_line.split(':')[1].strip())
return os.path.basename(path), pages, size
except Exception as e:
return os.path.basename(path), None, None
with concurrent.futures.ThreadPoolExecutor(max_workers=8) as executor:
results = list(executor.map(get_pdf_info, [os.path.join(PDF_DIR, f) for f in files]))
for name, pages, size in results:
print(f'{name}\tPages: {pages}\tSize: {size / 1024:.2f} KB')
-
concurrent.futuresでマルチスレッド化し、数百ファイルを数秒で処理可能。 - 出力はタブ区切りでファイル名、ページ数、サイズが表示され、CSV にリダイレクトしてデータ分析に利用できます。
7. ファイルサイズが大きいときに考えるべき対策
| 要因 | 再考すべき点 | 具体策 |
|---|---|---|
| 画像解像度 | 100 dpi で十分な場合は 300 dpi から 200 dpi へ変更 | GIMP でリサイズ、ImageOptim で圧縮 |
| 重複フォント | 埋め込みフォントが多い | Acrobat の「PDF 作成」時に「フォントの最小化」を有効化 |
| 透明度や複雑なベクターデータ | 無効にできるか確認 | Adobe Acrobat の「最適化ツール」で「画像圧縮」や「ベクターデータの簡易化」を実行 |
| PDF アオリエント化(バージョン) | 旧バージョンは新しいフォーマットよりサイズが大きい | qpdf で --qdf、--linearize などを使って最適化 |
8. さらに進めたい人向け:PDF を最適化して容量削減
8.1 Acrobat Pro DC の「最適化」を使う
-
ファイル→プロパティ→PDF 最適化ツール - 「画像圧縮」、「フォント埋め込み」設定をカスタマイズ
- 「保存」前にプレビューでサイズがどれくらい減るか確認
8.2 Ghostscript
オープンソース、コマンドラインで圧縮処理が可能。
gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/ebook \
-dNOPAUSE -dQUIET -dBATCH -sOutputFile=output.pdf input.pdf
/ebook はテキスト重視でサイズ削減しつつ、画像は圧縮率を調整しています。
9. 確認後にやるべきこと
- サイズとページ数の目安を決める:ビジネスなら 10 MB 以内、学術論文なら 2 MB 未満を目標。
- ファイルをアップロード先と比較:クラウドやメールサービスに容量上限が設けられている場合は、事前にサイズを調整。
- 閲覧環境を想定:低速ネットワークを利用するユーザーがいる場合は、さらに圧縮率を上げる。
10. まとめ
- ファイルサイズは OS の「プロパティ」で即座に確認。
-
ページ数は
pdfinfoなどのコマンドラインツールで高速取得。 - GUI ツール(PDF‑XChange, Foxit, Acrobat)やオンラインサービス(Smallpdf, ILovePDF)も活用できる。
- 何百、何千ファイルを一括でチェックしたい場合は Python/スクリプトでマルチスレッド化。
- 大きい PDF の場合は画像圧縮、フォント最小化、Ghostscript で再加工して容量削減。
これらの手順を組み合わせれば、PDF の「サイズ」と「ページ数」を瞬時に把握し、ファイル共有に伴うトラブルを未然に防ぐことができます。ぜひ、自身の業務フローに合わせて最適な方法を選び、ドキュメント管理の効率化を図ってください。


コメント