Scan PDF trop lourd : que faire ?

Un scan de 10 pages devrait peser 5-8 Mo maximum. Si le tien fait 50+ Mo, ton scanner est presque toujours réglé sur 300 DPI couleur par défaut alors qu'il devrait être à 200 DPI niveaux de gris pour la majorité des usages. Soit tu refais le scan au bon réglage, soit tu compresses le PDF existant. Les deux solutions sont détaillées ci-dessous, avec les ratios de réduction attendus.

Arbre de décision

  • Tu as accès au document papier original ? Refais le scan (Étape 2 ci-dessous). C'est toujours mieux que compresser.
  • Tu n'as que le PDF, pas l'original ? Compresse le PDF (Étape 3). Tu perds un peu de qualité mais c'est généralement invisible à l'écran.
  • Le PDF est pour usage juridique ou impression pro ? Compression légère seulement (méthode dans l'Étape 5). N'essaie pas de réduire trop agressivement.

Tutoriel : 5 étapes pour régler le problème

1

Identifie la source du poids

Ouvre le PDF et vérifie : a-t-il une couche OCR (texte sélectionnable) ? Est-il en couleur ou noir et blanc ? Combien de pages ?

2

Refais le scan au bon réglage (si possible)

Reconfigure ton scanner à 200 DPI niveaux de gris (au lieu de 300 DPI couleur par défaut). Gain typique ×3 à ×5 sans perte de lisibilité texte.

3

Si refaire le scan est impossible, compresse

Utilise un outil qui downsample les images embarquées à 150 DPI et recompresse en JPEG q75. Ratio de réduction : ×5 à ×10 pour les scans standards.

4

Vérifie le résultat à 200% zoom

Le texte doit rester net. Si tu vois du flou ou des artefacts dans les lettres, ton niveau de compression est trop agressif. Repasse en compression moyenne.

5

Pour les bulletins ou contrats officiels

Garde 200 DPI minimum et conserve la couleur si le document a un cachet bleu/rouge à préserver pour valeur probante. La compression descend alors moins (×2 à ×3 typique).

Quel réglage scanner pour quel usage

UsageDPI
Email rapide / écran150
Archivage interne200
Document avec cachet/tampon200
Impression jet d'encre300
Impression pro / valeur probante300
Photo ou plan architectural600

Solution rapide

Compresse ton scan PDF maintenant

Réduction typique ×5 à ×10 pour les scans, sans perte de lisibilité texte. Local, gratuit, sans inscription.

Lancer →

Questions fréquentes

Pourquoi mon scanner produit-il un PDF de 80 Mo pour 10 pages ?+

Ton scanner est probablement réglé sur 300 DPI couleur par défaut. À cette résolution, chaque page A4 pèse 3-8 Mo en JPEG. 10 pages × 6 Mo = 60-80 Mo. Reconfigure à 200 DPI niveaux de gris pour passer à 500 Ko-1 Mo par page.

Quel réglage scanner choisir pour quel usage ?+

Lecture écran / email : 150 DPI niveaux de gris (300-500 Ko par page A4). Archivage : 200 DPI niveaux de gris (500-800 Ko par page). Impression : 300 DPI couleur (3-6 Mo par page). Document avec cachets ou photo couleur essentielle : 300 DPI couleur. Sinon, niveaux de gris suffit.

Compresser un PDF scanné dégrade-t-il l'OCR (recherche de texte) ?+

Si tu compresses APRÈS l'OCR, la couche texte reste intacte (elle n'est pas une image). Si tu compresses AVANT l'OCR puis tu OCRises, la qualité de reconnaissance baisse parce que l'image source est dégradée. Bon ordre : scanner → OCR → compression.

Mes scans sont noir et blanc 1-bit, pourquoi sont-ils encore lourds ?+

Le 1-bit (noir/blanc pur) ne devrait pas dépasser 50-100 Ko par page A4 à 300 DPI. Si tes scans 1-bit sont lourds, c'est probablement (a) qu'ils sont en fait en niveaux de gris masqués en 1-bit, ou (b) que la couche OCR ajoute 200-500 Ko par page. Vérifie les deux.

JBIG2 vs JPEG2000 pour compresser des scans, lequel choisir ?+

JBIG2 : très efficace pour scans noir et blanc (texte), ratio 5-10× supérieur à JPEG. Mais peut substituer des caractères similaires (un 6 lu comme 8) — risque sur documents juridiques. JPEG2000 : meilleur que JPEG classique pour couleur (~20% gain), mais compatibilité moindre sur vieux lecteurs PDF. JPEG reste le plus sûr universellement.

Mon scan a une couche OCR mais le texte est mal reconnu, comment refaire l'OCR ?+

Adobe Acrobat Pro : Tools → Recognize Text → In This File. Configurer la langue (français pour les accents). Pour gratuit : Tesseract en ligne de commande avec option -l fra. Le moteur Tesseract atteint 95-99% de précision sur scan propre 300 DPI.

Combien de Ko par page A4 est "normal" pour un scan ?+

Scan optimal pour écran : 150-400 Ko/page (150 DPI niveaux de gris). Scan optimal pour archivage : 500-800 Ko/page (200 DPI niveaux de gris). Scan haute qualité : 2-4 Mo/page (300 DPI couleur). Au-delà : ton scanner sur-échantillonne ou tu as activé "amélioration automatique".

À lire aussi