Un PDF devient lourd à cause de 5 facteurs principaux : images haute résolution (responsable de 80-90% des cas), polices embarquées entièrement (1-4 Mo par police), couches OCR sur scans (200-500 Ko par page), historique d'édition non purgé, et thumbnails embarqués. Un PDF de texte pur devrait peser 50-100 Ko par page. Au-delà, l'une des 5 causes s'applique.
Pourquoi mon PDF est trop lourd ? Les 5 vraies causes (et solutions)
Tu ouvres un fichier qui devrait peser 200 Ko, et tu vois 18 Mo. Tu te demandes ce qui s'est passé. La réponse n'est presque jamais « le texte est long » — c'est toujours l'une des 5 causes ci-dessous. Diagnostic + fix pour chacune.
Test rapide : quel est ton type de PDF ?
Tu sélectionnes le texte caractère par caractère → PDF natif. Cause probable : polices embarquées ou images jointes (causes 2 ou 1)
Tu sélectionnes par blocs rectangulaires → PDF scanné. Cause certaine : images haute résolution + couche OCR (causes 1 et 3)
Le PDF a été édité plusieurs fois → Cause probable : historique d'édition (cause 4)
Le PDF vient d'une page web "Print to PDF" → Cause certaine : arrière-plans CSS rendus (cause 1 variante)
1. Images haute résolution
Responsable de 80 à 90% des PDF anormalement lourds. Un scanner produit du 300 DPI en couleur par défaut — soit 3 à 8 Mo par page A4. Une photo smartphone (4000×3000 pixels) embarquée dans un PDF pèse 5-10 Mo. Cinq photos dans un dossier de candidature = 50 Mo instantanés.
Solution : downsample les images à 150 DPI (pour écran) ou 200 DPI (pour impression maison). Gain typique : ×3 à ×9. Le texte reste parfaitement net car il est vectoriel, pas une image.
Détecte la cause :
Si ton PDF fait plus de 1 Mo par page ET contient des photos/scans, c'est cette cause à 95%.
2. Polices embarquées entièrement
Une police comme Roboto, Open Sans ou Helvetica contient 1000-1500 glyphes (lettres latines, accents, symboles, alphabet grec, cyrillique, etc.). Embarquée entière, elle pèse 1 à 4 Mo. Si ton document utilise 3 polices différentes (heading, body, code), tu as déjà 6 à 15 Mo de polices, alors que tu n'utilises probablement que 100 caractères réels.
Solution : « font subsetting », qui garde seulement les glyphes utilisés. Réduction typique de 90% sur le poids des polices. C'est invisible dans le rendu final mais demande un outil qui le fait. Acrobat le fait par défaut. Les compresseurs sérieux aussi.
Détecte la cause :
Si ton PDF vient d'un export Word/Pages et fait plus de 3 Mo malgré peu d'images, c'est probablement les polices.
3. Couche OCR sur PDF scannés
Quand tu scannes un document et l'OCRises (pour que ce soit cherchable), le PDF contient DEUX couches : l'image visible + le texte invisible reconnu. La couche OCR ajoute 200 à 500 Ko par page. Sur un document de 100 pages, ça fait 20-50 Mo de texte qu'on ne voit pas.
Solution : si tu n'as pas besoin que le PDF soit cherchable, retire la couche OCR. Acrobat → Tools → Discover features → Remove hidden text. Le PDF reste lisible mais perd la fonction "Ctrl+F".
4. Historique d'édition non purgé
Le format PDF utilise des "incremental saves" : à chaque modification (annotation ajoutée, signature, page réorganisée), des objets nouveaux sont ajoutés au fichier, mais les anciens NE SONT PAS supprimés. Après 20 éditions, ton PDF peut contenir 20 versions superposées de plusieurs pages, même si tu ne vois que la dernière.
Solution : "Save As Optimized PDF" dans Acrobat (ou Print to PDF puis ouvrir le résultat) force une réécriture propre du fichier en gardant seulement l'état visible. Gain typique : 10-30%.
5. Thumbnails embarqués + métadonnées
Certains éditeurs PDF embarquent une vignette miniature de chaque page pour accélérer la navigation. À 30-50 Ko par thumbnail × 200 pages = 6-10 Mo de métadonnées invisibles. Les métadonnées XMP, signatures de l'app, et information système ajoutent quelques centaines de Ko aussi.
Solution : Acrobat → File → Save As Other → Optimized PDF, et coche "Remove embedded thumbnails" + "Remove metadata". Gain : 5-15%, parfois plus sur PDF anciens.
Pourquoi un PDF de quelques pages texte fait-il 50 Mo ?+
Le texte vectoriel pèse 100-300 Ko pour 10 pages. Si ton PDF de 50 Mo contient juste 5 pages "texte", il y a en réalité des éléments cachés : photos haute résolution embarquées, polices complètes (1-4 Mo chacune), thumbnails de pages, ou couche OCR invisible. Le texte lui-même est presque toujours marginal en taille.
Pourquoi un scan d'une seule page A4 fait-il 8 Mo ?+
Le scanner enregistre par défaut à 300 DPI en couleur RGB. Une page A4 à cette résolution = 8,7 millions de pixels × 24 bits = environ 26 Mo bruts, ramenés à 3-8 Mo après compression JPEG. Pour un usage écran, 150 DPI niveaux de gris suffit (300-800 Ko par page).
Pourquoi mon export Word produit-il un PDF si lourd ?+
Microsoft Word embarque par défaut les polices ENTIÈRES utilisées dans le document, et n'optimise pas les images. Une police comme Roboto pèse 1-4 Mo. Avec 3 polices différentes + quelques images, ton PDF dépasse facilement 5 Mo même pour du texte. La case "Réduire la taille (publication en ligne)" dans l'export Word règle 80% du problème.
Le PDF était à 200 Ko, maintenant à 12 Mo après des annotations. Pourquoi ?+
Chaque enregistrement PDF ajoute des objets sans supprimer les anciens — c'est le principe des "incremental saves". Annotations supprimées, anciennes versions de pages, et révisions s'accumulent. Une compression structurelle (font subsetting + cleanup) ramène typiquement à 600 Ko-1,5 Mo sans toucher au contenu visible.
Mon PDF de site web (Print to PDF Chrome) est énorme. Normal ?+
Oui. Chrome "Print to PDF" capture la page comme image rendue à 96-150 DPI selon les réglages, incluant fond, ads, et arrière-plans CSS. Une page web typique imprimée pèse 2-10 Mo. Désactive "Arrière-plans graphiques" dans le dialogue d'impression pour gagner 60-80% de taille immédiatement.
Pourquoi mon PDF "compressé" par un outil est-il pareil ?+
Trois possibilités : (1) le PDF était déjà compressé une première fois — recompresser donne quasi rien ; (2) l'outil a appliqué seulement la compression sans perte (5-20% de gain), tu as besoin de compression avec perte ; (3) le contenu est essentiellement vectoriel — il n'y a presque rien à compresser car le texte vectoriel est déjà compact par nature.
Mon PDF a une couche OCR. C'est combien d'espace ?+
Une couche OCR pèse 200-500 Ko par page. Sur un document de 100 pages, c'est 20-50 Mo de texte invisible (mais cherchable). Si tu n'as pas besoin de la recherche, la suppression de la couche OCR libère beaucoup d'espace. Adobe Acrobat → Tools → Discover features → Remove hidden text.