Bon nombre d’entreprises proposent leur contenu en format PDF sur leur site web. Depuis 2001, Google indexe les fichiers PDFs présents sur les sites web. Chéri de bien des gens, le PDF est-il utile ou une nuisance pour le référencement web ?
Le PDF est un fichier très utile en complément d’information. Il peut notamment servir à de la documentation utile que vous ne désirez pas mettre en format HTML. Cette stratégie en téléchargement direct sur votre site peut être alors très intéressante.
Mais il faut faire attention ! Votre site ne doit en aucun cas être le lieu par excellence du PDF. Vous devez mettre en priorité le contenu de votre site, puis les fichiers PDF. Si votre site est pauvre en contenu et que vous avez beaucoup de fichiers PDF, vous aurez sans aucun doute une mauvaise surprise dans les semaines qui suivent face à votre positionnement sur Google.
Ce que Google capte face aux PDFs
Le PDF est relativement similaire à celui d’une page HTML au point de vue du référencement web. Ce qui veut donc dire que si vous avez du texte et des liens, Google en prendra en considération. Toutefois, si vous avez des images ou bien que votre PDF est une image en y incluant votre texte, Google ne l’indexera pas à son outil Images.
Google capte également la plupart des langues. Alors, vous pouvez proposer des alternatives linguistiques de votre fichier afin de vous faire voir autrement.
Afin que Google puisse bien capter votre document et le comprenne, vous devez retirer le mot de passe lors de l’ouverture de votre fichier. Sans ça, Google ne sera pas en mesure de prendre en considération votre fichier. Si vous désirez qu’il soit privé, vous pouvez laisser le mot de passe.
Un meilleur positionnement des fichiers PDFs dans Google
Ce n’est pas un secret ! Un peu à la manière de l’optimisation de vos pages HTML, vous devez mettre un titre explicatif de votre fichier. Par exemple : referencement-un-fichier-pdf-google.pdf.
À l’intérieur même de votre fichier, vous devez mettre un titre en texte afin que Google puisse capter la pertinence de votre contenu.
Pour terminer, ajoutez la métadonnée title au lien PDF avec une phrase décrivant ce fichier. Vous allez ainsi augmenter vos chances d’être repéré sur ce moteur de recherche.
Recherche d’un fichier PDF dans Google
Vous avez deux options de recherche. La plus efficace, c’est la syntaxe suivante : filetype:pdf. Vous n’avez qu’à écrire ce que vous cherchez dans Google puis cette syntaxe. Par exemple : référencement web filetype:pdf. Google vous donnera alors tous les documents PDF traitant du sujet en référencement web.
Vous pouvez également faire une simple recherche en donnant le nom du fichier. Par exemple : référencement web .pdf. Celle-ci se mélangera entre PDF et HTML.
Cette stratégie est également possible avec les fichiers Words. Les fameux .doc sont également référencés sur Google. Mais ne faites surtout pas l’erreur de mettre votre même fichier en format PDF et en .DOC en téléchargement sur votre site. Vous dupliquez votre contenu, ce qui devient néfaste pour votre référencement.
Alors, sortez votre Acrobat et amusez-vous avec vos PDF !
Merci pour ce rappel intéressant. Le PDF est d’ailleurs à ce titre une tactique de référencement très pertinente pour certains sites en Flash ou sur des sites un peu minimalistes utilisant principalement le framework jQuery ou certaines librairies javascript que Google n’arrive pas encore à décrypter malgré ce qu’ils prétendent parfois…
Je suis d’accord avec votre point de vue. Toutefois, pour avoir un site web en Flash, il faut être conscient dès le départ que le site ne sera que très peu référençable !
Un article informatif au sujet des pdf sur le web. Ce qui est plutôt rare !
Une petite question en passant, Afin de déterminer le suivi SEO, peut-on facilement se rendre compte qu’un fichier PDF que l’on consulte sur le web est privé ou non ?
Merci pour votre commentaire. Je suis content de savoir que cet article vous a été utile par sa rareté ! Je ne suis toutefois pas certain de bien comprendre la question. Si le fichier PDF est sur le serveur FTP dans un répertoire dont le seul accès est le FTP, c’est une façon de savoir si d’autres gens le consulte via Google Analytics.
ok donc à partir du moment où un fichier pdf est téléchargeable par tout visiteur d’un site, il l’est donc pour Google !
Il faut qu’il soit dans votre sitemap.xml et/ou qu’il y ait un lien sur votre site donnant accès à ce PDF afin que Google puisse le prendre en charge.
Merci pour les infos claires et limpides. Votre texte répond à certaines de mes interrogations à propos de l’indexation des fichiers PDF, un format que j’utilise souvent.
Merci pour votre commentaire Sylvain. C’est fort gentil de votre part. Je suis content de savoir que ce billet a pu répondre à vos questions concernant les PDF et son référencement.
[…] Problématique : Le site de mon client mettait beaucoup trop l’emphase sur ces PDF, laissant ainsi peu de place à son contenu en format HTML. Google a donc reclassé le site, même sous le nom de son entreprise. Alors attention au référencement des PDFs. […]
[…] présentations Vous avez des présentations PDFs et vous désirez en faire le partage. Sachez qu’il existe plusieurs sites de partages de […]