Démo interactive du traducteur de PDF et de sous-titres : découvrez la traduction préservant le format en action
Publié le 8 avril 2026 · Lecture de 8 min · Par l'équipe Doc2Lang
En bref
Nous avons lancé une démo de traduction interactive sur doc2lang.com où vous pouvez tester notre traducteur de PDF IA et notre traducteur de sous-titres IA sans rien téléverser ni vous inscrire. Choisissez un document d'exemple, sélectionnez parmi plus de 100 langues cibles et visualisez la traduction côte à côte avec l'original — avec les polices, les tableaux, les mises en page et les codes temporels parfaitement préservés. Cet article explique pourquoi nous l'avons conçue, comment la traduction de documents préservant le format fonctionne réellement en coulisses, et ce qui arrive ensuite.
Aller à :
- L'état de la traduction de PDF en ligne en 2026
- Pourquoi nous avons créé une démo interactive
- Comment la traduction de PDF de Doc2Lang préserve le formatage
- Le parcours de démo : trois clics jusqu'au « Wow »
- Comment la traduction de sous-titres de Doc2Lang préserve les codes temporels
- Essayez la démo Doc2Lang
- Ce qui arrive ensuite
- Foire aux questions
L'état de la traduction de PDF en ligne en 2026
Cherchez « traduire PDF en ligne » sur Google et vous obtiendrez des dizaines de résultats. Cherchez « traduire PDF en japonais » ou « traduire des sous-titres SRT » et vous en obtiendrez des dizaines d'autres. La plupart fonctionnent ainsi :
- Téléversez votre fichier
- Attendez
- Recevez un amas de texte brut aplati sans aucun formatage
- Passez deux heures à reconstruire la mise en page dans Word
C'est le secret honteux de la traduction de documents par IA : la partie traduction est pour l'essentiel résolue, mais pas la partie préservation du format. Les grands modèles de langage comme GPT-4 et Claude peuvent traduire entre les langues avec une précision quasi humaine. Le plus difficile n'est pas les mots — c'est de conserver la structure du document intacte pendant qu'on les échange.
Un PDF typique contient :
- Du texte positionné à des coordonnées x/y exactes
- Des polices qui peuvent ne pas avoir d'équivalent dans la langue cible
- Des tableaux construits à partir de lignes de grille invisibles et de zones de texte alignées
- Des images avec des légendes intégrées
- Des mises en page multi-colonnes avec des métadonnées d'ordre de lecture
- Des en-têtes, pieds de page, numéros de page, notes de bas de page
- Des graphiques vectoriels, des diagrammes et des formules mathématiques en ligne
Lorsqu'un traducteur de PDF naïf extrait le texte, l'envoie à une API de traduction et le recolle, toute cette structure est perdue. Pire, le texte traduit a presque toujours une longueur différente de l'original — le japonais représente environ 60 % de la longueur de l'anglais, l'allemand environ 130 % — donc même si vous préservez les coordonnées, le texte déborde ou laisse des trous.
C'est le problème que Doc2Lang s'efforce de résoudre depuis deux ans. Et la démo que nous venons de lancer est la première fois que les visiteurs peuvent voir la solution fonctionner en temps réel, sans s'engager à quoi que ce soit.
Pourquoi nous avons créé une démo interactive (et pourquoi vous devriez aussi)
L'ancienne page d'accueil de Doc2Lang ressemblait à ceci :
Épurée. Fonctionnelle. Indiquait exactement quoi faire. Et pourtant, nos analyses racontaient une histoire brutale : la plupart des visiteurs quittaient le site dans les 15 secondes. Ceux qui restaient abandonnaient souvent à l'étape du téléversement. La poignée qui allait jusqu'au bout convertissait bien — mais le tunnel au-dessus fuyait de partout.
Nous avons parlé aux utilisateurs. Les retours étaient cohérents :
J'ai essayé cinq autres traducteurs de PDF ce mois-ci. Ils promettaient tous la préservation du format. Aucun ne l'a tenu. Pourquoi devrais-je gaspiller un autre fichier avec vous ?
Juste. La confiance dans cette catégorie est brisée, et nous ne pouvions pas la réparer avec du texte. Nous avons donc construit une expérience qui ne demande aucune confiance pour commencer : la démo de traduction interactive.
Le principe est simple : laisser les gens vivre l'expérience du produit avant de leur demander quoi que ce soit. Pas d'inscription, pas de téléversement, pas de vérification d'e-mail. Documents d'exemple préchargés, trois clics, résultat instantané.
Comment la traduction de PDF de Doc2Lang préserve le formatage
Entrons dans la technique pendant une minute, parce que c'est la partie que la plupart des articles de blog survolent.
Lorsque Doc2Lang traite un PDF pour la traduction, il ne se contente pas d'en extraire le texte et de le traduire. Il exécute un pipeline en plusieurs étapes :
Étape 1 : Analyse du document
Nous analysons le PDF en un arbre structuré d'éléments de mise en page — blocs de texte, tableaux, images, graphiques vectoriels — chacun avec sa position, sa taille, sa police, sa couleur et son z-index préservés. Ce n'est pas de l'OCR ; pour les PDF natifs, nous lisons la structure réelle du document. Pour les PDF scannés, nous nous replions sur une passe d'OCR sensible à la mise en page.
Étape 2 : Regroupement sémantique
Les blocs de texte adjacents qui vont ensemble (comme un paragraphe réparti sur deux colonnes, ou un titre et son sous-titre) sont regroupés sémantiquement. C'est important car traduire chaque bloc isolément produit du charabia — le contexte est primordial.
Étape 3 : Traduction avec contraintes de mise en page
Chaque groupe sémantique est traduit par un LLM avec des contraintes explicites : « traduis ce paragraphe en japonais, mais le résultat doit tenir dans une zone de tant de pixels de large avec cette police. » Le modèle est instruit de choisir des formulations qui tiennent dans l'espace disponible. Pour les titres, cela signifie souvent choisir des synonymes plus courts. Pour le corps du texte, cela peut signifier restructurer les phrases.
Étape 4 : Substitution de polices
Si le PDF original utilise une police qui ne prend pas en charge le jeu de caractères de la langue cible (par exemple, une police uniquement latine à laquelle on demande de rendre du japonais), nous la remplaçons par la police visuellement la plus proche qui le fait. C'est pourquoi nos traductions japonaises ne ressemblent pas à des polices système par défaut — nous maintenons la continuité visuelle avec l'original.
Étape 5 : Re-rendu
Enfin, nous re-rendons le PDF à partir de zéro en utilisant le texte traduit, les images originales, les graphiques vectoriels originaux et les zones de mise en page ajustées. La sortie est un véritable fichier PDF que vous pouvez ouvrir dans Adobe Acrobat, et non une capture d'écran de celui-ci.
Vous pouvez voir le résultat par vous-même dans la démo :
La version anglaise à gauche comporte une section héros bleu marine foncé, un accent orange sur « Formatting Intact », quatre pastilles de fonctionnalités et une grille des formats pris en charge avec des puces colorées. La version japonaise à droite reprend tous les mêmes éléments aux mêmes positions — la seule chose qui a changé, c'est la langue. L'accent orange est désormais sur « 書式をそのまま » (ce qui signifie « conserver le formatage tel quel »). Les pastilles de fonctionnalités affichent maintenant « AI搭載 », « 100以上の言語 », « レイアウト保持 », « 従量課金 ». Même design, langue différente.
C'est ce que signifie en pratique la traduction de PDF préservant le format. Pas « nous avons fait de notre mieux » — réellement identique.
Le parcours de démo : trois clics jusqu'au « Wow »
Nous avons délibérément conçu la démo pour être l'opposé d'un formulaire. Trois étapes, aucune friction :
Étape 1 : Choisissez un document d'exemple. Nous avons préchargé des fichiers qui mettent en valeur de vrais défis — une plaquette produit avec une mise en page complexe (Doc2Lang_Product_Cover.pdf), une table des matières de publication de l'OMC structurée et riche en texte (WTO_Table_of_Contents.pdf) et un fichier de sous-titres de film libre Blender (Sprite Fright.srt). Ce sont de vrais cas limites, pas des exemples jouets.
Étape 2 : Choisissez une langue cible. Nous prenons en charge plus de 100 langues pour la traduction de PDF et de sous-titres. La démo expose les huit plus populaires sous forme de boutons cliquables avec des emojis drapeaux : chinois, japonais, coréen, espagnol, français, allemand, italien et portugais.
Étape 3 : Visualisez la traduction. Le résultat se charge côte à côte avec l'original. Pour les PDF, les deux côtés sont rendus comme de véritables aperçus PDF avec des commandes de zoom, de rotation et de téléchargement. Pour les sous-titres, les deux côtés sont affichés comme un tableau synchronisé avec les horodatages dans une colonne centrale.
C'est tout. Pas de compte, pas de téléversement, pas d'attente dans une file.
Comment la traduction de sous-titres de Doc2Lang préserve les codes temporels
La traduction de sous-titres a ses propres pièges techniques. Le format semble trompeusement simple — les fichiers SRT ne sont que du texte brut avec des horodatages et des lignes de dialogue :
1
00:00:17,000 --> 00:00:19,000
Hello, Mr.Snail!
2
00:00:19,500 --> 00:00:22,000
Aw, you cute little cornu aspersum.Mais traduire correctement des sous-titres nécessite de résoudre plusieurs problèmes à la fois :
- Les horodatages doivent être préservés à l'identique. Une virgule manquante ou un mauvais saut de ligne, et le fichier entier ne se charge pas dans VLC, YouTube ou Premiere Pro.
- La longueur des lignes doit respecter la vitesse de lecture à l'écran. Le japonais tient environ 13 caractères par seconde ; l'anglais environ 17. Un sous-titre traduit littéralement est souvent illisible dans les temps.
- Le contexte s'étend sur plusieurs lignes. « Je jure que je vais la tuer » à la ligne 5 n'a de sens que si l'on sait à qui « la » fait référence depuis la ligne 3. Traduire chaque ligne isolément produit du non-sens.
- Le ton du locuteur doit être conservé. La voix d'un personnage, son argot et sa personnalité doivent survivre à la traduction. Le « Sugar Buns » de Sprite Fright ne doit pas devenir un « 砂糖パン » littéral (pain sucré).
Doc2Lang gère tout cela. Le moteur de traduction lit l'intégralité du fichier de sous-titres comme un scénario, maintient la voix des personnages à travers les scènes, respecte les contraintes de temps d'écran et produit un fichier SRT parfaitement identique au niveau de l'octet, avec les horodatages d'origine intacts.
Vous pouvez l'essayer par vous-même dans la démo avec le court-métrage Sprite Fright de Blender. Nous l'avons choisi car c'est une sortie Creative Commons (nous pouvons donc l'utiliser légalement), les dialogues sont drôles et il a un timing comique serré qui met en échec la plupart des traducteurs de sous-titres. Regardez comment « Hello, Mr.Snail! » devient « やあ、カタツムリさん! » à exactement 00:17 — même horodatage, même ton espiègle.
Doc2Lang prend en charge les formats de sous-titres SRT, WebVTT et ASS avec une préservation complète du timing dans plus de 100 langues.
Essayez la démo Doc2Lang
La démo interactive est en ligne dès maintenant sur doc2lang.com. Pas d'inscription, pas de téléversement, pas de piège.
Si vous avez déjà été échaudé par un outil « traduire PDF en ligne » qui a réduit votre beau document en bouillie, cette démo est faite pour vous. Cliquez partout. Essayez la traduction en japonais, puis celle en allemand. Ouvrez la vue côte à côte. Téléchargez le PDF traduit et ouvrez-le dans Adobe Acrobat. Comparez-le à l'original. Nous pensons que vous verrez la différence immédiatement.
Ce qui arrive ensuite
Pour l'instant, la démo couvre la traduction de PDF et de sous-titres. Au cours des prochaines semaines, nous ajouterons des démos en direct pour tous les formats que Doc2Lang prend en charge :
- Traduction de documents Word (DOCX) — en préservant les styles, en-têtes, pieds de page, tableaux, images intégrées et modifications suivies. Particulièrement utile pour traduire des contrats, des rapports et des articles universitaires.
- Traduction de feuilles de calcul Excel (XLSX, XLSM, CSV) — en préservant les formules, la mise en forme conditionnelle, les classeurs multi-feuilles et les tableaux croisés dynamiques. Essentiel pour les modèles financiers et les exports de données.
- Traduction de présentations PowerPoint (PPTX) — en préservant les dispositions des diapositives, les animations, les notes de l'orateur, les graphiques intégrés et les SmartArt. Indispensable pour les keynotes internationales et les présentations commerciales.
- Traduction de livres électroniques EPUB — en préservant la structure des chapitres, la table des matières, les notes de bas de page et le flux de lecture. Utilisé par les auteurs indépendants pour traduire leurs livres pour les marchés mondiaux.
- Traduction d'images (PNG, JPG, WEBP) — en utilisant l'OCR associé à un re-rendu visuel pour préserver les mises en page de texte-dans-image. Utile pour traduire les captures d'écran, les infographies et les documents scannés.
Chacun de ces formats a ses propres défis uniques de préservation du format, et chacun aura sa démo dédiée. Abonnez-vous à nos notes de version pour être averti dès que chacun est disponible.
Foire aux questions
Q : Dois-je créer un compte pour utiliser la démo Doc2Lang ?
Non. La démo interactive ne nécessite aucune inscription, aucun téléversement ni aucune vérification d'e-mail. Elle fonctionne entièrement sur des documents d'exemple préchargés.
Q : Combien de langues le traducteur de PDF de Doc2Lang prend-il en charge ?
Doc2Lang prend en charge plus de 100 langues pour la traduction de PDF, y compris le japonais, le chinois (simplifié et traditionnel), le coréen, l'espagnol, le français, l'allemand, l'italien, le portugais, le russe, l'arabe, l'hindi, le vietnamien, le thaï et bien d'autres.
Q : Quels formats de sous-titres Doc2Lang prend-il en charge ?
Doc2Lang prend en charge les formats de sous-titres SRT, WebVTT et ASS. Tous les codes temporels, balises de formatage et styles sont préservés lors de la traduction.
Q : Doc2Lang peut-il traduire des PDF scannés ?
Oui. Pour les PDF scannés (basés sur des images), Doc2Lang effectue une passe d'OCR sensible à la mise en page avant la traduction, puis restitue le résultat sous forme de PDF entièrement consultable dans la langue cible.
Q : Comment fonctionne la tarification de Doc2Lang ?
Doc2Lang utilise une tarification au fichier — sans abonnement requis. Vous pouvez prévisualiser chaque traduction gratuitement avant de payer, afin de ne payer que pour les résultats qui vous conviennent.
Q : Quelle est la différence entre Doc2Lang et Google Translate ou DeepL ?
Google Translate et DeepL sont excellents pour traduire du texte brut, mais ils ne préservent pas le formatage des documents. Doc2Lang est conçu spécifiquement pour la traduction de documents avec préservation de la mise en page — polices, tableaux, images, graphiques et mises en page multi-colonnes restent tous intacts dans le fichier de sortie.
Doc2Lang est une plateforme de traduction de documents propulsée par l'IA, spécialisée dans la traduction préservant le format pour les PDF, Word, Excel, PowerPoint, EPUB, images et sous-titres. Nous prenons en charge plus de 100 langues avec une tarification au fichier et un aperçu gratuit avant le paiement. Essayez la démo interactive ou traduisez votre propre document dès aujourd'hui.
Articles connexes :