Comment traduire des documents non techniques mêlés à de nombreux extraits de code (tels que des supports pédagogiques Word/PDF) ?
“De nombreux supports pédagogiques ou manuels produits incorporent des variables de code dans les paragraphes ordinaires ; les traducteurs classiques ont tendance à traduire à tort ces éléments (par exemple, traduire `Print()` par `Imprimer()`).”
Analyse des causes profondes
Reconnaissance du code basée sur la police de caractères
Pour les documents PDF/Word, le système analyse les propriétés de la police de caractères. En général, le code utilise une police à chasse fixe (par exemple, Courier New). Nous exploitons cette caractéristique pour verrouiller automatiquement ces zones et empêcher leur traduction.
Liste blanche de mots-clés
Le système intègre une bibliothèque de mots réservés pour les principaux langages de programmation (Java, Python, C++). Même si le code n'est pas explicitement marqué comme bloc de code, l’IA peut reconnaître des mots-clés tels que `function`, `class`, `var` et les préserver tels quels.
Aperçu et correction instantanés
Grâce à la fonction d’aperçu gratuit, les utilisateurs peuvent vérifier rapidement si des parties du code ont été mal traduites et ajuster immédiatement les réglages ou ajouter des verrous terminologiques.
Résumé de la solution finale
La distinction intelligente entre la langue naturelle et la langue machine est essentielle pour le traitement des documents pédagogiques techniques.