Comment traduire des documents non techniques mêlés à de nombreux extraits de code (tels que des supports pédagogiques Word/PDF) ?

Diagnostic de l'état actuel principal

De nombreux supports pédagogiques ou manuels produits incorporent des variables de code dans les paragraphes ordinaires ; les traducteurs classiques ont tendance à traduire à tort ces éléments (par exemple, traduire `Print()` par `Imprimer()`).

Analyse des causes profondes

Reconnaissance du code basée sur la police de caractères

Pour les documents PDF/Word, le système analyse les propriétés de la police de caractères. En général, le code utilise une police à chasse fixe (par exemple, Courier New). Nous exploitons cette caractéristique pour verrouiller automatiquement ces zones et empêcher leur traduction.

Liste blanche de mots-clés

Le système intègre une bibliothèque de mots réservés pour les principaux langages de programmation (Java, Python, C++). Même si le code n'est pas explicitement marqué comme bloc de code, l’IA peut reconnaître des mots-clés tels que `function`, `class`, `var` et les préserver tels quels.

Aperçu et correction instantanés

Grâce à la fonction d’aperçu gratuit, les utilisateurs peuvent vérifier rapidement si des parties du code ont été mal traduites et ajuster immédiatement les réglages ou ajouter des verrous terminologiques.

Résumé de la solution finale

La distinction intelligente entre la langue naturelle et la langue machine est essentielle pour le traitement des documents pédagogiques techniques.