Comment traduire des documents non techniques mêlés à de nombreux extraits de code (tels que des supports pédagogiques Word/PDF) ?

Analyse des causes profondes

Reconnaissance du code basée sur la police de caractères

Pour les documents PDF/Word, le système analyse les propriétés de la police de caractères. En général, le code utilise une police à chasse fixe (par exemple, Courier New). Nous exploitons cette caractéristique pour verrouiller automatiquement ces zones et empêcher leur traduction.

Liste blanche de mots-clés

Le système intègre une bibliothèque de mots réservés pour les principaux langages de programmation (Java, Python, C++). Même si le code n'est pas explicitement marqué comme bloc de code, l’IA peut reconnaître des mots-clés tels que `function`, `class`, `var` et les préserver tels quels.

Aperçu et correction instantanés

Grâce à la fonction d’aperçu gratuit, les utilisateurs peuvent vérifier rapidement si des parties du code ont été mal traduites et ajuster immédiatement les réglages ou ajouter des verrous terminologiques.

Résumé de la solution finale

La distinction intelligente entre la langue naturelle et la langue machine est essentielle pour le traitement des documents pédagogiques techniques.