Invalid UTF-8 byte sequence (�re)
Je reprend reprends la question traitée ici:
https://texnique.fr/osqa/questions/7468/package-inputenc-erreur-invalid-utf-8-byte-sequence
[ici](https://texnique.fr/osqa/questions/7468/package-inputenc-erreur-invalid-utf-8-byte-sequence), sur ce même site, et qui se pose de nouveau, sans être réapparue depuis des années.
La question principale qui reste est la suivante: suivante : comment identifier le caractère jugé invalide?
invalide ?
En pratique, lorsque l'affichage de «céphalées» « céphalées » est réduit à « cal », il est facile d'identifier le « é », de même dans l'indication « Invalid UTF-8 byte sequence (�re) » j'ai pu identifier le « ï ».
Mais quand le message indique le code «UTF-8 `UTF-8 byte "A0 », "A0`, j'avoue n'avoir pas su trouver le caractère incriminé dans le document produit.
Autre observation, les caractères accentués en question (ï (`ï` et é) `é`) passent très bien en dehors de l'environnement `tabularx`. J'ai donc remplacé `tabularx` par `tabular` : le problème subsiste, mais l'affichage de l'erreur précise la place du caractère concerné, à savoir un blanc devant le « : ». En effet, ce tableau au format `.tex` est exporté depuis l'application `gnumeric`. On trouve donc le même problème qu'avec les suites [libre|open|MS]office. `[libre|open|MS]office`. Le « "AO » est donc probablement un tel blanc qui ne serait pas le caractère espace habituel.
Il existe certainement un tableau des caractères UTF8 avec leur code, et un moyen de remplacer tous ces « faux » caractères par le caractère souhaité (comme je l'ai fait pour remplacer tous les « é » par des « \'{e} »). Mais où trouver ce tableau ? Et quel moyen utiliser pour ces remplacements ?