Salut Denis,
je n'entends pas non plus de soucis sur l'extrait à 09:00 sauf que la voix est très processée et c'est peut-être à cela que tu es sensible (la voix isolée, à mon goût, est un peu artificielle simplement, sûrement une réverbe numérique colorée ou particulière, il y a peut-être même de la modulation dans cette réverbe, mais c'est très commun en Pop, c'est très 80's... que fait la Police de l'algo

)
La réverbe et les effets sur la voix sont moins présents et présentés sur ton extrait mp3 effectivement, mais plus caricaturaux (simple).
C'est plutôt les "CHE" qui suivent qui sont bien présents et plutôt plus gênants/moches sur le mp3, en écoute attentive.
J'allais te dire que tu as peut-être aussi une saturation ou une fréquence en avant ou qui passe mal côté électronique mais vu que cela n'est pas sur une crête ou un truc un peu appuyé et essayé sur plusieurs équipements, c'est sûrement que tu y es sensible, ton oreille l'a focalisé ou tu peux même développer une hypersensibilité.
Le côté artificiel des réverbes numériques ajoutées, si tu te concentres dessus sur une voix isolée ou en avant par exemple cela s'entend très souvent (fait parti du process et de la sonorité de ce type de prod, le chat métallique), dans le mix on n'y fait pas attention.
Les vieux routards comme Sting doivent aussi peut-être avoir leur mimic d'effet voix (choix d'effets habituels sur sa voix construit sur la durée, faisant partie de sa voix présentée/produite) ce qui pourrait éventuellement te faire généraliser sur celle-ci ou ses enregistrements.
Pour "l'effet mp3", je vois ce que tu veux dire mais il ne faudrait surtout pas le généraliser ni presque dire que le codec mp3 ferait mieux que l'ingé son, ce qui est un peu caricatural, tu l'admettras.
Il m'arrive de préférer parfois des versions mp3 dans des jeux de comparatifs (pas très intéressants) juste parce-ce que le message est simplifié et donc plus accessible sur certains aspects. Il peut être plus facile d'accéder à la "macro information" quand le message est moins riche et subtile, mais c'est très particulier au contenu et l'approche... on ne peut en faire une généralité et à l'inverse c'est plutôt très souvent la richesse du contenu qui favorise son appréciation, le plaisir... global.
Après l'écoute critique, focalisée, n'est peut-être pas la meilleure approche pour apprécier

... comme un système qui pourrait être dit trop définit, représentant des détails mais pas assez un ensemble lié.
Il faut pas grand chose dans le haut médium pour déséquilibrer/désapprécier... une petite focalisation sur un truc, un hypersensibilité génante de l'observation, un petit surplus/résonance d'une fréquence ou petite bande de fréquences (souvent la pièce)... et tout est gâché... par l'approche prise de tête
Par exemple en baissant un peu le volume, tu devrais avoir un effet similaire à l'adoucissement de "l'effet mp3" évoqué... moins d'infos, moins de focalisation, moins de sensibilité haut médium.
Même si tu as fait des tests au casque qui sont très chahutés sur la bande haut médium et vu que tu es focalisé sur cet aspect, cela pourrait être contre instuitif et ne pas invalider soit ton hypersensibilité à une fréquence ou un éventuel défaut/insistance de ton système principal sur celle-ci... il y a plein de façon pour intervenir sur les chuintements et autres.
Une fois que l'on a entendu le truc, on l'entend partout et presque sur n'importe quoi... la qualité et le défaut du cerveau discriminant.