Fondamentalement : TeX a un moteur de composition (de paragraphes) fabuleux, et en plus l’utilisateur a entièrement accès à ce moteur de composition. De plus, tout le système fonctionne sur un système de macros, et l’utilisateur a lui-même la possibilité d’accéder aux macros de plus bas niveau (sans devoir recompiler le barnum, c’est juste le fonctionnement normal). LaTeX étant déjà un ensemble conséquent de macros (perso, je bossais avec mes propres macros, et je n’ai jamais fait un bouquin avec LaTeX, parce que je détestais ne plus avoir le contrôle, et surtout je détestais cette courbe d’apprentissage à plateau qu’imposait LaTeX – j’ai déjà évoqué ce sujet par comparaison avec SPIP).
Le HTML ne repose pas du tout sur un tel système de macros pour l’usager, et l’utilisateur n’a en particulier rigoureusement aucun accès au moteur de composition (il y a deux-trois CSS qui commencent à apparaître, mais c’est assez faiblard en comparaison).
Sinon, pour ce qui est d’Unicode, il me semble que ça tourne sur TeX depuis quelques années déjà (je ne joue plus avec, mais la dernière fois que j’ai essayé XeTeX sur Mac, c’était même Unicode et gestion complète d’OpenType).