POULE No.1 : NERO AAC-LC
Depuis plus d’un an, Nero propose à l’utilisateur deux encodeurs AAC différents. Le second encodeur se dissimule sous le mode nommé “rapide” ou “fast” qui, chacun peut le constater, n’est pas plus rapide que le mode nommé “haut” ou “high”. Cet encodeur “fast” est en fait un nouvel encodeur, plus performant, et amené à se substituer à terme au codec actuellement proposé par défaut. S’il ne l’est pas encore, c’est simplement parce qu’il n’est pas jugé suffisamment mature pour affronter l’ensemble des difficultés de codage.
J’avais déjà testé ce mode « fast » à ~130 kbps, et j’avais noté qu’il surclassait largement (et même très largement) l’encodeur « high » sur de la musique classique. Ces résultats enthousiasmants sont cependant trop limités, et ne permettent ainsi en rien de préjuger des performances de ce codec prometteur à débit inférieur ; par ailleurs, je ne sais rien de ses performances sur d’autres genres musicaux que le classique, seul testé jusqu’alors. Le premier objectif de cette poule sera donc d’établir lequel des deux encodeurs (fast ou high) présente le meilleur compromis. Le second objectif sera d’opposer le mode CBR au mode VBR. Pour ce dernier, seul l’encodeur “high” sera testé, puisque le débit obtenu avec l’encodeur “fast” dépasse largement la limite fixée (67 kbps à peine pour “fast” et 87 kbps pour “high”.
En résumé :
• Nero AAC Codec 3.2.0.15 “fast” CBR 80
• Nero AAC Codec 3.2.0.15 “high” CBR 80
• Nero AAC Codec 3.2.0.15 “high” VBR ::radio:: [87 kbps sur 185 échantillons]
(le tableau analytique des résultats peut être vu >ici<)
Les résultats sont assez contrastés. Pour ce qui concerne le premier groupe (classique), l’encodeur ‘fast’ surclasse aisément son cousin ‘high’, que ce soit en CBR ou en VBR. J’obtiens donc à 80 kbps ce que j’avais constaté dans le passé à 128 kbps et au-delà. Par contre, avec le groupe No.2, ce même encodeur est légèrement en retrait par rapport au VBR ‘high’ (2.00 vs 2.20) encore que statistiquement, les deux doivent être considérés d’égal à égal. Le véritable perdant est CBR ‘high’, qui arrive dernier dans les deux groupes. Le choix le plus pertinent est indubitablement CBR ‘fast’, qui obtient score d’ensemble (2.38) nettement plus probant que le VBR ‘high’ (1.98), supériorité obtenue avec une marge d’erreur inférieure à 5%.
C’est donc l’encodeur ‘fast’ en mode CBR qui affrontera sous les couleurs de Nero ses rivaux AAC-LC.
POULE No.2 : AAC-LC (Nero, iTunes, faac)
iTunes n’offre qu’un mode CBR pour l’heure, qui rejoint la poule sans avoir à effectuer de
pré-test.
faac par contre présente un mode ABR en plus du mode VBR. J’avais entamé une poule pour départager les deux modes, mais l’écart fut tellement prononcé (le mode ABR est handicapé par un lowpass nettement plus restrictif, mesuré après coup à 8000 Hz, contre 13000 pour le VBR) que j’ai jugé préférable d’y mettre un terme prématuré. Le mode VBR de faac rejoint donc cette poule. –q80 offrant un débit largement supérieur à celui visé, j’ai opté pour –q70, chiffre rond, qui présente malgré tout un débit moyen supérieur à ce qui est toléré pour le second groupe (94 kbps), mais au vu des résultats finaux, cette surcharge ne prêtera pas à conséquence.
L’encodage Nero correspond au mode “fast” CBR (voir POULE No.1 pour les détails).
Figurent dans cette poule :
• faac 1.24.1 –q70 [84 kbps sur 185 échantillons]
• iTunes v4.9.0.17 / QuickTime 7.0.2 CBR 80
• Nero AAC Codec 3.2.0.15 “fast” CBR 80
(le tableau analytique des résultats peut être vu >ici<)
• faac est très largement inférieur à ses rivaux directs, et ce malgré un débit sensiblement supérieur pour les échantillons du deuxième groupe. Cet écart est moins la conséquence d’un lowpass en défaveur de faac (13 KHz, contre 14 pour Nero et 15 environ pour iTunes) que celle de déformations trop fréquentes et trop marquées. Parmi elles, je signale qu'il m'a été donné d'entendre à de nombreuses reprises un problème de grondement dans les basses fréquences (warbling) dont souffre faac jusque dans les très haut débit. On pardonnera à cet encodeur gratuit et développé bénévolement cette contre-performance en gardant à l’esprit qu’il a surtout été optimisé pour des débits supérieurs à 100 kbps. Il est plus intéressant de noter par le biais de ses deux rivaux les progrès accomplis autour de l’AAC-LC à bas débit, et qui révèlent un potentiel que les implémentations plus anciennes ou moins avancées du format, telle faac, occultaient entièrement.
• iTunes obtient des résultats constants d’un groupe à l’autre. A l’évidence, l’encodeur est équilibré et offre des performances similaires quel que soit le type (de manière générale en tous cas) de musique encodé. On signalera un lowpass moins agressif que celui de Nero (15 KHz vs 14 KHz), caractéristique souvent audible et favorisant iTunes AAC en certaines circonstances. C’est surtout avec de la musique variée que l’encodeur iTunes/QuickTime se distingue de son concurrent.
• Nero AAC n’offre pas la même homogénéité que son rival direct, puisqu’on assiste à un affaissement des performances d’un groupe à l’autre. Ce résultat n’est pas surprenant, dans la mesure où cette disparité entre musique classique et musique autre avait été constatée lors de la poule de qualification Nero (Poule No.1). Mais la différence n’est pas dramatique non plus : l’avantage qualitatif tangue trop souvent d’un codec à l’autre, ce qui explique pourquoi la supériorité d’iTunes n’est assuré qu’avec 50% de probabilité seulement.
=> au final, iTunes et Nero sont au coude à coude (statistiquement, ils ne sont pas départageable avec une certitude de 95%), avec cependant un avantage quantitatif (la moyenne des notes) pour iTunes AAC, obtenu sur le second groupe d’échantillons. C’est donc cette implémentation de l’AAC-LC qui est qualifiée pour la finale.
POULE No.3 : AAC-HE
Pour ce test, j’ai du me contenter d’une seule implémentation éditoriale du format (Nero), déclinée en deux encodeurs (“fast” et “high”. D’autres sont apparues depuis (Real par exemple) ou sont en cours de portage pour Windows (Apple QuickTime). Comme je ne disposais d’aucune autre version pas plus d’une connexion internet pour télécharger des versions rivales, j’ai du faire avec Nero. Est-ce dommageable ? La version AAC-HE de Nero est considérée (à raison ?) comme la meilleure ; une chose est certaine : elle est la plus ancienne (2 ans), puisque sortie juste après la finalisation du format – et, logiquement, la plus travaillée.
Pour ceux qui s’interrogent sur la différence entre AAC-LC et AAC-HE, une rapide explication. L’AAC est un format audio qui se décline en plusieurs profils d’encodage (LC, HE, Main, LTP… dont le plus courant est le Low Complexity et le plus prometteur l’High Efficiency. L’HE-AAC se distingue essentiellement du LC-AAC par l’introduction d’une couche nommée SBR (Spectral Band Replication) qui permet de coder de manière séparée les plus hautes fréquences avec très peu de bits (mais beaucoup d’approximations !). En conséquence, un encodage HE-AAC nécessite un décodeur adéquat pour être pleinement décodé ; par contre, ce même encodage est compatible avec les décodeurs AAC usuels, mais seule la partie « inférieure » du spectre sera restituée. Cette situation présente des similtudes avec celle déjà ancienne du rapport entre MP3 et MP3Pro. Et c’est normal, puisque le MP3Pro n’est autre chose que du MP3 + SBR, de la même manière que l’HE-AAC n’est rien de plus que de l’AAC + SBR.
Le SBR est une technologie puissante qui assure au format qui lui est associé un bond qualitatif spectaculaire à bas débit. Par contre, à mesure que le débit s’élève (et que la qualité des formats ‘nature’ s’améliore), le SBR devient inutile sinon nuisible. Nero par exemple ne permet pas pour cette raison d’utiliser le SBR au-delà de 96 kbps (techniquement, l’HE-AAC est envisageable jusqu’à 448 kbps en stéréo) – et encore est-ce le LC-AAC qui est proposé par défaut à ce débit. A 80 kbps par contre, Nero ‘suggère’ à l’utilisateur de privilégier l’AAC-HE sur l’AAC-LC.
L’AAC-HE s’utilise en CBR comme en VBR. Nero cependant n’offre pas de mode VBR permettant d’atteindre un tel débit (j’obtiens respectivement 61 et 64 kbps au maximum avec les modes ‘fast’ et ‘high’. Opposer des encodages VBR à 60 kbps à des encodages CBR à 80 kbps n’ayant que peu de sens, j’ai limité l’opposition aux deux encodeurs CBR embarqués dans la suite de gravure de l’éditeur allemand :
• Nero AAC Codec 3.2.0.15 “fast” CBR 80
• Nero AAC Codec 3.2.0.15 “high” CBR 80
(le tableau analytique des résultats peut être vu >ici<)
L’analyse des tests n’apporte guère de commentaires. Sur les échantillons du premier groupe, les deux encodeurs offrent des performances similaires. Contrairement au LC qui avait vu l’encodeur nommé “fast” surclasser son aîné sur la musique classique, le profil HE ne bénéficie pas des mêmes avantages. Par contre, on retrouve la même infériorité de l’encodeur “fast” sur les échantillons du groupe 2. On remarquera enfin les notes extrêmement basses obtenues dans cette poule. L’HE-AAC présente en effet des artefacts terriblement gênants à mes oreilles, et ce, quelle que soit la nature des échantillons testés.
POULE No.4 : Ogg Vorbis
Vorbis ne présente pas la même abondance d’encodeurs que l’AAC. Dans le cadre de ce test, c’est un avantage certain pour le testeur . Deux encodeurs peuvent être mis en compétition : la version officielle et la version d’Aoyumi (nommée aoTuV). Quelques mots sur cette dernière. aoTuV représente une branche de développement indépendante qui a pour racine la version officielle de Vorbis. Elle est apparue il y a 18 mois environ, et s’attelle à corriger nombre de problèmes posés par la version de référence de l’encodeur. Les modifications d’Aoyumi ont été jugées suffisamment pertinentes par XIPH (originaire du format) pour que le code de la beta 2 d’aoTuV soit repris et officialisé (il y a un an) afin de devenir la version 1.1 de l’encodeur de référence. Plus qu’une simple branche expérimentale, aoTuV peut ainsi être considéré comme la grande sinon l’unique source de progrès de l’ogg vorbis. Depuis, deux autres beta d’aoTuV ont vu le jour – et c’est la beta 4 qui sera opposé ici à l’encodeur de référence (1.1.1, qui ne présente d’améliorations que fonctionnelles et non qualitatives par rapport à la 1.1). Cette poule permettra ainsi d’évaluer les apports de cette nouvelle version d’aoTuV.
J’ai profité du peu de compétition offert par Vorbis pour y inclure des encodages ABR. Vorbis est un encodeur orienté VBR qui pendant longtemps ne disposait pas de mode CBR/ABR. Ces fonctionnalités ont été introduites ultérieurement (elles ont d’ailleurs été souvent bugguées… pour répondre à des besoins précis (streaming par exemple), mais restent aujourd’hui encore déconseillées pour un usage régulier. Je profite de cette poule pour y ajouter des encodages ABR (testé ici avec l’encodeur officiel, qui est à en croire le changelog le plus avancé en terme de ‘bitrate management’.
Quelques mots à propos du débit pour finir. Le mode VBR qui permet d’obtenir 80 kbps avec vorbis correspond à –q1. Le débit final obtenu sur l’encodage des 185 échantillons est de 78 kbps avec l’encodeur 1.1.1, et de 85 kbps avec aoTuV. Cet écart représente 10%, et s’il reste méthodologiquement acceptable de les opposer, il serait cependant inepte de le faire dans la mesure où vorbis permet d’ajuster le débit beaucoup plus finement. J’ai donc décidé de conserver pour aoTuV le paramétrage de –q1 et d’ajuster celui de 1.1.1 en conséquence : -q1.5 (chiffre rond), offrant un débit de 84 kbps. Pour l’ABR, j’ai opté pour un débit cible de 83 kbps, offrant un débit final calculé à 84 kbps.
En résumé, sont testés :
• vorbis 1.1.1 –q 1,5
• vorbis 1.1.1 ABR 83 (obtenu avec le logiciel – remarquable ! - OggDropXPd de John33)
• vorbis aoTuV beta 4 –q 1,00
(le tableau analytique des résultats peut être vu >ici<)
• ABR 83 : sans grande surprise, l’ABR est en retrait par rapport au VBR. Les résultats sont néanmoins loin d’être catastrophiques. Avec la musique classique, l’ABR offre même des performances comparables au VBR, à l’exception toutefois d’échantillons nécessitant un très fort débit (groupe ARTIFICIAL). En quelques rares cas, l’ABR est d’ailleurs préférable au VBR (certains échantillons ultra-tonaux notamment). Il faut cependant garder à l’esprit que les échantillons du groupe 1 sont codés à 84 kbps en ABR et 78 en VBR, et que ce dernier présente donc un surcroît d’efficience que la notation ne reflète pas entièrement. En revanche, la différence est sensiblement plus prononcée avec les extraits du groupe 2, pour lesquels le VBR est nettement préférable, et ce à débit moyen identique. Au final, et à l’exception de quelques échantillons, l’ABR ne présente pour défaut rien d’autre qu’un léger accroissement du bruit de fond, parfois perceptible sous la forme d’une poussée des hautes fréquences ou d’une grossièreté de rendu des timbres.
• Entre les encodages VBR obtenus avec la version officielle et la version aoTuV, la différence est ténue avec les échantillons du groupe 1. J’avoue ma déception, car cette beta 4 présente des modifications qui auraient dû permettre une réduction sensible des défauts du format surtout mis en évidence, à ce débit, avec des échantillons classiques (montée du bruit liée au codage avec perte de la stéréo spécifique à Vorbis). On remarquera tout de même que ce mince écart synthétise des résultats qui analytiquement sont plus contrastés : on assiste avec aoTuV à une chute qualitative sur certains échantillons comme à un bond réel.
L’analyse des résultats du groupe 2 présente plus de lisibilité. Sur de la musique variée, le VBR se détache de l’ABR, et la version aoTuV décolle littéralement pour atteindre le meilleur score toutes poules confondues ! A l’évidence, les modifications apportées par Aoyumi profiteront prioritairement à ceux qui écoutent autre chose que Brahms. En de très nombreuses occasions, il m’a été donné l’occasion de constater une forte réduction de cette poussée du bruit de fond qui caractérise Vorbis.
=> la version aoTuV rejoint ses concurrents pour la finale.
POULE No.5 : WMA 9.1 Standard
Dernière poule de ce comparatif avant la finale, et qui concerne le deuxième format le plus présent dans les appareils actuellement sur le marché : le WMA. Le format utilisé ici correspond au WMA ‘classique’ ou ‘standard’, qui doit être différencié du format baptisé WMA Professional, incompatibles entre eux. Le WMA Pro ne figure pas dans ce test, puisqu’il n’est pas possible d’obtenir un débit de 80 kbps avec la version 9.1 du format (le débit plancher du CBR est 128 kbps, et celui obtenu en VBR est de 69 kbps en mode Q10 et 110 kbps en mode Q25).
Depuis la sortie de la « série 9 » de Windows Media, le format s’est enrichi de fonctionnalités intéressantes : encodages VBR, ou encore encodages sur deux passes. L’encodage double passe ne devrait pas être utilisé sur des courts échantillons (de la même manière qu’on ne peut tester les formats vidéos en double passe sur de courts extraits : la distribution doit être effectuée sur une plage de temps plus grande). Deux modes restent ainsi en lice : CBR et VBR. Le mode VBR Q25 semble correspondre au débit ciblé : 81 kbps en moyenne (76 kbps sur les 150 échantillons du groupe 1 et 88 kbps pour celui du groupe 2). Sont donc testés :
• Windows Media Audio 9.1 CBR 80
• Windows Media Audio 9.1 VBR Q25
(le tableau analytique des résultats peut être vu >ici<)
• WMA CBR : très nette recul qualitatif constaté pour les échantillons du second groupe. De toute évidence, le format, en CBR et à ce débit, éprouve moins de difficulté avec la musique classique. Relativement aux encodages VBR, ceux réalisés à débits constants sont inférieurs, et ce quelque soit le groupe choisi. Dès lors, il semble préférable d’utiliser à ce débit et pour ce format VBR Q25.
• WMA VBR : progrès par rapport au CBR, surtout d’ailleurs avec les échantillons du second groupe, pour lesquels les notes sont les plus contrastées. Microsoft a donc réussi à faire progresser son encodeur grâce à l’implémentation d’un mode à débit binaire variable dans l’ensemble efficace.
=> le mode VBR Q25 est qualifié pour la finale.
Message édité par gURuBoOleZZ le 29-12-2005 à 23:28:55