L'encodage avec MEncoderCréer un rip MPEG-4 ("DivX") de haute qualité à partir d'un DVD
Une question fréquemment posée est "Comment faire le meilleur rip DVD possible ?
Une autre question est "Comment dois-je faire pour avoir un rip de la meilleure
qualité possible ?" Peu importe la taille du fichier, je veux simplement la
meilleure qualité."
Cette question est peut être un peu mal posée. Après tout, si vous ne vous
souciez pas de la taille du fichier, pourquoi ne pas simplement copier le
flux MPEG-2 du DVD entier ? Bien sûr, votre AVI finira par faire 5Go, mais
si vous voulez la meilleure qualité et ne vous souciez pas de la taille,
ceci est probablement votre meilleure option.
En fait, la raison pour laquelle vous voulez convertir un DVD en MPEG-4
est que vous tenez réellement compte
de la taille du fichier.
Il est difficile de proposer une recette sur la façon de créer des rips DVD
de très haute qualité. Il y a de nombreux facteurs à prendre en compte, et vous
devriez comprendre ces détails, ou vous serez déçus par les résultats. Ci-dessous
nous allons examiner quelques-uns de ces problèmes, et voir un exemple. Nous
supposerons que vous utilisez libavcodec pour encoder
la vidéo, bien que cet exemple théorique s'applique également à d'autres codecs.
Si cela vous semble un peu trop pour vous, vous devriez utiliser une des
interfaces graphiques listées dans Section
MEncoder sur la page de notre projet.
Avec ceci, vous serez suffisamment armé pour produire des rips de bonne qualité sans
trop réfléchir car ces outils utilisent des réglages astucieux à votre place.
Préparation à l'encodage : identification des sources, du matériel et du framerate
Avant même de penser à encoder un film, il est nécessaire de passer par quelques étapes
préliminaires.
La première et plus importante étape avant l'encodage sera la détermination du
type de contenu utilisé. Si la source physique provient d'un DVD ou bien d'un
média de diffusion comme la télé par câble ou le satellite, elle sera stockée
sous deux formats : NTSC pour l'Amérique du nord et le Japon, et PAL pour
l'Europe et les autres pays...
C'est important de la prendre en compte ce paramètre: ceci est juste le format
de présentation à la télévision, ce n'est en aucun
cas le format original du film.
L'expérience montre que le NTSC est bien plus dur à encoder car il y a plus
d'élément d'identification dans la source.
Afin de produire l'encodage désiré, vous devez connaître le format original.
Négliger cette étape aura pour conséquence des résultats hasardeux, des artefacts
bizarroïdes, des trames en double ou ignorées.
En plus d'avoir des résultats bizarres, le rendu global risque d'en souffrir avec une
qualité médiocre par unité du bitrate.
Identification du framerate de la source
Voici une liste de types de sources matérielles, il est possible que vous
trouviez la vôtre avec ces propriétés :
Film standard: produit pour une diffusion
cinématographique avec 24 images par secondes (fps).
Vidéo PAL: Enregistré par une caméra à 50 trames
par secondes. Une trame est, par exemple, l'ensemble des lignes paires ou des lignes impaires d'une image.
La télévision a été créée pour afficher l'image de cette manière (en fait une version bas de gamme
de compression analogique).
L'oeil humain est censé compenser cette alternance de trames mais dès lors que vous
comprenez ce fonctionnement, vous ne regarderez plus la télévision de la même façon.
Deux trames ne font pas une image complète, car elles
sont capturées avec un décalage de 1/50e de seconde, et donc, elles ne s'alignent pas
parfaitement sauf s'il y a du mouvement
Vidéo NTSC : Enregistré par une caméra à
60000/1001 trames par secondes, ou 60 trames par secondes dans l'ère noir/blanc.
A part cela, c'est similaire au PAL.
Animation: Habituellement dessiné pour du 24fps,
mais on peut en trouver de toute sorte.
Animation Graphique, Effets Spéciaux: il est
possible d'en trouver avec n'importe quel framerate, mais en général, le NTSC utilise 24fps et 30fps, le PAL utilise plutôt
25fps.
Vieux films: le framerate est généralement plus
bas.
Identification de la source matérielle
(?)Les films composés de trames sont dits 'progressive',
alors que ceux composés de champs indépendant sont appelés
soit entrelacés soit vidéo - ce dernier terme est plutôt ambigu.
Pour compliquer le tout, certains films utilisent un mélange de plusieurs des
techniques vues ci-dessus.
La distinction la plus importante qui doit être faire entre ces formats
est que certains utilisent les trames alors que d'autres, les champs.
Même si un film a été préparé pour être projeté
sur une télévision (DVDs inclus), il est converti dans un format basé sur des champs.
Les nombreuses méthodes peuvent être rassemblées sous le terme de redimensionnement comme
l'infâme NTSC "3:2 telecine" qui en est une variété.
Sauf si l'oeuvre originale est basée sur des champs (et avec le même fieldrate),
le format d'image obtenu sera différent de celui d'origine.
Plusieurs variétés communes de redimensionnement :Redimensionnement PAL 2:2 : Le meilleur de tous.
Chaque image est affichée pendant la durée de deux trames, par extraction des lignes
paires et impaires, puis en les affichant par alternance.
Si l'original est à 24 images par secondes, ce redimensionnement augmentera la vitesse
du film de 4%.
Redimensionnement PAL 2:2:2:2:2:2:2:2:2:2:2:3:
La douzième image est affichée pendant la durée de 3 frames au lieu de deux. Cela
permet d'éviter le problème de l'accélération de 4% mais rend le processus trés
difficile à inverser.
Cette technique est généralement utilisée dans les productions musicales où
l'accélération de 4% endommagerait sérieusement la qualité musicale.
Télécine NTSC 3:2: Les images sont alternativement
affichées pendant une durée de 3 ou 2 frames. Cela provoque un redimensionnement de 2,5 fois le
ratio original. Le résultat est très légèrement ralenti de 60 frames par secondes à 60000/1001
frames par seconde pour maintenir le fieldrate NTSC
Redimensionnement NTSC 2:2: Utilisé pour le NTSC avec une
source en 30fps. Le rendu est correct, similaire au redimensionnement PAL 2:2
Il y aussi d'autres manières de convertir des vidéos NTSC et PAL
mais ce sujet s'éloigne des limites de ce guide.
Si vous désirez encoder un film par exemple, le mieux reste de trouver
une copie de l'original.
La conversion entre ces deux formats est hautement destructrice et il n'est
pas possible de l'inverser proprement, donc l'encodage sera d'autant plus
mauvais s'il est fait à partir d'une source déjà convertie.
Quand des vidéos sont stockées sur un DVD, des groupes de trames
consécutives sont rassemblées en une image, même si elles ne sont pas censées
être affichées au même moment.
Le standard MPEG-2 utilisé dans les DVDs et la télévision numérique fournit
un moyen d'encoder les images originales progressivement et de stocker le
nombre de trames pour chaque image qui devra être affiché avant cette
image.
Si cette méthode est utilisée, on dit que le film est "soft-telecined"
("contenu progressif"), car le processus de rendu est
appliqué directement par le lecteur DVD et non pas en dégradant le film.
Ce cas est de loin le mieux car il peut être tout aussi bien inversé
(en fait, non pris en compte) par l'encodeur puisqu'il préserve la qualité maximale.
Malgré cela, beaucoup de DVD et d'émissions studios diffusées n'utilisent pas
des techniques d'encodage propres mais plutôt des films "hard telecine" ("contenu brut")
dans lesquels les trames sont dupliquées puis encodées en MPEG-2.
Les étapes pour gérer correctement ce genre de cas seront évoquées plus tard dans ce guide.
Pour l'instant, nous allons vous donner quelques indices pour définir à quelle
source vous avez à faire :
Domaine du NTSC:
Si MPlayer affiche que le nombre d'image a changer pour
24000/1001 quand vous regardez votre film, et qu'il ne change plus du tout, il est
quasiment certain que c'est un contenu progressif qui a été "soft teleciné".
Si MPlayer affiche un nombre d'images alternant
entre 24000/1001 et 30000/1001 et que les bords de l'image affichent des espèces de "peignes", alors
il y a plusieurs possibilités.
Les segments à 24000/1001 fps ont très certainement un contenu progressif,
"soft teleciné" mais les parties 30000/1001 fps ont pu être "hard-telecinées"
depuis un contenu 24000/1001 fps ou 60000/1001 frames par secondes d'une vidéo NTSC.
Utilisez les mêmes conseils que ceux pour les deux cas qui suivent.
Si MPlayer montre un nombre d'images constant et que chacune
des images avec des mouvements semble avoir un "peigne" sur les cotés, alors votre film
est une vidéo NTSC à 60000/1001 images par seconde.
Si MPlayer montre un nombre d'images constant et que deux
images sur cinq apparaissent avec des "peignes", le film est "hard teleciné" avec un contenu
à 24000/1001fps.
Domaine du PAL:
Si vous ne voyez pas de "peigne" sur les cotés, le film a un redimensionnement 2:2.
Si vous voyez une alternance régulière d'effet "peigne", de pseudo-entrelacement
toutes les demi-secondes, alors le film a subi une réduction 2:2:2:2:2:2:2:2:2:2:2:3.
Si vous voyez une sorte d'entrelacement constant dans les scènes en mouvement,
le film est en PAL avec 50 trames par secondes.
Astuce:MPlayer peut lire un film très lentement en utilisant
l'option -speed ou en le jouant image par image.
Essayer d'utiliser l'option à 0.2 afin de regarder le film
très doucement ou presser la touche "." pour avancer d'une frame
à l'autre et ainsi identifier la "signature" d'un type de redimensionnement si
celui-ci n'est pas visible à vitesse normale.
Quantiseur constant contre deux passes
Il est possible d'encoder votre film suivant une large gamme de qualités.
Les compresseurs vidéos modernes et quelques pre-codec de compression
(antibruit et redimensionnement) permettent d'obtenir un
trés bon rendu pour un film grand écran de 90-110 minutes sur 700Mo.
De plus, la plupart des films longs peuvent approcher un résultat parfait
avec un fichier d'un taille de 1400Mo.
Il y a trois approches possibles pour encoder une vidéo: débit constant
(CBR), quantification constante, et deux passes (ABR, ou débit moyen).
La complexité des images d'un film et le nombre de bits utilisés pour
cette compression fera varier grandement le résultat d'une scène à l'autre.
Les encodeurs vidéos modernes savent s'ajuster en fonction des besoins par
variation du débit vidéo (bitrate).
Cependant, dans un mode simple comme le CBR, le compresseur ne connaît pas
le besoin en débit vidéo pour les scènes à venir, donc il ne sait pas définir
un bitrate moyen sur la longueur du film.
Les modes avancés actuels, comme le mode 'multi-passes' (plusieurs passages), prennent
en compte les statistiques des passes précédentes pour l'encodage, fixant le
problème ci-dessus.
Note:
La plupart des codecs qui supportent la compression ABR supportent seulement deux
passages alors que d'autres comme le x264,
le XviD et libavcodec supportent des
passes multiples qui permettent d'affiner à chaque fois les statistiques (ces améliorations seront cependant négligeables
après la quatrième passe).
Dans cette section, deux passages ou plus peuvent être utilisés indifféremment.
Dans chacun de ces modes, libavcodec
sépare les trames vidéos en macroblocs de 16x16 pixels et applique ensuite
un quantificateur sur chaque macrobloc. Plus le quantificateur est bas, plus
la qualité est bonne et le débit est gros. La méthode utilisée par
libavcodec pour déterminer quel
quantificateur utiliser varie et est configurable (ceci est une simplification
à l'extrême du processus, mais il est utile de comprendre le principe de base).
Lorsque vous spécifiez un débit constant, le compresseur vidéo codera la vidéo
en laissant de côté les détails, et ceci, d'autant plus
que le bitrate sera petit. Si la taille du fichier vous importe peu,
vous pouvez fixer un débit contant et infini. (En pratique, cette
valeur aura une limite haute dans les 10000Kbit). Sans réelle
restriction de débit,
libavcodec utilisera le plus
bas quantificateur possible pour chaque macrobloc (tel que spécifié par
, qui vaut 2 par défaut).
Si vous spécifiez un débit si petit que
libavcodec doit utiliser un quantificateur plus haut,
alors vous êtes certainement en train de massacrer la qualité de votre
vidéo. En général, vous devriez éviter le CBR si vous vous souciez de
la qualité.
Avec un quantificateur constant libavcodec utilise
le même quantificateur, spécifié par l'option , sur chaque macrobloc.
Si vous voulez un rip de la meilleure qualité possible, cette fois encore en ignorant
le débit, vous pouvez utiliser . Cela donnera le même débit
et le même PSNR (Peak Signal-to-Noise Ratio, rapport signal sur bruit de crête)
que le CBR avec =infini et la valeur de par
défaut (2).
Le problème de la quantification constante est, qu'elle utilise le quantificateur
demandé même si le macrobloc n'en a pas besoin. En fait, il doit être possible
d'utiliser un quantificateur plus haut sur un macrobloc sans sacrifier de la
qualité visuelle. Pourquoi gaspiller des bits avec un quantificateur inutilement
bas ? Votre microprocesseur a assez de ressources car il a le temps, mais votre
disque lui a une taille fixée.
Avec l'encodage deux passes, la première passe va ripper le film comme
en CBR, mais va garder un journal des propriétés de chaque trame. Ces données
sont ensuite utilisées pendant la seconde passe de façon à choisir intelligemment
quels quantificateurs utiliser. Lors des scènes d'action rapide ou celles ayant
beaucoup de détails, des quantificateurs plus élevés seront utilisés. Pendant les
scènes avec peu de mouvements ou avec peu de détails, ce sera des quantificateurs
plus bas.
Si vous utilisez , alors vous gaspillerez des bits.
Si vous utilisez , vous n'aurez pas la meilleure
qualité de rip. Supposez que vous ripiez un DVD avec ,
et que le résultat soit 1800Kbit. Si vous faites un encodage en deux passes avec
, la vidéo produite aura une
meilleure qualité pour le même débit.
Maintenant que vous êtes convaincu que l'encodage deux passes est la bonne méthode,
la vraie question est maintenant de savoir quel débit utiliser. Il n'y a pas de réponse
toute faite. Idéalement, vous devriez choisir un débit offrant un compromis entre
qualité et taille de fichier. Cette valeur varie selon la source vidéo.
Si la taille ne compte pas, un bon point de départ pour un rip de très haute
qualité est environ 2000kbps, plus ou moins 200kbps.
Pour les vidéos comportant beaucoup d'actions ou de détails, et/ou si vous avez
de très bon yeux, vous pouvez choisir 2400 ou 2600.
Pour certains DVDs, vous pourrez ne pas voir de différence à 1400kbps. C'est une bonne
idée que d'essayer sur des scènes avec différents débits pour se rendre compte.
Si vous avez fixé une taille limite, alors il faudra se livrer à un petit calcul
pour obtenir le débit souhaité. Mais avant cela, il faudra définir l'espace que
vous réserverez aux piste(s) audio et vous devrez
les ripper en premier.
Vous pourrez alors calculer le débit souhaité avec l'équation suivante :
Débit = (taille_fichier_final_en_Mo - taille_fichier_son_en_Mo) *
1024 * 1024 / durée_en_secondes * 8 / 1000
Par exemple, pour ramener deux heures de films sur un CD de 702Mo avec une piste
son de 60Mo, le débit vidéo sera alors de :
(702 - 60) * 1024 * 1024 / (120*60) * 8 / 1000 = 740kbpsContraintes pour une compression efficace
De par la nature intrinsèque de la compression MPEG, de nombreux
paramètres entrent en jeu afin d'obtenir une qualité maximale.
Le MPEG découpe la vidéo en carré de 16x16 appelé macroblocs. Chacun
d'entre eux est composé de 4 petits (8x8) blocs contenant des informations sur
la luminosité (intensité) ainsi que de 2 blocs (donc à résolution moitié)
contenant des informations chromatiques (pour les teintes rouge-cyan et bleu-jaune).
Même si la longueur et la largeur du film ne sont pas des multiples de 16,
l'encodeur utilisera des macroblocs de 16x16 pour couvrir l'image entière,
l'espace restant sera alors perdu.
Si votre intérêt est de conserver une très bonne qualité, utiliser des résolutions
non multiples de 16 n'est pas une bonne idée.
La plupart des DVDs ont aussi des bandes noires sur les bords. Négliger
ces parties peut altérer la qualité de plusieurs manières.
La compression MPEG est aussi dépendante du domaine de transformation des
fréquences, en particulier du "Discrete Cosine Transform (DCT)" (une espèce de
transformée de Fourier). Ce type d'encodage est efficace pour les
formes et les transitions douces, mais fonctionne moins bien avec les contours
acérés. Afin d'encoder correctement, il demandera plus de bits, sinon des
artefacts de compression apparaîtront, aussi connus sous le nom de "ringing".
La transformation en fréquence (DCT) prend place séparément dans chaque
macrobloc (en fait, dans chaque bloc), donc le problème n'apparaîtra
que si un bord franc se situe dans ce bloc. Si vos bordures noires commencent
exactement sur un multiple de 16, ce ne sera pas un problème. En pratique,
les bordures ne sont jamais bien alignées, et il sera certainement
nécessaire de les couper pour éviter ces défauts.
En plus des transformations au niveau des fréquences, la compression MPEG
utilise des vecteurs de mouvements représentant les changements d'une image
à la suivante. Ces vecteurs de mouvements voient leur utilité grandement
réduite quand la prochaine image à un contenu totalement différent. Quand
il y a un mouvement qui sort de la région encodée, cela ne pose pas de problème
aux vecteurs. En revanche, cela peut poser des problèmes avec les bandes noires:
Pour chaque macrobloc, la compression MPEG stocke un vecteur identifiant
quelle partie de l'image précédente devrait être copiée dans les macroblocs
de l'image suivante. Seules les différences devront alors être encodées.
Si le macrobloc s'étend et prend en compte une des bordures noire de l'image,
alors le vecteur de mouvement écrasera la bordure noire. Cela veut dire que de
nombreux bits sont gaspillés pour re-noircir la bande noire ou alors (plus probable) que le vecteur
de mouvement ne sera pas du tout utilisé et que tout le macrobloc
devra alors être ré-encodé. Dans tous les cas, l'efficacité de l'encodage en est
grandement améliorée.
Une fois encore, ce problème n'existe que si les lignes des bordures noires
ne sont pas un multiple de 16.
Enfin, supposons que l'on ait un macrobloc à l'intérieur d'une image et qu'un
objet se déplace dans ce bloc proche d'un bord de l'image. Malheureusement, le
MPEG ne sait pas faire "copier juste la partie qui dans l'image et laisser tomber
la partie noire". Donc la partie noire sera alors aussi copiée, ce qui fait encore gaspiller
beaucoup de bits pour compresser un morceau d'image qui n'est pas sensé être là.
Si l'objet en mouvement parcourt depuis le bord noir jusque dans la zone encodée,
le MPEG dispose d'optimisation spéciales pour copier en répétition des pixels
depuis le bord de l'image lorsque celui vient de l'extérieur de la partie encodée.
Ces optimisations deviennent inutiles quand le film à des bandes noires. Contrairement
aux problèmes 1 et 2, même les bordures noires multiples de 16 n'aident pas dans ce cas.
Malgré le fait que les bordures soient entièrement noires et quelles ne changent jamais,
il y a toujours un minimum de macroblocs impliqués.
Pour toutes ces raisons, il est préférable de couper entièrement ces bandes
noires. Dans la même optique, s'il y a une partie contenant du bruit ou de la
distorsion d'image près d'une bordure, la coupure l'enlèvera et permettra d'avoir
une amélioration significative de la qualité de l'encodage. Les puristes parmi les vidéophiles
souhaiteront préserver l'encodage le plus proche possible de
l'original, à moins qu'ils n'encodent avec un quantificateur constant, la qualité
gagnée après la suppression des bandes noires améliorera grandement la qualité
finale de l'encodage au regard des quelques informations perdues.
Découpage et Redimensionnement
Vous vous souvenez de la section précédente que les dimensions (à la fois largeur et hauteur)
de l'image finale doivent être des
multiples de 16. Cela peut être réalisé par recadrage (découpe),
redimensionnement ou une combinaison des deux.
Lors du recadrage, il y a quelques règles qui doivent être respectées pour éviter
d'endommager votre film.
Le format YUV normal, 4:2:0, stocke la chrominance (la couleur) de manière
sous-échantillonnée, c'est à dire que la chrominance est échantillonée moitié moins
souvent que la luminance (intensité). Sur le schéma suivant, L indique l'échantillonage en luminance et C en chrominance.
LLLLLLLLCCCCLLLLLLLLLLLLLLLLCCCCLLLLLLLL
Comme vous pouvez le voir, les lignes et colonnes de l'image viennent naturellement par deux.
Ainsi, les dimensions de votre recadrage ainsi que ses distances au bords d'origine
doivent être paires. Si elles ne
l'étaient pas, les chrominances et luminances ne seraient plus alignées.
En théorie, il est possible d'avoir des dimensions impaires, mais cela
requière un nouvel échantillonage de la chrominance, ce qui
engendre potentiellement des pertes d'information et n'est pas supporté par
le filtre de recadrage.
Ensuite, la vidéo entrelacée est échantillonée de la façon suivante:
Top fieldBottom fieldLLLLLLLLCCCCLLLLLLLLLLLLLLLLCCCCLLLLLLLLLLLLLLLLCCCCLLLLLLLLLLLLLLLLCCCCLLLLLLLL
Comme vous pouvez le voir, le plus petit motif à se répéter est sur 4 lignes.
Donc, pour la vidéo entrelacée, la hauteur de votre recadrage et sa distance
verticale aux bords doivent être des multiples de 4.
La résolution native pour un DVD NTSC est 720x480 et 720x576 pour un
PAL, mais il y a un indicateur d'aspect qui spécifie que le mode est
plein-écran (full-screen 4:3) ou bien écran large (wide-screen 16:9).
Un grand nombre de DVDs (pas tous) en wide-screen ne respecte pas
strictement le format 16:9, mais est plutôt en 1,85:1 ou 2,35:1 (cinémascope).
Ceci signifie qu'il y aura des bandes noires à enlever sur la vidéo.
MPlayer fournit un filtre de détection
qui détermine le rectangle de recadrage ().
Lancer l'application MPlayer avec l'option
et il affichera les options de recadrage pour enlever les bandes.
Vous devez laisser tourner le film suffisamment longtemps pour que toute la zone de l'image soit vue
de façon à obtenir des valeurs précises.
Ensuite, testez les valeurs obtenues avec MPlayer en utilisant
la ligne de commande fournie par ,
et éventuellement ajustez le rectangle de recadrage.
Ce filtre offre la possibilité de le positionner
de façon interactive pendant le film. N'oubliez pas de suivre les
recommandations précédentes sur la divisibilité des dimensions de l'image afin de ne pas
désaligner les plans de chrominance.
Dans certain cas, le redimensionnement n'est pas souhaitable. Il est délicat
dans le sens vertical avec des vidéos entrelacées, si vous désirez
conserver l'entrelacement, vous devrez vous abstenir de redimensionner.
Sans redimensionner, pour utiliser des dimensions multiples de 16,
il vous faudra recadrer plus petit que l'image. Ne pas recadrer plus grand que l'image
parce que car les bandes noires sont nuisibles à la compression.
Le MPEG-4 utilisant des macroblocs de 16x16, assurez-vous que les dimensions
de la vidéo que vous encodez sont des multiples de 16, sinon vous dégraderez la
qualité, surtout à de faibles débits. Pour ce faire, vous pouvez
arrondir les dimensions du rectangle de recadrage au multiple de 16 inférieur.
Comme expliqué plus haut, durant le recadrage, vous devrez augmenter le
décalage en Y de la moitié de la différence entre l'ancienne et la nouvelle
hauteur pour que l'image résultante se situe au milieu de l'ancienne. Et à cause
de la façon dont les vidéos DVD sont échantillonées, assurez-vous que ce décalage en Y
est un nombre pair. (En fait, c'est une règle: n'utilisez jamais une valeur impaire lors d'un recadrage ou
d'un redimensionnement de vidéo). Si vous ne vous faites pas à l'idée de vous débarrasser de quelques
pixels, vous préférerez sans doute redimensionner la vidéo. Nous allons voir cela
dans notre exemple ci-dessous.
En fait, vous pouvez laisser le filtre faire
tout cela pour vous: il a un paramètre optionnel d'arrondi qui vaut
16 par défaut.
Faites aussi attention aux pixels à "demi-noir" sur les bords. Assurez-vous qu'ils sont
en dehors de votre recadrage, autrement, vous gâcherez des bits qui seraient mieux utilisés ailleurs.
Après tout ceci, vous obtiendrez une vidéo qui n'est pas tout à fait au format
1,85:1 ou 2,35:1, mais quelque chose d'assez proche. Vous pourriez alors
calculer le nouveau format à la main mais MEncoder propose
une option appelée pour libavcodec
qui fera cela pour vous. N'agrandissez surtout pas cette vidéo pour
obtenir les dimensions standards à moins que vous n'aimiez gâcher votre espace disque.
Ce changement d'échelle se fait à la lecture, le lecteur utilisera les données
stockées dans le fichier AVI pour effectuer le bon rendu.
Malheureusement, tous les lecteurs vidéos n'appliquent pas ce redimensionnement
automatique, c'est peut-être pour cela que vous voudrez quand même procéder à ce redimensionnement.
Choix de la résolution et du débit
Si vous n'encodez pas dans un mode à quantificateur constant, vous
devez sélectionner un débit.
Le concept de débit (bitrate) est assez simple.
C'est un nombre (moyen) de bits par seconde qui sera utilisé pour stocker votre film.
Normalement, le débit est mesuré en kilobits (1000 bits) par seconde.
La taille de votre film sur le disque dur correspond au débit multiplié par sa
durée plus une petite quantité pour l'"en-tête" (surcoût, voir par exemple la section sur
les conteneurs AVI).
D'autres paramètres comme le redimensionnement, le recadrage, etc. ne modifieront
pas la taille du fichier sauf si vous y
changez aussi le débit.
Le débit n'est pas proportionnel
à la résolution. Ce qui veut dire qu'un fichier en 320x240 à 200kbit/sec
n'aura pas la même qualité que le même film en 640x480 à 800kbit/sec ! A cela, deux raisons:
Visuelle : Les artefacts de compression MPEG se
remarquent plus facilement à une plus grande échelle. Les artefacts apparaissent
à l'échelle des blocs (8x8). L'oeil humain ne voit pas les erreurs dans 4800 petits
blocs aussi facilement que qu'il les voit dans 1200 grands blocs (en supposant
une visualisation en plein écran dans les deux cas).
Théorique : quand vous réduisez la taille d'une image
mais que vous continuez à utiliser les mêmes tailles de bloc (8x8) pour la transformation
dans l'espace des fréquences, vous déplacez plus de données vers les hautes
fréquences. Grossièrement dit: chaque pixel contient plus de détails qu'avant.
Donc, même si votre image de taille réduite ne contient plus qu'un quart de l'information
dans le domaine spatial, elle peut toujours contenir une grande part de l'information dans
l'espace des fréquences (en supposant que les hautes fréquences étaient sous-utilisées dans
votre originale en 640x480).
Les anciens guides recommandaient de choisir un débit et une résolution basés
sur "1 bit par pixel", mais ce n'est que peu justifié avec les raisons évoquées ci-dessus.
Une meilleure estimation reste que le débit augmente proportionnellement à la
racine carrée de la résolution, donc une image 320x240 à 400kbit/sec
sera comparable à une en 640x480 à 800 kbit/sec.
Cela n'a pas été strictement vérifié par la théorie ou une quelconque méthode.
De plus, pour un film donné, le résultat variera en fonction du bruit, des détails,
du degré de mouvement, etc.. Il est futile de donner des recommandations générales
du style: un nombre de bits par longueur de diagonale (similaire au bit par pixel,
en utilisant la racine carrée).
Jusqu'à maintenant, nous avons discuté de la difficulté de choisir le débit et la résolution.
Calcul de la résolution
Les étapes qui suivent vous guideront dans le calcul de la résolution de votre
encodage sans trop distordre la vidéo, en prenant en compte les différents types
d'information sur la source vidéo.
En premier lieu, il faut calculer le format de l'encodage:
ARc = (Wc x (ARa / PRdvd )) / HcOù :
Wc et Hc sont la largeur et la hauteur de la vidéo recadrée,
ARa est le format affiché, généralement 4/3 ou 16/9,
PRdvd est le ratio des pixels du DVD qui normalement est égal à 1,25 (=720/576)
pour le PAL et 1,5(=720/480) pour le NTSC,
Ensuite, vous pouvez calculer la résolution X et Y en tenant compte du facteur
de Qualité de Compression (CQ):
ResY = INT(SQRT( 1000*Bitrate/25/ARc/CQ )/16) * 16
et
ResX = INT( ResY * ARc / 16) * 16
D'accord, mais c'est quoi ce CQ ?
le CQ représente le nombre de bit par pixel et par image encodée. Grosso modo,
plus le CQ est grand, moins il y aura de chances de voir apparaître des artefacts
de compression. En tout cas, si vous avez une limite de taille pour votre film
(1 ou 2 CDs par exemple), il y a donc une limite au nombre de bits total que vous
pouvez lui allouer et il est donc nécessaire de trouver le bon compromis entre
compressibilité et la qualité.
Le CQ dépend du débit, de l'efficacité du codec vidéo et de la résolution
du film.
Une manière d'augmenter le CQ, c'est de réduire la résolution du film puisque le
débit est calculé en fonction de la taille finale désirée et la longueur du film qui sont constant.
Avec les codecs ASP MPEG-4 comme le XviD ou le
libavcodec, un CQ en dessous de 0,18 donne
généralement une image type mosaïque car il n'y pas assez de bits pour coder
les informations de chaque macrobloc (le MPEG-4, comme les autres codecs, groupe
les pixels compressés par blocs pour compresser l'image, s'il n'y a pas assez
de bits, les bords de ce macrobloc deviennent alors visibles).
Donc il est raisonnable de prendre un CQ entre 0,20 et 0,22 pour une copie tenant
sur 1 CD, et entre 0,26 et 0,28 pour une copie sur 2 CDs avec des options d'encodage
standard.
Des options d'encodage plus avancées telles que celles listées ici pour le
libavcodec et le
XviD
devraient permettre d'obtenir la même qualité avec un CQ se situant entre
0,18 et 0,20 pour une copie sur 1 CD et 0,24 à 0,26 pour une copie sur 2 CDs.
Avec les codecs ASP MPEG-4 comme le x264,
vous pouvez utiliser un CQ se situant entre 0,14 et 0,16 avec des options standards
d'encodage, et même descendre entre 0,10 et 0,12 avec des
options avancées x264.
Veuillez noter que le CQ n'est qu'un indicateur, il dépend directement
du contenu encodé, un CQ de 0,18 pourrait sembler parfait pour un film de Bergman, mais
trop petit pour un film comme Matrix contenant beaucoup de scènes d'actions.
A l'opposé, il est inutile d'aller au delà de 0,30 pour le CQ, vous ne feriez que gâcher
de l'espace disque sans gain notable en qualité.
Notez aussi, comme cela a été dit plus haut que les vidéos en
plus petites résolutions auront besoin d'un plus grand CQ (comparé à la résolution
d'un DVD par exemple) pour un rendu correct.
Les filtres
Apprendre à utiliser les filtres vidéos de MEncoder
est essentiel pour créer des fichiers bien encodés.
Toutes les transformations vidéos sont exécutées au travers de filtres, comme le recadrage (découpe),
le redimensionnement, l'ajustement de couleur, la suppression du bruit, l'ajustement
de la netteté, le dés-entrelacement, le téléciné, le téléciné inverse, ou l'effacement
des macroblocs trop visible, pour n'en nommer que quelques un.
Avec le grand nombre de formats d'entrée supporté, la variété des
filtres disponibles dans MEncoder est l'un de ses principaux
avantages sur d'autres programmes similaires.
Les filtres sont chargés dans la chaîne grâce à l'option -vf :
-vf filtre1=options,filtre2=options,...
La plupart des filtres acceptent plusieurs options numériques séparées par des double-points (:), mais
la syntaxe varie d'un filtre à l'autre, aussi lisez la page manuel pour avoir les détails sur les filtres
que vous souhaitez utiliser.
Les filtres agissent sur la vidéo dans l'ordre de leur chargement. Par exemple,
la chaîne suivante :
-vf crop=688:464:12:4,scale=640:464
recadrera d'abord une zone de 688x464 depuis le bord haut gauche mais avec un
décalage de (12;4), puis redimensionnera la vidéo pour obtenir du 640x464.
Certains filtres ont besoin d'être chargés au début (ou proche du début) de la chaîne pour
profiter d'informations du décodeur vidéo qui seraient perdues ou invalidées par d'autres filtres.
Les principaux exemples sont (postprocessing, seulement
dans le cas d'un estompage des macroblocs ou des enlèvements des artefacts de
compression), le (un autre post processus pour enlever les
artefacts MPEG), le (téléciné inverse), et (conversion du soft téléciné en hard
telecine).
En général, il vaut mieux utiliser le moins de filtres possibles afin de conserver
l'encodage le plus proche possible du DVD source. Le recadrage est souvent
nécessaire (comme expliqué plus haut), mais évitez de redimensionner l'image.
Bien qu'il soit parfois préférable de réduire la taille de l'image plutôt que d'utiliser
un quantificateur plus élevé, nous voulons éviter tout ceci:souvenez-vous que
nous avons décidé au départ d'échanger des bits pour de la qualité.
Aussi, n'ajustez pas le gamma, le contraste, la luminosité, etc. Ces réglages
peuvent être bons chez vous mais pas sur un autre écran. Ils doivent être
appliqués lors de la lecture uniquement.
Une chose que vous pouvez vouloir faire est de passer la vidéo à travers un filtre trés léger
antibruit, comme par exemple .
Il s'agit encore une fois d'optimiser l'utilisation de l'espace disque:
pourquoi le gaspiller à encoder du bruit alors qu'il sera là de toutes façons à la lecture?
Augmenter les paramètres de améliorera encore la compressibilité, mais
si vous les augmentez trop, vous risquez de dégrader l'image. Les valeurs suggérées
ci-dessus () sont plutôt conservatrices, n'hésitez pas à
les augmenter et à regarder le résultat par vous-même.
Entrelacmeent et Téléciné
Presque tous les films sont tournés en 24 images par seconde. Puisque le NTSC est en 30000/1001 images par seconde,
certains traitements doivent être appliqués pour l'adapter au débit NTSC.
Ce procédé est appelé 3:2 pulldown, plus communément appelé téléciné (car
le pulldown est souvent appliqué durant la phase de conversion en téléciné),
et de façon simpliste, il fonctionne en ralentissant le film à 24000/1001 images par seconde,
et en répétant une image sur 4.
Aucun traitement spécifique n'est cependant appliqué à la vidéo des DVDs
PAL, qui fonctionnent à 25 images par seconde (techniquement, PAL peut être téléciné, ce qui est
appelé 2:2 pulldown, mais ceci n'est pas un problème en pratique). Le film
en 24 images par seconde est simplement lu en 25 images par seconde. Le résultat est que la vidéo tourne
légèrement plus vite, mais à moins d'être un extra-terrestre, vous ne verrez probablement pas la
différence. Le son de la plupart des DVDs PAL a été corrigé de façon à sonner correctement
quand il est lu à 25 images par seconde, même si la piste
audio (et donc le film entier) a une durée 4% plus courte que les DVDs NTSC.
Puisque la vidéo d'un DVD PAL n'a pas été modifiée, vous n'avez pas à vous soucier
de la cadence de défilement des images. La source est en 25 images par seconde, et votre copie sera en 25 images par seconde. Cependant,
si vous recopier un film d'un DVD NTSC, vous pourrez avoir besoin d'appliquer
du téléciné inverse.
Pour les films tournés en 24 images par seconde, la vidéo du DVD NTSC est soit en 30000/1001
téléciné, soit en 24000/1001 progressif et prévu pour être téléciné à la volée
par le lecteur DVD. D'un autre coté, les séries TV sont généralement
seulement entrelacées, pas télécinées. Ce n'est pas une règle absolue: certaines
séries TV sont entrelacées (comme 'Buffy contre les vampires') alors que d'autres
sont un mélange de progressif et d'entrelacé (comme 'Dark Angel', ou '24 heures
chrono').
Il est fortement recommandé de lire la section
Comment gérer le téléciné et le dés-entrelacement avec les DVDs NTSC
pour apprendre à gérer les différentes possibilités.
De toutes façons, si vous copiez principalement des films, vous rencontrerez de
la vidéo 24 images par seconde progressive ou télécinée, et dans ce cas vous pouvez
utiliser le filtre .
Encodage de vidéos entrelacées
Si la vidéo que vous désirez encoder est entrelacée (NTSC ou PAL), vous devez décider
si vous voulez la dés-entrelacer ou non.
Si le dés-entrelaçage rend votre film visionable sur des appareil à balayage progressif
tels que les écrans d'ordinateur ou les projecteurs, cela a un coup: le taux de 50 ou
60 000/1001 trames par secondes passera à 25 ou 30 000/1001 et en gros, la moitié de
l'information de votre film sera perdue pendant les scènes avec beaucoup de mouvement.
Ainsi, si votre encodage a pour but l'archivage de haute qualité, il est recommandé
de ne pas dés-entrelacer.
Le film pourra toujours être dés-entrelacé lors de sa lecture sur un appareil à
balayage progressif.
La puissance des ordinateurs actuels oblige les lecteurs à utiliser pour ce
faire des filtres de désentrelaçage qui offrent un rendu final imparfait.
Mais les lecteurs du futur seront capables de mimer l'affichage entrelacé des
téléviseurs.
Des précautions particulières doivent être prises lors d'un travail sur vidéo entrelacée:
La hauteur de recadrage et son décalage vertical doivent être des multiples de 4.
Tout redimensionnement vertical doit être effectué en mode entrelacé.
Les filtres de post-traitement et d'antibruit peuvent ne pas marcher comme
souhaité si vous ne prenez pas soin de ne travailler que sur une trame
à la fois et ils peuvent détériorerla video s'ils sont utilisés incorrectement.
En tenant compte de ces recommandations, voici notre premier exemple :
mencoder capture.avi -mc 0 -oac lavc -ovc lavc -lavcopts \
vcodec=mpeg2video:vbitrate=6000:ilme:ildct:acodec=mp2:abitrate=224
Notez l'usage des options et .
Remarques sur la synchronisation Audio/Vidéo
Le système de synchronisation audio/vidéo de MEncoder
a été créé dans le but de pouvoir lire et restaurer même des fichiers dont la synchronisation
est faussée ou été mal faite, ou des fichiers corrompus.
Cependant, dans certains cas, ils peuvent créer des duplications ou des sauts
d'image non désirés et peut-être une légère désynchronisation lorsqu'ils sont utilisés sur
des fichiers sources propres (bien sûr, les questions de synchronisation A/V ne se posent
que si vous encodez ou copiez la bande son en même temps que vous encodez la video, ce qui
est fortement encouragé).
Ainsi, vous devez peut-être passer à la synchronisation A/V basique
grâce à l'option .
Vous pouvez la mettre dans votre fichier de configuration
~/.mplayer/mencoder tant que vous ne travaillez
que sur des fichiers sources propres (DVD, capture Télé, encodage MPEG-4
de haute qualité, etc) et des fichiers ASF/RM/MOV non-détériorés.
Si vous désirez vous protéger encore plus contre les sauts et les duplication
étranges d'images, vous pouvez utiliser à la fois et
.
Cela empêche toute synchronisation A/V et copie les
images une à une.
Vous ne pouvez donc pas l'utiliser avec des filtres qui ajoutent ou enlèvent
des image de façon imprévisible ou si votre fichier source a un nombre d'images
par seconde variable!
L'option n'est donc généralement pas recommandée.
Il a été signalé que l'encodage audio nommé "3 passes" que MEncoder
supporte provoquait des désynchronisations A/V.
Cela arrive en tout cas quand il est utilisé en même temps que certains
filtres, donc, il est maintenant recommandé de ne pas
utiliser le mode audio "3 passes".
Cette possibilité n'est conservé que pour des raisons de compatibilité
et pour les utilisateurs experts qui savent quand l'utiliser.
Il a été signalé des désynchronisations A/V lors d'encodage à partir de
l'entrée standard
avec MEncoder. Ne faites pas ça ! Utilisez toujours
un fichier ou un CD/DVD/etc comme source.
Choisir le codec video
Le choix du meilleur codec video dépend de plusieurs facteurs comme
la taille, la qualité, la lecture en transit (streamability), la
facilité d'utilisation, la popularité qui, pour certains d'entre
eux dépendent de préférences personnelles et de contraintes techniques.
L'efficacité de la compression:
Il est assez évident que les codec des toutes dernières générations
sont faits pour augmenter la qualité et la compression.
Donc, les auteurs de ce guide et de nombreuses autres personnes
pensent que vous ne pouvez pas vous tromper
Attention tout de même: décoder une video MPEG-4 AVC de la
resolution d'un DVD nécessite une machine puissante (i.e. un
Pentium 4 à plus de 1.5Ghz ou un Pentium M à plus de 1Ghz).
si vous choisissez un codec MPEG-4 AVC comme le
x264 au lieu de codecs MPEG-4 ASP
tels que le libavcodec MPEG-4 ou le
XviD.
(Les développeurs de codec peuvent être intéressés par la leture de l'avis
de Michael Niedermayer's sur
"why MPEG4-ASP sucks".)
De la même manière, vous devriez obtenir une meilleure qualité en utilisant
un codec MPEG-4 ASP plutôt que MPEG-2.
Néanmoins, les nouveaux codecs qui sont en développement peuvent souffrir
de bugs qui n'ont pas encore été repérés et qui peuvent saboter un encodage.
Ce malheureusement parfois le prix à payer pour l'utilisation de
technologies de pointe.
De plus, commencer à utiliser un nouveau codec impose que vous passiez
du temps pour vous habituer à ses options de façon à ce que vous
sachiez quoi ajuster pour parvenir à la qualité désirée.
Compatibilité du matériel:
Cela prend habituellement beaucoup de temps pour que les lecteurs vidéos
de salon se mettent à supporter les derniers codecs vidéos.
Ainsi, la plupart ne supportent que le MPEG-1 (comme les VCD, XVCD et KVCD),
le MPEG-2 (comme les DVD, SVCD and KVCD) et le MPEG-4 ASP (comme les
DivX, LMP4 libavcodec et
XviD)
(attention: toutes les fonctionnalités MPEG-4 ASP ne sont généralement
pas supportées).
Référez-vous aux spécifications techniques de votre lecteur (si elles
existent), ou surfez sur le net pour plus d'infos.
La meilleure qualité par temps d'encodage:
Les codecs qui sont sortis depuis un certain temps (comme l'encodeur MPEG-4
de libavcodec et
XviD) sont habituellement
largement optimisés avec toutes sortes d'algorithmes astucieux et des
routines optimiées en assembleur SIMD.
C'est pourquoi ils tendent à fournir la meilleure qualité par temps
d'encodage.
Par contre, ils peuvent avoir des options très avancées qui, si elles
sont enclenchées, rendent l'encodage très lent pour des gains limités.
Si vous recherchez la vitesse, vous devriez conserver à peu près les
réglages par défaut du codec vidéo (bien que vous deviez quand même essayer
les autres options qui sont mentionnées dans d'autres sections de ce guide)
Vous pouvez aussi vouloir choisir un codec multi-threadé, bien que ce
ne soit utile que pour les utilisateurs de machines avec plusieurs
processeurs.
Le codec MPEG-4 de libavcodec
le permet mais les gains en temps sont limités et cela procure une
légère baisse de qualité d'image
L'encodage multi-threadé du codec
XviD, activé par l'option
, peut être utilisé pour améliorer la vitesse
d'encodage — de typiquement 40-60% — avec très peu voire aucune
détérioration de l'image.
Le codec x264 permet aussi
l'encodage multi-threadé ce qui l'accélère pour le moment de 15-30%
(selon les réglages) avec une baisse de PSNR d'environ 0.05dB.
Les préférences personnelles:
Là les choses deviennent presqu'irrationnel: pour la même raison pour
laquelle certains s'accrochaient encore à DivX 3 alors que d'autres
codecs plus modernes faisaient des merveilles depuis des années,
certaines personnes préfèrent XviD
ou le codec MPEG-4 de libavcodec
par rapport à x264.
Vous devriez vous faire votre propre optinion.
Ne croyez pas ceux qui ne jurent que par un seul codec.
Prenez quelques échantillons de sources brutes et comparez les
différentes options et codecs pour en trouver un qui vous convienne
le mieux.
Le meilleur codec est celui que vous maîtrisez et celui qui vous semble
le plus joli à vous yeux
Le même encodage peut apparaître différement sur le moniteur de
quelqu'un d'autre ou lorsqu'il est lu par un autre décodeur, donc armez
vos encodages pour le futur en les lisant sur différentes machines.
!
Référez-vous à la section
Sélection des codecs et du format du conteneur
pour avoir une liste des codecs supportés.
Le son
Le son est un problème bien plus simple à résoudre : si la qualité vous intéresse,
laissez le flux audio tel quel.
Même les flux AC3 5.1 utilisent au plus 448Kbit/s, et tous ces bits sont utiles.
Vous pourriez être tenté de convertir le son en Ogg Vorbis de haute qualité,
mais le fait que vous n'ayez pas d'entrée AC3 (dolby digital) sur votre chaîne HIFI
aujourd'hui ne signifie pas que vous n'en n'aurez pas demain.
Pensez au futur en conservant le flux AC3.
Vous pouvez le garder en le copiant directement dans le flux vidéo
pendant l'encodage. Vous pouvez aussi l'extraire
avec l'intention de l'inclure dans des conteneurs tels que NUT ou Matroska.
mplayer fichier_source.vob -aid 129 -dumpaudio
-dumpfile son.ac3
mettra dans le fichier son.ac3 la piste audio
129 du fichier fichier_source.vob (NB : les fichiers
VOB des DVD utilisent normalement un système de numérotation différent pour les pistes audio,
ainsi la piste numéro 129 est la deuxième piste du fichier).
Mais parfois vous n'aurez d'autres choix que de re-compresser le son afin de laisser
plus de place à la vidéo.
La plupart des gens optent alors pour le codec MP3 ou le Vorbis.
Bien que ce dernier soit très efficace, le MP3 est bien mieux accepté par les
lecteurs de salon même si cette tendance évolue.
N'utilisez pas l'option
si vous avez l'intention d'ajouter du son à votre encodage vidéo, même plus tard.
En effet, même s'il est probable que tout fonctionne correctement, l'utilisation de
l'option peut cacher certains problèmes dans la ligne de
commande de votre encodage. En d'autres mots, avoir une bande son pendant l'encodage
vous certifie que vous pourrez avoir une synchronisation propre (en supposant que
vous ne receviez pas de messages comme Trop de paquets audio dans la mémoire tampon
)
Vous aurez besoin que MEncoder traite le son.
Vous pouvez par exemple copier la bande son originale pendant l'encodage avec l'option
ou la convertir en "léger" 4kHz mono WAV PCM
avec l'option .
Autrement, dans certains cas, cela générera un fichier vidéo qui ne se synchronisera pas avec l'audio.
Cela arrive quand le nombre de trames vidéos dans le fichier source ne correspond
pas exactement à la longueur totale des trames audio ou lorsqu'il y a une
discontinuité ou des frames audio en trop ou manquantes. La bonne
façon de gérer ce type de problèmes est d'insérer un silence ou bien de couper l'audio
à ces emplacements.
Cependant, MPlayer ne sait pas le faire, donc si vous
dé-multiplexez l'AC3 et l'encodez avec une autre application (ou le sortez en PCM
avec MPlayer), les discontinuités subsistent et la seule
façon de les corriger est de supprimer ou de rajouter des trames.
Tant que MEncoder voit la piste son pendant qu'il
encode la vidéo, il peut faire ces suppressions/rajouts (ce qui fonctionne habituellement
car cela se produit lors de changements de scènes avec fondu au noir) mais si
MEncoder ne voit pas la piste son, il encodera
toutes les trames telles quelles et elles ne correspondront pas au le fichier
audio final, quand, par exemple, vous multiplexerez la piste vidéo et la piste
son dans un fichier Matroska.
Dans un premier temps, il faudra convertir le son du DVD en fichier WAV que
le codec audio peut utiliser en entrée.
Par exemple :
mplayer fichier_source.vob -ao pcm:file=fichier_destination_son.wav
-vc dummy -aid 1 -vo null
aura pour effet de prendre la seconde piste audio du fichier fichier_source.vob
pour la placer dans le fichier fichier_destination_son.wav.
Vous voudrez ensuite peut-être normaliser le son avant l'encodage, car les pistes
audio des DVDs sont généralement enregistrées à un faible volume.
Vous pouvez par exemple utiliser l'outil normalize qui est
normalement disponible sur la plupart des distributions.
Si vous utilisez Windows, un outil comme BeSweet
fera le même travail.
Vous le compresserez ensuite en Vorbis ou MP3.
Par exemple :
oggenc -q1 fichier_destination_son.wav
encodera fichier_destination_son.wav avec une qualité de 1,
ce qui est équivaut à environ 80Kb/s, soit le minimum si vous voulez de la qualité.
Notez que MEncoder ne sait actuellement pas
multiplexer les pistes audio Vorbis dans le fichier final car il ne supporte que les conteneurs
AVI ou MPEG en sortie, chacun pouvant mener à des problèmes de synchronisation A/V avec certains lecteurs
quand le fichier AVI contient des flux audio VBR comme Vorbis. Ne vous inquiétez pas, ce
document vous montrera comment y arriver avec un programme tiers.
Le multiplexage
Maintenant que vous avez encodé votre vidéo, vous désirez très certainement
la multiplexer avec une ou plusieurs pistes audio vers un conteneur comme l'AVI,
le MPEG, le Matroska ou le NUT.
MEncoder ne supporte nativement que des conteneurs
AVI ou MPEG.
Par exemple :
mencoder -oac copy -ovc copy -o sortie_film.avi
-audiofile entrée_audio.mp2entrée_video.avi
Cela aura pour effet de fusionner le fichier vidéo entrée_video.avi
et le fichier audio entrée_audio.mp2 vers un seul fichier AVI
sortie_film.avi.
Cette commande marche avec le MPEG-1 layer I, II, ou III (plus connu sous le nom
de MP3), WAV et aussi quelques autres formats audio.
Une des caractéristiques expérimentales de MEncoder
est le support de libavformat,
une bibliothèque issue du projet FFmpeg qui supporte le multiplexage et dé-multiplexage
vers une grande variété de conteneurs.
Par exemple :
mencoder -oac copy -ovc copy -o sortie_film.asf
-audiofile entrée_audio.mp2entrée_video.avi
-of lavf -lavfopts format=asf
Cela fera strictement la même chose que pour l'exemple précédent, sauf que le conteneur
de sortie sera l'ASF.
Souvenez-vous que ce support est encore très expérimental (mais il s'améliore de jour en jour),
et ne marchera que si vous compilez MPlayer avec l'option
activée libavformat (ce qui veut dire que
les packets binaires ne marcheront peut-être pas).
Améliorer la fiabilité du multiplexage et de la synchronisation Audio/Video
Vous avez peut-être fait l'expérience de sérieux problèmes de synchronisation A/V
en essayant de multiplexer votre video avec la bande son, où, quelque soit
le décalage audio, vous n'arrivez pas à obtenir une synchronisation correcte.
Ceci peut arriver quand vous utilisez des filtres video qui dupliquent ou enlèvent des images,
comme le filtre téléciné inverse. Il est vivement conseillé d'utiliser le
filtre vidéo à la fin de votre chaîne de filtres pour éviter
ce type de problème.
Sans l'option , si MEncoder
veut dupliquer une image, il s'en remet au multiplexeur pour mettre une marque
dans le conteneur de façon à ce que la dernière image soit affichée 2 fois
pour maintenir la synchronisation sans avoir à écrire une nouvelle image.
Avec l'option , MEncoder
va simplement passer une deuxième fois la dernière image dans la chaîne de filtres.
Ce qui veut dire que l'encodeur recevra exactement la même
image 2 fois, puis les compressera. Il en résultera un fichier légèrement plus grand,
mais cela ne posera plus de problèmes quand vous démultiplexerez ou remultiplexerez vers un autre conteneur.
Il se peut aussi que vous n'ayiez pas d'autres choix que d'utiliser l'option
avec certains conteneurs peu liés à MEncoder comme ceux
supportés par libavformat, qui peuvent ne pas supporter
la duplication d'image au niveau du conteneur.
Limitations du conteneur AVI
Bien que ce soit le format de conteneur le plus largement supporté après le MPEG-1, l'AVI a
des inconvénients majeurs. Le plus évident d'entre eux est peut-être l'entête.
Pour chaque morceau (chunk) du fichier AVI, 24 octets sont gâchés en entête et index.
Ce qui se traduit par environ 5Mo par heure, soit entre 1 et 2,5% du volume du fichier pour un film
de 700Mo. Cela peut ne pas sembler important, mais cela peut représenter la différence entre
pouvoir utiliser un débit de 700 kbits/sec au lieu de 714 kbits/sec pour une même video.
Et pour la qualité, chaque bit compte.
En plus de cette grosse inefficacité, l'AVI a aussi d'autres limitations majeures:
Seuls les contenus à nombre d'images par seconde constant peuvent être stockés. Ceci est particulièrement
limitant si vous voulez stocker des fichiers aux contenus hétérogènes (par
exemple un mélange de vidéo NTSC et de films sur pellicule).
En fait, il existe des astuces qui permettent de stocker des contenus à nombre d'images par seconde variable
dans un AVI, mais cela multiplie par au moins 5 la taille (déjà énorme) des entêtes et ce n'est donc
pas réellement applicable.
L'audio dans un fichier AVI doit soit avoir un débit constant (CBR), soit une
taille de trame constante (i.e. toutes les trames décodent le même
nombre d'échantillons).
Malheureusement, le codec le plus efficace, Vorbis, ne satisfait aucun de ces critères.
Donc, si vous envisagez de stocker un fichier en AVI, vous devrez utiliser un
codec moins performant comme le MP3 ou l'AC3.
Ceci dit, MEncoder ne supporte actuellement pas
l'encodage à d'images par seconde variable ou le Vorbis;
Donc vous n'allez peut-être pas considérer les 2 points précédents commes des limitations
si vous n'utilisez que MEncoder pour encoder.
Pourtant, il est possible d'utiliser MEncoder uniquement pour
l'encodage vidéo, puis d'utiliser des outils externes pour l'encodage de l'audio et
multiplexer le tout vers un conteneur différent.
Le multiplexage dans le conteneur Matroska
Matroska est un conteneur libre, ouvert, qui vise à offrir de nombreuses fonctionnalités avancées
que des conteneurs plus anciens comme l'AVI ne peut gérer.
Par exemple, le Matroska supporte le débit vidéo variable (VBR), un framerate
variable (VFR), chapitres, attachement de fichiers, code de détection d'erreur
(EDC) et des codecs A/V modernes comme le "Advanced Audio Coding" (AAC), le
"Vorbis" ou le "MPEG-4 AVC" (H.264), presque tous n'étant pas supportés par l'AVI.
Les outils nécessaires à la création de fichier Matroska sont appelés collectivement mkvtoolnix,
et sont disponibles pour la plupart des systèmes Unix mais aussi pour Windows.
Puisque Matroska est un standard ouvert, vous trouverez peut-être d'autres outils
qui vous conviendront mieux, mais comme mkvtoolnix est le plus connu, et
qu'il est supporté par Matroska lui même, nous allons parler de son utilisation.
La façon la plus simple de démarrer avec Matroska, c'est probablement d'utiliser
MMG, l'interface graphique livrée avec mkvtoolnix,
et de suivre le guide de l'interface graphique de mkvmerge (mmg).
Vous pouvez aussi multiplexer des fichiers vidéo et audio en utilisant la ligne de commande :
mkvmerge -o sortie.mkventree_video.avientree_audio1.mp3entree_audio2.ac3
Ceci aura pour effet de multiplexer le fichier vidéo entree_video.avi
avec les deux fichiers audio entre_audio1.mp3 et entree_audio2.ac3
dans un fichier Matroska sortie.mkv.
Matroska, comme mentionné ci-dessus, est capable de faire bien plus que ça, comme plusieurs
pistes audio (avec un réglage précis de la synchronisation audio/video), chapitres,
sous titres, coupures, etc... Merci de bien vouloir vous reporter à la documentation
de cette application pour plus d'informations.
Comment gérer le téléciné et l'entrelacement des DVDs NTSCIntroductionQu'est ce que le téléciné ?
Si vous ne comprenez pas grand-chose à ce qui est écrit dans le document présent,
je vous suggère de visiter cette page (en anglais):
http://en.wikipedia.org/wiki/Telecine
Ce lien pointe vers une documentation relativement claire et compréhensible sur ce qu'est le téléciné.
Une note à propos des nombres
Beaucoup de documents renvoient à un
nombre de trames par secondes pour la vidéo NTSC de 59.94 ce qui correspond à
29.97 images complètes par secondes (pour le télécine et l'entrelacé) et à 23.976 (pour
le progressif). Pour simplifier, certains documents arrondissent même à 60, 30 et 24.
En toute rigueur, tous ces nombres sont des approximations. Les vidéos NTSC en noir et blanc
avaient exactement 60 trames par secondes, mais 60000/1001 a été choisi par la suite
pour s'accomoder de la couleur en conservant la compatibilité avec les téléviseurs noir et blanc de l'époque.
La vidéo numérique NTSC (par exemple sur un DVD) est aussi en 60000/1001 trames
par seconde. A partir de là, la vidéo entrelacée et télécinée est faite pour être
en 30000/1001 images par seconde; les vidéos progressives en 24000/1001 images par secondes.
De plus anciennes versions de la documentation MEncoder
et plusieurs e-mails archivés de liste de diffusion font référence à
59.94, 29.97, et 23.976.
Toute la documentation de MEncoder a été mise à jour
pour utiliser les fractions, et vous devriez aussi les utiliser.
est incorrect.
doit être utilisé à la place.
Comment le téléciné est-il utilisé?
Toutes les vidéos qui sont censées être affichées sur des téléviseurs NTSC
doivent être en 60000/1001 trames par secondes. Les téléfilms sont souvent
filmés directement en 60000/1001 trames par secondes, alors que la majorité des
films pour le cinéma est en 24000/1001 images par seconde. Quand les DVD
contenant des films faits pour le cinéma sont masterisés, la vidéo est alors convertie pour la
télévision par un processus appelé le téléciné.
Sur un DVD, la vidéo n'est jamais vraiment stockée à 60000/1001 trames par seconde.
Si la vidéo est d'origine en 60000/1001, chaque paire de trames est alors combinée
pour former une image, ce qui donne 30000/1001 images par seconde. Les lecteurs de
DVD de salon lisent alors les fanions incorporé au flux vidéo pour déterminer
si la première ligne à afficher doit être paire ou impaire.
Normalement, les contenus à 24000/1001 images par seconde restent comme cela
lorsqu'ils sont encodés pour un DVD, et le lecteur DVD doit alors faire
la conversion du téléciné à la volée. Parfois, la vidéo est télécinée avant
d'être stockée sur le DVD, même si c'était originalement du 24000/1001 images
par seconde, cela devient du 60000/1001 trames par seconde. Quand elles sont stockées
sur le DVD, les trames sont combinées par paires pour former 30000/1001 images
par seconde.
Quand on regarde les images formées individuellement à partir de la vidéo en
60000/10001 trames par seconde, téléciné ou autre, l'entrelacement est
clairement visible et ce, qu'il y ait un mouvement ou non car l'une des trames (disons
les lignes impaires) représente un moment dans le temps 1/(60000/1001) seconde
plus tard que les autres. Regarder une vidéo entrelacée sur un ordinateur semble
laid parce que l'écran a une résolution plus élevée et
parce que la vidéo est affichée image après image au lieu de trame après trame.
Notes :
Cette section ne s'appliquent qu'aux DVDs NTSC, pas au PAL.
Les lignes de commande MEncoder données en exemple au long de ce
document ne sont pas à utiliser tel quels.
Elles représentent juste le minimum requis pour encoder la vidéo qui s'y rapportent.
La meilleure méthode pour faire un bon encodage de DVD ou procéder à des réglages avancés de
libavcodec pour atteindre une qualité optimum sont des
questions en dehors des propos de ce guide.
Il y a quelques notes en bas de page spécifiques à ce guide, elles sont liées comme ceci :
[1]
Comment savoir quel type de vidéo vous avez ?Progressive
Les vidéos progressives ont été filmées initialement à 24000/1001 fps et stockées
sur le DVD sans altération.
Quand vous lisez un DVD en progressif dans MPlayer,
la ligne suivante sera affichée dès le début de la lecture :
demux_mpg: 24000/1001 fps progressive NTSC content detected, switching framerate.
Dorénavent, demux_mpg ne devrait jamais dire qu'il trouve
"une vidéo NTSC à 30000/1001 images par secondes."
Quand vous regardez une vidéo progressive, vous ne devriez jamais voir d'entrelacement.
Mais soyez attentif, il arrive parfois qu'un peu de téléciné se glisse sans prévenir.
Il m'est arrivé de tomber sur des émissions de télévisions en DVD avec une
seconde de téléciné à chaque changement de scène ou à d'autres emplacements au hasard.
Une autre fois, la première moitié du DVD était en progressif
et la seconde en téléciné. Si vous voulez en être vraiment sûr,
vous pouvez scanner le film entier :
mplayer dvd://1 -nosound -vo null -benchmark
L'utilisation de l'option fait lire MPlayer
aussi vite qu'il le peut - en fonction du matériel, cela peut prendre un certain
temps. Chaque fois que demux_mpg signale un changement, la ligne immédiatement au dessus
vous donnera le temps auquel ce changement est arrivé.
Parfois, la vidéo progressive sur les DVDs est signalée en tant que "soft-telecine"
parce qu'elle est censée être télécinée par le lecteur DVD.
Téléciné
Les vidéos télécinées ont été filmées en 24000/1001 et sont télécinées
avant d'être gravées sur DVD.
MPlayer ne signale jamais une variation d'images par secondes
quand il lit une vidéo télécinée.
Au visionnage d'une vidéo télécinée, vous verrez des artefacts d'entrelacement
qui semblent "clignoter": ils apparaissent et disparaissent répététivement.
Vous pouvez le voir plus précisément en suivant les indications ci-dessous:
mplayer dvd://1
Chercher une scène avec beaucoup de mouvements.
Utiliser la touche . pour avancer image par image.
Observer le schéma de répétition des images entrelacées et progressives. Si vous obtenez
PPPII, PPPII, PPPII,... alors la vidéo est
télécinée. Si vous observez d'autres schémas de répétition, alors la vidéo a peut-être été
télécinée avec une méthode non-standard; MEncoder ne sait pas convertir un téléciné
non-standard en progressif sans dégradation. Si aucun schéma n'est visible, c'est
alors sûrement une vidéo entrelacée.
Parfois, la vidéo progressive sur les DVDs est signalée en tant que "soft-telecine"
parce qu'elle est censée être télécinée par le lecteur DVD.
Parfois, la vidéo télécinée sur les DVDs est signalée "hard-telecine". Le hard-teleciné
étant à 60000/1001 images par seconde, le lecteur DVD lit la vidéo sans manipulation.
Une autre façon de savoir si la source est télécinée ou non, est de la lire avec
l'option et depuis une ligne de commande
et de voir comment l'option combine les trames.
Si la source est télécinée, vous devriez voir sur la console un schéma de répétition 3:2 avec des
alternances de 0+.1.+2 et 0++1.
L'avantage de cette technique est que vous n'avez pas besoin de visionner la
source pour l'identifier, ce qui peut être utile pour automatiser la procédure d'encodage, ou
pour effectuer cette procédure à distance à travers une connexion lente.
Entrelacée
Les vidéos entrelacées ont été filmées en 60000/1001 trames par seconde,
puis stockées sur le DVD en tant que 30000/1001 images par seconde. L'effet
est le résultat de la combinaison de paires
de trames dans une image. Chaque trame est censée être décalée de 1/(60000/1001)
de seconde les unes des autres. Quand elles sont affichées simultanément, la différence devient
visible.
Comme pour la vidéo télécinée, MPlayer ne signale
jamais une variation d'images par secondes quand il lit une vidéo entrelacée.
Si vous regardez attentivement une vidéo entrelacée image par image avec la
touche ., vous verrez l'entrelacement de chaque trame.
Mélange de progressive et télécinée
Toutes les vidéos qui mélangent progressif et téléciné ont été filmées en 24000/1001
images par seconde, puis certaines parties ont été converties en téléciné.
Quand MPlayer lit ce type de fichier, il doit jongler
(souvent répététivement) entre "le 30000/1001 images par seconde NTSC" et
"le 24000/1001 images par secondes NTSC progressif".
Regardez les messages de MPlayer pour voir ces messages.
Vous devriez aller voir la section "30000/1001 fps NTSC" afin d'être
sûr que c'est vraiment du téléciné, et pas seulement de l'entrelacé.
Mélange de vidéo progressive et entrelacée
Dans les vidéos qui mélangent le progressif et le téléciné, les flux vidéos
progressifs et entrelacés sont combinés l'un à l'autre.
Cette catégorie ressemble au "mélange de progressive et télécinée" jusqu'à
ce que vous examiniez la partie en 30000/1001 images par seconde et que vous vous aperceviez
qu'il n'y a pas de trace de téléciné.
Comment encoder chaque catégorie ?
Comme évoqué au départ, ces prochaines lignes de "HowTo"
MEncoder ne sont pas là pour être strictement
utilisées telles quelles, mais pour fournir des paramètres minimum d'encodages pour
chaque catégorie.
Le progressif
La vidéo progressive ne nécessite pas de filtre particulier pour l'encodage.
Pourtant, un paramètre ne doit pas être omis : . Sinon,
MEncoder essayera d'encoder à 30000/1001 fps et produira des
images en double.
mencoder dvd://1 -oac copy -ovc lavc -ofps 24000/1001
Il n'est pas rare de se trouver avec une vidéo qui semble progressive mais qui
contient en fait quelques petites parties en téléciné. A moins d'être vraiment
sûr l'état de la vidéo, il sera préférable de traiter la vidéo comme
du progressif et téléciné mélangés.
La perte de qualité est négligeable [3].
Téléciné
Les vidéos en téléciné peuvent redonner le contenu original à 24000/1001 avec
un processus appelé inverse-téléciné.
MPlayer a plusieurs filtres disponibles pour ceci,
mais le meilleur, , est abordé à la section
mélange de progressif et téléciné.
L'entrelacé
Pour des raisons pratiques, il n'est pas possible de retrouver entièrement une
vidéo progressive depuis une entrelacée. La seule manière de faire cela sans
perdre la moitié de la résolution verticale est de doubler le framerate et
d'essayer de "trouver" les lignes correspondantes pour chaque frame
(cela a des inconvénients, voir la méthode 3).
Encodez la vidéo sous une forme entrelacée. Normalement, l'entrelacement
détériore la capacité de l'encodeur à bien compresser, mais libavcodec
possède deux paramètres spécifiquement faits pour stocker la vidéo entrelacée de manière
plus satisfaisante: et . Aussi,
l'utilisation de est-elle fortement recommandée [2]
car cela encodera les macroblocs non-entrelacés à des endroits où il n'y
a pas de mouvements. Notez que n'est pas nécessaire ici.
mencoder dvd://1 -oac copy -ovc lavc -lavcopts ildct:ilme:mbd=2
Utilisez un filtre de dés-entrelacement avant l'encodage. Il y a plusieurs de
ces filtres disponibles aux choix, chacun avec ces propres avantages et
désavantages. Consultez pour voir quels sont
ceux disponibles (grep pour "deint"), et cherchez les
listes de diffusion MPlayer pour trouver plusieurs discussions sur les
différents filtres. Encore une fois, le framerate ne change pas, donc pas de
. Aussi, le dés-entrelacement devra être fait après
découpage [1] et
avant dimensionnement.
mencoder dvd://1 -oac copy -vf pp=lb -ovc lavc
Malheureusement, cette option est un boguée dans
MEncoder : cela devrait bien marcher avec
MEncoder G2, mais on n'en est pas encore là. Vous
risquez d'avoir des plantages. Cela importe peu car le but de
est de créer une frame complète à partir de chaque champs, ce qui
donne le framerate 60000/1001. L'avantage de cette approche est qu'aucune
donnée n'est jamais perdue. Cependant, vu que chaque frame vient avec seulement
un champ, les lignes manquantes doivent être interpolées d'une façon ou d'une autre.
Il n'y a pas de très bonne méthode générant les données manquantes, et donc le
résultat sera un peu similaire à celui obtenu quand on utilise certains filtres de dés-entrelacement.
Générer les lignes manquantes crée aussi d'autres problèmes,
simplement parce que la quantité de données double. Ainsi, de plus haut bitrates
d'encodage sont nécessaires pour conserver la qualité, et plus de puissance CPU est
utilisée pour l'encodage et le décodage. 'tfields' a plusieurs
options pour gérer la création des lignes manquantes de chaque frame. Si vous
utilisez cette méthode, alors regardez le manuel, et prenez n'importe quelle
option qui semble la meilleure pour votre matériel. Notez que lors de l'utilisation de
vous
devez spécifier les deux options
et à deux fois le framerate de votre source originale.
mencoder dvd://1 -oac copy -vf tfields=2 -ovc lavc -fps 60000/1001 -ofps 60000/1001
Si vous avez décidé de réduire la taille de façon dramatique, vous pouvez
extraire et encoder seulement un des deux champs. Bien sûr, vous perdrez la
moitié de la résolution verticale, mais si vous pensez la réduire au plus de
moitié par rapport à l'original, la perte ne sera pas trop grande. Le résultat
sera un fichier progressif à 30000/1001 frames par seconde. La procédure est
d'utiliser , puis de découper
[1] et de dimensionner
de manière appropriée. Souvenez-vous que vous devrez ajuster la dimension pour
compenser la résolution verticale ayant été réduite de moitié.
mencoder dvd://1 -oac copy -vf field=0 -ovc lavcProgressif et téléciné mélangé
Afin de convertir une vidéo composée de progressive et de téléciné en vidéo entièrement
progressive, les parties en téléciné doivent être inverse-télécinées. Il y a trois
moyens d'accomplir cela, comme décrit ci-dessous. Notez que vous devrez
toujours inverse-téléciné avant tout
redimensionnement. Sauf si vous savez vraiment ce que vous faites, il faudra
inverse-téléciné avant tout découpage [1].
est nécessaire ici parce que la sortie vidéo
sera de 24000/1001 frames par seconde.
est faite pour inverse-téléciné le matériel
téléciné tandis que les données progressives sont laissées intactes. Afin
de bien fonctionner, doit
être suivi par le filtre ou sinon MEncoder plantera.
est, cependant, la méthode la plus propre et la plus précise
disponible pour encoder le téléciné et le "progressif et téléciné mélangés".
mencoder dvd://1 -oac copy -vf pullup,softskip -ovc lavc -ofps 24000/1001
Une méthode plus ancienne consiste à téléciner les parties non-télécinées
et ensuite inverse-téléciner la vidéo tout entière, au lieu de
n'inverse-téléciner que les parties en téléciné.
Cela semble confus? softpulldown est un filtre qui parcours une vidéo
et rend téléciné le fichier entier. Si nous faisons suivre softpulldown avec
soit ou soit , le résultat final
sera entièrement progressif. est nécessaire.
mencoder dvd://1 -oac copy -vf softpulldown,ivtc=1 -ovc lavc -ofps 24000/1001
Je n'ai pas moi-même utilisé , mais voilà ce que
D Richard Felker III en dit:
Il est correct, mais AMA il essaie de dés-entrelacer plutôt
que de faire l'inverse-téléciné trop souvent (tout comme les lecteurs DVD de salon
& les TVs progressive) ce qui donne des clignotements affreux et d'autre
artefacts. Si vous penser l'employer, vous devez commencer par passer un peu de temps
pour affiner les options et observer la sortie pour être sûr que cela
casse pas tout.
Progressif et entrelacé mélangés
Il y a deux options pour s'occuper de cette catégorie, chacune étant un
compromis. Vous devez prendre une décision basée sur la durée/localisation
de chaque type.
Traitez-la comme progressive. Les parties entrelacées sembleront entrelacées,
et certains des champs entrelacés devront être jetés, ayant pour résultat un
peu de sautillement inégal. Vous pouvez utiliser un filtre post-traitement si
vous le voulez, mais cela peut sensiblement dégrader les parties progressives.
Cette option ne devrait vraiment pas être utilisée si vous voulez
éventuellement afficher la vidéo sur un appareil entrelacé (avec une carte TV,
par exemple). Si vous avez entrelacé les frames dans une vidéo à 24000/1001
frames par seconde, ils seront télécinés en même temps que les frames progressive.
La moitié des "frames" entrelacées sera affichée pour une durée de trois champs
(3/(60000/1001) secondes), ce qui a pour résultat un effet pichenette de
"retour en arrière" ce qui semble tout à fait mauvais. Si vous tentez
quand même ceci, vous devez utiliser un filtre
dés-entrelaçant comme ou .
Cela peut tout aussi bien être une mauvaise idée pour l'affichage progressive.
Cela laissera tomber les paires consécutives de champs entrelacés, ayant pour
résultat une discontinuité qui peut être plus visible qu'avec la seconde méthode,
ce qui montre certaines frames progressive en double. Une vidéo entrelacée à
30000/1001 frames par seconde est déjà un peu variable parce que cela devrait
vraiment être montré à 60000/1001 champs par seconde, donc les frames dupliquées
ne tiennent pas.
Qu'importe la façon, il est recommandé de considérer votre contenu et comment
vous voulez l'afficher. Si votre vidéo est à 90% progressive et que vous ne
pensez pas la regarder sur une TV, vous devriez favoriser une approche progressive.
Si elle est seulement à moitié progressive, vous voudrez probablement l'encoder
comme si elle était entièrement entrelacée.
Traitez-la comme entrelacée. Certaines frames des parties progressive auront
besoin d'être dupliquées, ce qui entraînera en un sautillement inégal. Encore une
fois, les filtres dés-entrelaçant peuvent passablement dégrader les parties
progressives.
Notes de piedA propos de découpage:
Les données vidéo d'un DVD sont stockées dans un format appelé YUV 4:2:0. Dans
la vidéo YUV, la luma ("luminosité") et le chroma ("couleur")
sont stockés séparément. Parce que l'oeil humain est somme toute moins sensible
à la couleur qu'il ne l'est à la luminosité, dans une image YUV 4:2:0 il y a
seulement un pixel de chroma pour 4 pixels de luma. Dans une image progressive,
chaque carré de quatre pixels de luma (deux sur chaque coté) ont un pixel de
chroma commun. Vous devez découper un YUV 4:2:0 progressif à des résolutions paires,
et utiliser un décalage pair. Par exemple,
est correct mais
ne l'est pas.
Quand vous avez à faire à un YUV 4:2:0 entrelacé, la situation devient un peu plus
compliquée. Au lieu que chaque série de quatre pixels de luma partage un pixel
de chroma dans une frame, chaque groupe de quatre pixels de luma
dans chaque champs partage un pixel de chroma. Quand les
champs sont entrelacés pour former une frame, chaque ligne de scan est un
pixel de haut. Maintenant, au lieu que tout les quatre pixels de luma soient
dans un carré, ils sont deux pixels côte à côte, et les deux autres pixels
sont côte à côte deux lignes de scan plus bas. Les deux pixels de luma dans la
ligne de scan intermédiaire sont à partir de l'autre champ, et donc partage un
pixel de chroma différent avec deux pixels de luma deux lignes de scan plus loin.
Toute cette confusion rend nécessaire d'avoir des dimensions de découpe verticales
et des décalages en multiple de quatre. Le décalage horizontal peut rester égal.
Pour la vidéo télécinée, je recommande que le découpage prenne place après l'inverse
téléciné. Une fois la vidéo progressive vous avez seulement besoin de découper par
nombres pairs. Si vous voulez vraiment gagner la légère accélération que la découpe
peut offrir, vous devez découper verticalement par multiples de quatre
ou bien le filtre inverse-téléciné n'aura pas les bonnes données.
Pour la vidéo entrelacée (pas télécinée), vous devez toujours découper verticalement
par multiples de quatre à moins que vous n'utilisiez avant de découper.
A propos des paramètres d'encodage et de la qualité:
Juste parce que je recommande ici ne veut pas dire
que cela ne devrait pas être utilisé autre part. Avec ,
est l'une des deux options de libavcodec
qui augmente le mieux la qualité, et vous devriez toujours utiliser au moins
une des deux à moins que la baisse de vitesse d'encodage ne soit prohibitive
(e.g. encodage temps réel). Il y a plusieurs autres options libavcodec
qui augmentent la qualité d'encodage (et réduisent la vitesse d'encodage) mais ceci est au delà
de la portée de ce document.
A propos de la performance de pullup:
Employer (avec )
sur une vidéo progressive est sûr, et est habituellement une bonne idée à moins qu'il
ait été vérifié que la source est entièrement progressive.
La perte de performance est petite pour la plupart des cas. Sur un encodage minimal,
ralentit MEncoder de 50%.
L'ajout du traitement du son et d'options avancées pour masquent cette
différence, en limitant la perte de performance due à l'utilisation de à 2%.
Encodage avec la famille de codec libavcodeclibavcodec
fournit un encodage simple pour plusieurs formats vidéos et audio intéressants.
Vous pouvez encoder vers les codecs suivant (la liste suivante est plus ou moins à jour):
codecs vidéo de libavcodecNom du codec vidéoDescriptionmjpeg
Motion JPEG
ljpeg
JPEG sans perte
h261
H.261
h263
H.263
h263p
H.263+
mpeg4
ISO standard MPEG-4 (DivX 5, compatible XviD)
msmpeg4
pre-standard MPEG-4 variant par MS, v3 (AKA DivX3)
msmpeg4v2
pre-standard MPEG-4 by MS, v2 (utilisé dans les vieux fichiers ASF)
wmv1
Windows Media Vidéo, version 1 (AKA WMV7)
wmv2
Windows Media Vidéo, version 2 (AKA WMV8)
rv10
RealVidéo 1.0
rv20
RealVidéo 2.0
mpeg1vidéo
MPEG-1 vidéo
mpeg2vidéo
MPEG-2 vidéo
huffyuv
compression sans perte
asv1
ASUS Vidéo v1
asv2
ASUS Vidéo v2
ffv1
codec vidéo sans perte de FFmpeg
svq1
Sorenson vidéo 1
flv
Sorenson H.263 utilisé dans Vidéo Flash
dvvideo
Vidéo Numérique Sony
snow
codec basé sur l'ondelette expérimentale de FFmpeg
La première colonne contient les noms de codec qui doivent être passés après la
configuration de vcodec, comme ceci:
Un exemple avec la compression MJPEG:
mencoder dvd://2 -o title2.avi -ovc lavc -lavcopts vcodec=mjpeg -oac copyCodecs audio de libavcodec=Nom de codec audioDescriptionmp2MPEG Layer 2ac3AC3, AKA Dolby Digitaladpcm_ima_wavIMA adaptatif PCM (4 bits par échantillon, compression 4:1)soniccodec avec/sans perte expérimental
La première colonne contient les noms du codec qui devra être passée après l'option
acodec, comme ceci:
Un exemple avec compression AC3:
mencoder dvd://2 -o title2.avi -oac lavc -lavcopts acodec=ac3 -ovc copy
Contrairement aux codecs vidéo de libavcodec,
ces codecs audio ne font pas un usage intelligents des bits qu'on leur donne
vu qu'ils ont des modèles psycho-accoustiques minimaux (quand ils en ont)
ce que la plupart des autres implémentations de codec comportent.
Cependant, notez que tous ces codecs audio sont très rapides et fonctionnent qu'importe
leur environnement à partir du moment où MEncoder a été
compilée avec libavcodec (ce qui est le
cas la plupart du temps), et ne dépend pas de bibliothèques externes.
Options d'encodage de libavcodec
Idéalement, vous voudriez probablement juste dire à mencoder de passer en
mode "haute qualité" et passer à autre chose.
Ce serait sûrement sympa, mais c'est malheureusement dur à faire vu que les
différentes options d'encodage donnent différents résultats de qualité
en fonction du matériel source.
Ceci vient du fait que la compression dépende des propriétés visuelles
de la vidéo en question.
Par exemple, un film d'animation et un film d'action ont des propriétés très
différentes et nécessitent des options différentes pour obtenir un encodage
optimal.
La bonne nouvelle, c'est que certaines options ne devraient jamais être mise à
part, comme , , et .
Voir ci-dessous pour une description détaillée des options d'encodage communes.
Options à régler:vmax_b_frames: 1 ou 2 est bon selon
le film.
Notez que si vous avez besoin d'avoir votre encodeur décodable par DivX5, vous
aurez besoin d'activer le support closed GOP, en utilisant l'option de
libavcodec, mais vous aurez besoin de désactiver
la détection de scène, ce qui n'est pas une bonne idée étant donné que cela
affectera un peu l'efficacité d'encodage.
vb_strategy=1: aide aux scènes avec de rapides
mouvements.
Sur certaines vidéos, vmax_b_frames peut affecter la qualité, mais
vmax_b_frames=2 avec vb_strategy=1 aideront.
dia: portée de recherche de mouvement. Le plus large
est l'écart; ce sera mieux, mais aussi plus lent.
Des valeurs négatives sont une échelle complètement différente.
De bonnes valeurs sont -1 pour un encodage rapide, ou 2-4 pour un plus lent.
predia: pré-passe de recherche de mouvement.
Pas aussi important que dia. De bonnes valeurs sont 1 (par défaut) à 4. Cela
demande preme=2 pour être vraiment utile.
cmp, subcmp, precmp: Fonction de comparaison
pour l'estimation de mouvement.
Testez avec des valeurs de 0 (défaut), 2 (hadamard), 3 (dct), et 6 (taux de
distorsion).
0 est le plus rapide, et suffisant pour precmp.
Pour cmp et subcmp, 2 est bon pour les animations, et 3 est bon pour les
actions en direct.
6 peut-être ou non un peu mieux, mais c'est lent.
last_pred: Nombre de prédicateurs de mouvement
à prendre depuis la frame précédente.
1-3 (ou dans ces eaux) améliore la vitesse de l'encodage quasiment sans contrepartie.
De plus hautes valeurs ralentiront sans avoir de gain réel.
cbp, mv0: Contrôle la sélection de macroblocs.
Un petit coût en vitesse pour un petit gain en qualité.
qprd: quantification adaptative basée sur la
complexité du macrobloc.
Peut aider ou aggraver la situation ceci dépend de la vidéo et des autres options.
Cela peut causer des artefacts à moins que vous ne paramétriez vqmax à certaines
valeurs raisonnablement petites (6 c'est bien, voire peut-être 4);
vqmin=1 devrait aussi aider.
qns: très lente, spécialement quand combinée
avec qprd.
Cette option dira l'encodeur à minimiser le bruit dû à la compression
d'artefact au lieu de faire strictement ressembler la vidéo encodée à la
source.
N'utilisez pas ceci à moins d'avoir déjà bidouillé tout ce qui est possible
et que les résultats ne sont pas encore assez bons.
vqcomp: Bidouille du contrôle de taux.
Quelles sont les bonnes valeurs qui dépendent du film?
Vous pouvez de manière sûre laisser cela de côté si vous voulez.
Réduire vqcomp met plus de bits sur les scènes de basse complexité, l'augmenter
les met sur les scènes de haute complexité (défaut: 0.5, portée: 0-1. portée
recommandée: 0.5-0.7).
vlelim, vcelim: Paramètre le seuil du seul
coefficient d'élimination pour les plans de luminance et de chroma.
Ceux-là sont encodés séparément dans tous les algorithmes de style MPEG.
L'idée derrière tout ceci est d'utiliser certaines bonnes heuristiques
pour déterminer quand le changement dans un bloc est inférieur au seuil que
vous avez spécifié, et dans ce cas, de simplement encoder le bloc comme étant
"sans changement".
Cela économisera des bits et accélérera peut-être l'encodage. vlelim=-4 et
vcelim=9 semblent être de bonnes valeurs pour les films en direct, mais
semblent ne pas aider avec les animations; quand vous voudrez encoder une animation,
vous devrez probablement les laisser inchangés.
qpel: Estimation de mouvement de quart de pixel.
MPEG-4 utilise la précision de moitié de pixel pour sa recherche de mouvement
par défaut, donc cette option vient avec un surplus car plus d'information seront
stockées dans le fichier encodé.
La compression gain/perte dépend du film, mais n'est habituellement pas très
efficace sur les animations.
qpel induit toujours un surcoût significatif dans le temps de décodage du CPU
(+25% en pratique).
psnr: n'affecte pas l'encodage courant,
mais écrit un fichier journal donnant le type/taille/qualité de chaque frame, et
imprime un résumé du PSNR (rapport maximal du signal sur le bruit) à la fin.
Options à éviter:vme: La valeur par défaut est la mieux.
lumi_mask, dark_mask: Quantification adaptative
pyscho-visuelle.
Vous ne voulez pas jouer avec ces options si vous tenez à la qualité.
Des valeurs raisonnables peuvent être efficaces dans votre cas, mais soyez prévenu
que ceci reste très subjectif.
scplx_mask: Essaie d'éviter l'apparition d'artefacts
carrés, mais le post-traitement est le mieux.
Exemples de paramètres d'encodage
Les paramètres suivant sont des exemples de combinaisons d'option de différents
encodages qui affectent la vitesse et la qualité pour un bitrate donné.
Tous les paramètres d'encodage sont testés sur un échantillon de vidéo de
720x448 @30000/1001 fps, le bitrate cible était 900kbps, et la machine était un
AMD-64 3400+ à 2400 Mhz en mode 64 bits.
Chaque paramètre d'encodage comporte la mesure de vitesse d'encodage (en
frames par seconde) et la perte PSNR (en dB) comparé au paramètre de "très
haute qualité".
Sachez que selon votre source, votre machine et les derniers développements,
vous pourrez obtenir des résultats très différents.
DescriptionOptions d'encodagevitesse (en fps)perte PSNR relative (en dB)Très haute qualité6fps0dBHaute qualité15fps-0.5dBRapide42fps-0.74dBTemps réel54fps-1.21dBMatrices inter/intra personnalisées
Avec cette fonctionnalité de
libavcodec
vous pouvez rentrer des matrices personnalisées inter (I-frames/frames clé) et intra
(P-frames/frames prévu). La plupart des codecs supporte ceci - on rapporte que
mpeg1video et mpeg2video fonctionnent avec.
Cette fonctionnalité est utilisée habituellement pour régler les matrices utilisées
par les spécifications KVCD.
La Matrice de Quantification KVCD "Notch" :
Intra:
8 9 12 22 26 27 29 34
9 10 14 26 27 29 34 37
12 14 18 27 29 34 37 38
22 26 27 31 36 37 38 40
26 27 29 36 39 38 40 48
27 29 34 37 38 40 48 58
29 34 37 38 40 48 58 69
34 37 38 40 48 58 69 79
Inter:
16 18 20 22 24 26 28 30
18 20 22 24 26 28 30 32
20 22 24 26 28 30 32 34
22 24 26 30 32 32 34 36
24 26 28 32 34 34 36 38
26 28 30 32 34 36 38 40
28 30 32 34 36 38 42 42
30 32 34 36 38 40 42 44
Utilisation:
$ mencoder input.avi -o output.avi -oac copy -ovc lavc -lavcopts inter_matrix=...:intra_matrix=...
$ mencoder input.avi -ovc lavc -lavcopts
vcodec=mpeg2video:intra_matrix=8,9,12,22,26,27,29,34,9,10,14,26,27,29,34,37,
12,14,18,27,29,34,37,38,22,26,27,31,36,37,38,40,26,27,29,36,39,38,40,48,27,
29,34,37,38,40,48,58,29,34,37,38,40,48,58,69,34,37,38,40,48,58,69,79
:inter_matrix=16,18,20,22,24,26,28,30,18,20,22,24,26,28,30,32,20,22,24,26,
28,30,32,34,22,24,26,30,32,32,34,36,24,26,28,32,34,34,36,38,26,28,30,32,34,
36,38,40,28,30,32,34,36,38,42,42,30,32,34,36,38,40,42,44 -oac copy -o svcd.mpg
Exemple
Voilà, vous venez tout juste d'acheter votre exemplaire de 'Harry Potter et la
Chambre des Secrets' (édition écran large, bien sûr), et vous voulez ripper ce
DVD ceci afin de pouvoir l'ajouter à votre PC Home Cinéma. C'est un DVD de
région 1, donc en NTSC. L'exemple ci-dessous peut quand même être adapté au PAL,
si ce n'est que vous devrez retirer (parce que le
framerate de sortie est le même que celui en entrée), et bien sûr les dimensions
de découpage seront différentes.
Après avoir lancé , nous suivons le processus
détaillé dans la section Comment traiter le
téléciné et l'entrelacement dans les DVDs NTSC et découvrir que c'est une
vidéo progressive en 24000/1001 fps, ce qui signifie que nous n'aurons pas besoin
d'utiliser un filtre inverse téléciné, comme ou .
Ensuite, nous voulons déterminer le rectangle de recadrage approprié, donc
nous utilisons le filtre cropdetect:
mplayer dvd://1 -vf cropdetect
Cherchez une frame complètement remplie (comme une scène
lumineuse), et vous verrez dans la console de sortie de MPlayer:
crop area: X: 0..719 Y: 57..419 (-vf crop=720:362:0:58)
Rejouons ensuite le film avec le filtre pour tester le résultat:
mplayer dvd://1 -vf crop=720:362:0:58
Et nous nous apercevons que tout est parfait. Ensuite, nous nous assurons que
la hauteur et la largeur sont des multiples de 16. La largeur est bonne,
cependant la hauteur ne l'est pas. Vu que nous avons quelques notions minimales
de maths, nous savons que le plus proche multiple de 16 inférieur à 362
est 352.
Nous pourrions juste utiliser , mais il
serait mieux d'enlever un peu du haut et un peu du bas afin de garder
le centre. Nous avons rétréci la hauteur de 10 pixels, mais nous ne voulons
pas augmenter le décalage de 5 pixels vu que c'est un nombre impair et que
cela affectera défavorablement la qualité. A la place, nous augmenterons le
décalage y de 4 pixels:
mplayer dvd://1 -vf crop=720:352:0:62
Une autre raison pour retirer les pixels du haut et du bas est que nous nous
assurons que nous avons éliminé tous les pixels à moitié noir s'ils
existent. Notez que si votre vidéo est télécinée, assurez-vous que le filtre
(ou quelque soit le filtre inverse téléciné que vous
avez décidé d'utiliser) apparaissent dans la chaîne de filtres avant que vous
découpiez. Si il est entrelacé, dés-entrelacez-le avant découpage.
(Si vous choisissez de préserver la vidéo entrelacée, alors soyez certain que
votre décalage de découpage vertical est un multiple de 4.)
Si la perte de ces 10 pixels vous peine, vous pouvez, au lieu de réduire
les dimensions, prendre le plus proche multiple de 16.
La chaîne de filtres ressemblerait à ceci:
-vf crop=720:362:0:58,scale=720:352
Réduire la vidéo comme cela signifie qu'une petite quantité de détails est perdu
bien que cela ne soit probablement pas perceptible. Augmenter la taille
entraînera une qualité inférieure (à moins que vous n'augmentiez le bitrate).
Le redimensionnement sauvera l'ensemble de ces pixels. C'est une différence que vous
voudrez prendre en compte à chaque circonstance. Par exemple, si le DVD vidéo
était fait pour la télévision, vous pourriez avoir intérêt à éviter le
redimensionnement vertical, étant donné que la ligne d'échantillons correspond
à la manière d'origine avec laquelle le contenu a été enregistré.
Après vérification, nous voyons que notre film a un peu d'action et beaucoup de
détails, donc nous prenons 2400Kbit pour notre bitrate.
Nous sommes maintenant prêts à faire les deux passes d'encodage. Première passe:
mencoder dvd://1 -ofps 24000/1001 -oac copy -vf crop=720:352:0:62,hqdn3d=2:1:2 -ovc lavc \
-lavcopts vcodec=mpeg4:vbitrate=2400:v4mv:mbd=2:trell:cmp=3:subcmp=3:mbcmp=3:autoaspect:vpass=1 \
-o Harry_Potter_2.avi
La seconde passe est la même, si ce n'est que nous spécifions :
mencoder dvd://1 -ofps 24000/1001 -oac copy -vf crop=720:352:0:62,hqdn3d=2:1:2 -ovc lavc \
-lavcopts vcodec=mpeg4:vbitrate=2400:v4mv:mbd=2:trell:cmp=3:subcmp=3:mbcmp=3:autoaspect:vpass=2 \
-o Harry_Potter_2.avi
Les options augmenteront considérablement la
qualité au dépend de la durée d'encodage. Il y a peu de raison de ne pas
prendre en compte ces options quand le but premier est la qualité. Les options
choisissent une fonction de comparaison
qui rend une plus haute qualité que celle par défaut. Vous pouvez tenter d'expérimenter
avec ces paramètres (reportez-vous à la page man pour les valeurs possibles)
étant donné que différentes fonctions peuvent avoir un large impact sur la
qualité selon le matériel source. Par exemple, si vous trouvez que
libavcodec produit trop d'artefacts
carrés, vous pouvez essayer de choisir le NSSE expérimental comme fonction
de comparaison via .
Pour ce film, le AVI résultant durera 138 minutes et pèsera à peu près 3GB.
Si vous disiez que la taille du fichier n'était pas importante, cette taille
est parfaitement acceptable. Cependant, si vous la souhaitez plus petite,
vous pouvez essayer un bitrate inférieur. Les augmentations de bitrates ont des
effets amoindris, tandis que nous pourrons clairement voir une
amélioration à partir de 1800Kbit jusqu'à 2000Kbit, cela ne semblera pas
tellement rentable notablement au-dessus de 2000Kbit. Libre à vous
d'expérimenter jusqu'à totale satisfaction.
Parce que nous avons passé la source vidéo au travers d'un filtre antibruit,
vous aimerez en rajouter un peu pendant la lecture. Ceci, avec le filtre de
post-traitement , améliore de façon radicale la perception
de qualité et aide à éliminer les artefacts carrés de la vidéo.
Avec l'option de MPlayer,
vous pouvez faire varier le montant de post-traitement achevé par le filtre spp
selon le CPU disponible. Aussi, à ce point, pourriez-vous vouloir demander
une correction gamma et/ou couleur qui convient mieux à l'affichage. Par exemple:
mplayer Harry_Potter_2.avi -vf spp,noise=9ah:5ah,eq2=1.2 -autoq 3Encodé avec le codec XviDXviD est une bibliothèque libre pour
encoder les flux vidéo de MPEG-4 ASP.
Avant de commencer à encoder, vous avez besoin de
paramétrer MEncoder pour son support.
Ce guide a pour principal objectif de fournir le même genre d'information que
le guide d'encodage de x264.
Par conséquent, commencez par lire
la première partie
de ce guide.
Quelles options devrais-je utiliser pour avoir les meilleurs résultats?
Commencez par passer en revue la page man de la section
XviD de MPlayer.
Cette section est prévue pour être un supplément à la page man.
Les paramètres XviD par défaut font déjà une bonne distinction entre la
vitesse et la qualité, donc vous pouvez sans risque vous en tenir à eux
si la section suivante vous laisse perplexe.
Options d'encodage de XviDvhq
Ce paramètre affecte l'algorithme de choix de macrobloc, où plus la valeur
du paramètre est élevée, meilleure sera la décision.
Le paramètre par défaut peut être utilisé de façon sûre pour tous les encodages,
alors que des paramètres plus élevés aident toujours le PSNR mais sont significativement
plus lents.
Veuillez noter qu'un meilleur PSNR ne veut pas forcément dire que l'image
sera mieux, mais vous informe de la proximité par rapport à l'image originale.
Désactiver l'option accélérera de façon notable l'encodage; si la vitesse est un point
critique pour vous, la différence peut valoir le coup.
bvhq
C'est pareil que vhq, mais cela agit sur les B-frames.
L'impact sur la vitesse est négatives, et la qualité est un peu améliorée
(environ +0.1dB PSNR).
max_bframes
Un plus grand nombre de B-frames consécutives permis améliore habituellement
la compressibilité, bien qu'il puisse également entraîner plus d'artefacts carrés.
Le paramétrage par défaut est un bon compromis entre compressibilité et qualité,
mais vous pouvez l'augmenter jusqu'à 3 si vous êtes obnubilé par le bitrate.
Vous pouvez aussi le réduire à 1 ou 0 si vous avez pour seul but la qualité
parfaite, cependant dans votre cas vous devriez vous assurer que le bitrate
cible est assez élevé pour que l'encodeur n'ait pas à augmenter le
quantificateur pour l'atteindre.
bf_threshold
Ceci contrôle la sensibilité de l'encodeur pour les B-frames, où une plus haute
valeur amène à ce que plus de B-frames soit utilisé (et vice versa).
Ce paramètre doit être utilisé avec ;
si vous êtes obnubilé par le bitrate, vous devrez augmenter
et , tandis que vous devriez augmenter
et réduire ainsi donc l'encodeur peut utiliser plus de B-frames
aux seuls endroits qui les nécessitent vraiment.
Un nombre bas de et une valeur élevée de
n'est probablement pas un choix avisé vu qu'il obligera l'encodeur à mettre
des B-frames en des endroits qui n'en tireront pas de bénéfice, mais en plus
réduiront la qualité visuelle.
Cependant, si vous avez besoin d'être compatible avec des lecteurs qui
supportent seulement de vieilles versions DivX (ce qui revient à supporter jusqu'à
1 B-frame consécutive), ceci sera votre seul espoir d'augmenter la
compressibilité en utilisant les B-frames.
trellis
Optimise la procédure de quantification pour obtenir un compromis optimal
entre le PSNR et le bitrate, ce qui permet de sauver de manière significative
des bits.
Ces bits seront en retour utilisés autre part sur la vidéo, augmentant l'ensemble
de la qualité visuelle.
Vous devriez toujours l'utiliser étant donné qu'il impacte énormément sur la
qualité.
Même si vous recherchez de la vitesse, ne le désactivez pas jusqu'à ce que
vous réduisiez et toutes les autres options plus gourmandes
en CPU à leur minimum.
hq_ac
Active une meilleure méthode d'estimation du coût en coefficient, ce qui réduit
passablement la taille de fichier par environ 0.15 à 0.19% (ce qui correspond
à moins de 0.01dB PSNR d'augmentation), tandis qu'elle a un impact négligeable
sur la vitesse.
Il est néanmoins recommandé de toujours la laisser activée.
cartoon
Faite pour un meilleur encodage de contenu dessin animé, et n'a pas d'impact
sur la vitesse étant donné qu'il modifie juste les heuristiques
pour ce type de contenu.
me_quality
Ce paramètre contrôle la précision de l'estimation de mouvement.
Le plus élevé est, le plus précis
l'estimation du mouvement d'origine sera, et mieux le clip résultant
capturera le mouvement d'origine.
Le paramètre par défaut est le mieux dans tous les cas; bien qu'il ne
soit pas recommandé de le désactiver à moins que vous recherchiez vraiment
la rapidité, vu que tout les bits sauvés par une bonne estimation du
mouvement seront dépensés autre part, augmentant la qualité générale.
Cependant, n'allez pas plus bas que 5, et même ceci doit être utilisé
en dernier recours.
chroma_me
Améliore l'estimation de mouvement en prenant aussi en compte l'information
de la chroma (couleur), alors que toute seule
utilise seulement la luma (niveau de gris).
Cela ralenti l'encodage de 5-10% mais améliore pas mal la qualité visuelle
en réduisant les effets de bloc et réduit la taille de fichier d'environ 1.3%.
Si vous cherchez de la vitesse, vous devriez désactiver cette option avant de
commencer à considérer à la réduction de .
chroma_opt
A pour objectif d'augmenter la qualité du chroma de l'image vers des
bords blanc/noirs pures, plutôt que d'améliorer la compression.
Ceci peut aider à réduire l'effet "red stairs".
lumi_mask
Tente de donner moins de bitrate à une partie de l'image que l'oeil humain
ne peut pas très bien voir, ce qui devrait permettre à l'encodeur de dépenser
les bits sauvés sur des parties plus importantes de l'image.
La qualité de l'encodage liée à cette option dépend grandement des
préférences personnelles et des paramètres de type et moniteurs utilisés pour
le regarder (typiquement, cela ne semblera pas aussi bon si c'est plus
lumineux ou si c'est un moniteur TFT).
qpel
Élève le nombre de vecteurs de mouvement candidats en augmentant la
précision de l'estimation de mouvement de halfpel (demi-pixel) à quarterpel (quart de pixel).
L'idée est de trouver de meilleurs vecteurs de mouvement pour
réduire le bitrate (ou augmenter la qualité à bitrate constant).
Cependant, les vecteurs de mouvement avec une précision quarterpel requièrent
quelques bits en plus à coder, mais les vecteurs candidats ne donnent pas
toujours des résultats vraiment meilleurs.
Assez souvent, le codec gaspille encore des bits sur la précision en plus,
mais en retour il n'y aura que peu ou pas de qualité supplémentaire.
Malheureusement, il n'y a aucune façon de prévoir les avantages possible de
, donc vous avez précisément besoin de l'encoder avec
et sans pour en être sûr.
peut quasiment doubler la durée d'encodage, et ne
requiert pas moins de 25% de puissance processeur en plus pour décoder.
Cela n'est pas supporté par tous les lecteurs.
gmc
Essaie de sauver des bits sur des scènes panoramiques en employant un
vecteur simple de mouvement pour la frame entière.
Cela augmente à peu près toujours le PSNR, mais ralentit l'encodage
de façon significative (et aussi le décodage).
Par conséquent, vous devriez seulement l'employer si vous avez
augmenté au maximum.
Le GMC de XviD est plus sophistiqué
que celui de DivX, mais il est seulement supporté par quelques lecteurs.
Profils d'encodage
XviD supporte des profils d'encodage via l'option ,
ce qui est utilisé pour imposer des restrictions sur les propriétés du flux
vidéo XviD pour qu'il puisse être relu sur tout ce qui supporte le profil
choisi.
Les restrictions relient les résolutions, les bitrates et certaines
fonctionnalités MPEG-4.
La table suivante montre ce que chaque profil supporte.
SimpleSimple avancéDivXNom de profil0123012345HandheldNTSC PortablePAL PortableNTSC Home CinémaPAL Home CinémaTV Haute DéfinitionLargeur [pixels]1761763523521761763523523527201763523527207201280Hauteur [pixels]144144288288144144288288576576144240288480576720Frame rate [fps]15151515303015303030153025302530Bitrate moyen maxi [kbps]646412838412812838476830008000537.648544854485448549708.4Bitrate moyen maximal plus de 3 secs [kbps]800800080008000800016000B-frames maxi0000011112Quantification MPEGXXXXXXQuantification adaptativeXXXXXXXXXXXXEncodage entrelacéXXXXXXXXXQuaterpixelXXXXXXCompensation globale du mouvementXXXXXXExemples de paramètres d'encodage
Les paramètres suivant sont des exemples de différentes combinaisons
d'option d'encodage qui affectent la compensation entre la vitesse et
la qualité pour le même bitrate cible.
Tous les paramètres d'encodage ont été testés sur un échantillon vidéo à
720x448 @30000/1001 fps, le bitrate cible était à 900kbps, et la machine
était un AMD-64 3400+ à 2400 Mhz en mode 64 bits.
Chaque paramètre d'encodage exploite la vitesse d'encodage mesuré (en
frames par seconde) et la perte PSNR (en dB) en la comparant au paramètre
de "très haute qualité".
Veuillez comprendre que selon votre source vidéo, votre type de machine
les développements logiciels, vous pouvez obtenir des résultats très
différents.
DescriptionOptions d'encodagevitesse (en fps)Perte PSNR relative (en dB)Très haute qualité16fps0dBHaute qualité18fps-0.1dBRapide28fps-0.69dBTemps réel38fps-1.48dBEncodage avec le codec x264x264 est une librairie libre pour
encoder des flux vidéo H.264/AVC.
Avant de commencer à encoder, vous avez besoin de
régler MEncoder pour le supporter.
Options d'encodage de x264
Veuillez commencer par passer en revue la section
x264 de la page man
de MPlayer.
Cette section a été prévue pour être un complément à la page man.
Vous trouverez ici rapidement des astuces sur le genre d'options qui est
le plus susceptible d'intéresser la plupart des gens. La page man
est plus laconique, elle est aussi plus exhaustive, et cela offre
parfois beaucoup plus de détails techniques.
IntroductionCe guide considère deux catégories majeures d'options d'encodage:Options qui principalement compensent la durée d'encodage de la qualité
Options qui peuvent être utiles pour accomplir des préférences personnelles
variées et des conditions spéciales
Finalement, seul vous pouvez décider quelles options permettent d'atteindre vos buts.
Le choix de la première classe d'options est la plus simple:
vous devez seulement décider si vous pensez que les différences de qualité
justifient les différences de vitesse. Pour la deuxième classe d'options,
les préférences peuvent être bien plus subjectives, et plus de facteurs
peuvent être impliqués. Notez que certaines des options de type
"préférences personnelles et de conditions spéciales" peuvent encore avoir
un impact impact sur la vitesse ou la qualité, mais ce n'est pas là leur
principale utilité. Quelques unes des options de "préférence
personnelle" peuvent même causer des changements qui semblent mieux pour
certaines personnes, mais semblent moins bon à d'autres.
Avant de continuer, il vous est nécessaire de comprendre que ce guide utilise seulement
une qualité métrique: le PSNR global.
Pour une brève explication sur le PSNR, voir
l'article Wikipedia sur le PSNR.
PSNR global est le dernier nombre PSNR rapporté quand vous incluez l'option
dans .
Chaque fois que vous lisez une réclamation sur le PSNR, une des prétentions
derrière la réclamation est que des bitrates égaux sont utilisés.
A peu près tous les commentaires de ce guide présument que vous utilisez
deux passages.
Lors de la comparaison des options, il y a deux principales raisons pour
l'utilisation d'un encodage en deux passes.
Premièrement, utiliser deux passes permet souvent de gagner environ 1dB
PSNR, ce qui est une très grosse différence.
Deuxièmement, tester les options en faisant des comparaisons directes de
qualité avec un encodage en un passage introduit un facteur confus important:
le bitrate varie souvent de façon significative avec chaque encodage.
Il n'est pas toujours facile de dire si les changements de qualité sont
principalement dûs aux changements d'options, ou si la plupart du temps ils
reflètent essentiellement des différences aléatoires dans le bitrate réalisé.
Options qui affectent principalement la vitesse et la qualitésubq:
Des options qui vous permettent de compenser la vitesse pour la qualité,
et (voir ci-dessous) sont
habituellement et de loin les plus importantes.
Si vous êtes intéressés par le bidouillage soit de la vitesse soit de la
qualité, ces options sont les premières que vous devriez prendre en
considération.
A propos de la dimension de la vitesse, les options
et interagissent entre elles assez fortement.
L'expérience montre que, avec une frame de référence,
(le réglage par défaut) est environ 35% plus lent que
.
Avec 6 frames de référence, la pénalité passe au dessus des 60%.
L'effet de sur le PSNR semble assez constant
indépendamment du nombre de frames de référence.
Typiquement, résulte en un PSNR global plus haut de
0.2-0.5 dB en comparaison à .
C'est habituellement assez pour être évident.
est le plus lent, le plus élevé mode de qualité.
En comparaison à , il gagne habituellement un PSNR
global de 0.1-0.4 dB avec des coûts en vitesse variant entre 25% et 100%.
A la différence des autres niveaux de , le comportement
de ne dépend pas beaucoup de
et . A la place, l'efficacité de
dépend principalement du nombre de B-frames utilisées. Lors d'une utilisation
normale, cela signifie que a un large impact sur la
vitesse et la qualité dans le cas complexe, des scènes avec beaucoup de mouvements,
mais il peut ne pas avoir beaucoup d'effets sur les scènes avec peu de mouvements.
Notez qu'il est encore recommandé de toujours régler les
à d'autres valeurs que zéro (voir ci-dessous).
frameref:
est réglé à 1 par défaut, mais cela ne veut pas dire
qu'il est raisonnable de le laisser à 1.
La simple augmentation de à 2 permet un gain de PSNR d'environ
0.15dB, avec une pénalité de 5-10% sur la vitesse; cela semble être
un bon compromis.
gagne environ 0.25dB de PSNR de mieux que
, ce qui devrait être une différence visible.
est d'environ 15% plus lent que .
Malheureusement, des retours diminuant se mettent en place rapidement.
peut entraîner un gain de seulement 0.05-0.1 dB
de mieux que avec une pénalité de
15% sur la vitesse.
Au delà de , les gains en qualité sont
habituellement très faible (bien que vous deviez garder à l'esprit
que toute cet avis est à modérer selon la source vidéo utilisée).
Dans un cas typique, améliorera le PSNR
global d'un minuscule 0.02dB de mieux que ,
avec un surcoût sur la vitesse de 15%-20%.
Avec des valeurs aussi élevées de , la seule vraie bonne
chose qui puisse être dite est que de l'augmenter même un peu plus ne
nuira quasiment jamais au PSNR,
mais les bénéfices sur la qualité additionnelle sont à peine mesurables, et encore
moins perceptibles.
Note:
Augmenter le à des valeurs inutilement élevées
peut affecter et habituellement affecte
l'efficacité d'encodage si vous désactivez le CABAC.
Avec le CABAC activé (comportement par défaut), il n'y a pas vraiment de risque
qu'un réglage de "trop élevé" diminue l'efficacité
de l'encodage, et dans l'avenir, des optimisations pouront peut-être
rendre ce risque nul.
Si vous vous inquiétez pour la vitesse, un compromis raisonnable est
d'utiliser des valeurs et basses
sur le premier passage, et ensuite les augmenter sur le second passage.
Typiquement, cela a un effet négatif négligeable sur la qualité finale.
Vous perdrez probablement bien moins de 0.1dB du PSNR, ce qui devrait
être une différence beaucoup trop faible pour être visible.
Cependant, des valeurs différentes de peuvent
parfois affecter le choix du type de frame.
Très probablement, ce sont des cas périphériques rares, mais si vous voulez
en être complètement certain, considérez que votre vidéo a soit des modèles
plein écran, clignotants et répétitifs, soit des occlusions provisoires très
grandes qui forcent une I-frame.
Ajustez le de premier passage pour qu'il soit assez
large pour contenir la durée du cycle de clignotement (ou occlusion).
Par exemple, si la scène clignote dans les deux sens entre deux images
au-dessus d'une durée de trois frames, réglez le de
premier passage à 3 ou plus.
Le problème est probablement extrêmement rare sur des matériaux vidéo de type
action en directe, mais cela arrive quelquefois dans des captures de jeu vidéo.
me:
Cette option est utilisée pour choisir une méthode de recherche d'estimation de mouvement.
Cette option modifie de manière notable le rapport entre qualité et vitesse.
est seulement quelques pour cent plus rapide que
la recherche par défaut et entraîne une diminution du PSNR global inférieure à 0.1dB. Le
paramètre par défaut () est offre un compromis raisonnable
entre vitesse et qualité. améliore de moins de 0.1dB le
PSNR global - la pénalité sur la vitesse varie en fonction
du . Pour de hautes valeurs du
(par exemple 12 ou plus), est environ 40% plus lent que la
valeur par défaut . Avec ,
la pénalité sur la vitesse chute dans les 25%-30%.
utilise une recherche exhaustive qui est trop lente pour
une utilisation pratique.
4x4mv:
Cette option active l'utilisation des sous-partitions 8x4, 4x8 et 4x4 dans
les macroblocs prévus. L'activer résulte en une perte de vitesse habituellement
dans les 10% à 15%. Cette option est plutôt inutile pour une source contenant
peu de mouvements, bien que dans certaines sources riches en mouvements,
ou bien des sources avec beaucoup de petits objets en mouvement, un
gain d'environ 0.1dB peut être espéré.
bframes:
Si vous avez l'habitude d'encoder avec d'autre codecs, vous pourriez penser
que les trames-B ne sont pas toujours utiles.
Avec le H.264, ceci a changé: il y a de nouvelles techniques et types de blocs
qui sont possibles avec les trames-B.
Habituellement, même un choix naïf d'algorithme de trames-B peut avoir un
bénéfice significatif sur le PSNR.
Il est intéressant de noter que l'utilisation de trames-B accélère
habituellement légèrement la seconde passe, et peut aussi accélérer
l'encodage en un seul passage si le choix de trames-B adaptatif est désactivé.
Avec le choix de trames-B adaptatif désactivé
(l'option de ),
le réglage optimal est habituellement inférieur à
, sinon les scènes riches en mouvement vont en souffrir.
Avec le choix de B-frame adaptatif activé (le comportement par défaut), cela
ne pose plus de problème d'utiliser des valeurs plus élevées;
l'encodeur réduira l'utilisation de trames-B dans les scènes pour lesquelles
cela risque de diminuer la qualité.
L'encodeur choisi rarement d'utiliser plus de 3 ou 4 trames-B;
paramétrer cette option à une valeur plus élevée aura peu d'effet.
b_adapt:
Note: il est activé par défaut.
Avec cette option activée, l'encodeur décidera quand réduire le nombre
de trames-B utilisées dans les scènes pour lesquelles ces trames
n'apporteraient rien.
Vous pouvez utiliser pour tempérer la tendance
de l'encodeur à insérer des trames-B.
Le surcoût sur la vitesse des trames-B adaptatives est actuellement
plutôt modeste, mais il en est de même pour le gain de qualité potentiel.
En général, cela ne fait pas de mal...
Notez que cela affecte seulement la vitesse et le choix du type de trames
lors de la première passe.
Les options et n'ont pas
d'effet lors des passages suivants.
b_pyramid:
Vous pouvez aussi activer cette option si vous utilisez >=2 trames-B;
comme l'indique la page man, vous obtiendrez une faible amélioration de la
qualité sans surcoût en vitesse.
Notez que ces vidéos ne peuvent pas être lues avec les décodeurs utilisant
une version de libavcodec antérieur au 5 mars 2005.
weight_b:
En théorie, il n'y a beaucoup de gain à espérer de cette option.
En effet, dans des scènes de fondu ou de fondu au noir, la prédiction
pondérée permet d'économiser beaucoup de bitrate.
Dans le MPEG-4 ASP, un fondu-au-noir est souvent mieux compressé comme une
coûteuse série de I-frames; utiliser la prédiction pondérée pour les
trames-B permet d'en convertir une partie en plus petites B-frames.
Le coût sur la durée d'encodage est minimal, étant donné qu'aucun choix
supplémentaire n'a besoin d'être fait.
Aussi, contrairement à ce que les gens croient deviner, les besoins en CPU par
le décodeur ne sont pas énormément affecté par la prédiction pondérée, toutes
choses étant égales par ailleurs.
Malheureusement, l'algorithme actuel de choix de trames-B adaptative
a une forte tendance à éviter les trames-B pendant les fondus.
Tant que ce sera le cas, ajouter
à votre x264encopts sera une bonne idée si vous pensez que les
fondus vont avoir un gros effet dans votre vidéo.
Options diverses et/ou dépendant des goûts de chacunEncodage en deux passes:
On a suggéré ci-dessus de toujours utiliser un encodage en deux passages,
mais il y a reste quelques cas pour ne pas l'utiliser. Par exemple, si vous
capturez la télévision en direct et que vous l'encodez en temps réel, vous
êtes obligé d'utiliser un encodage mono-passe.
Aussi, une compression en une passe est évidemment plus rapide qu'une en deux
passes pour un jeu d'options donné - un encodage en deux passes est presque deux
fois plus lent qu'un encodage en une passe.
Cependant, il y a de très bonnes raisons pour utiliser l'encodage en deux passages.
D'une part, le taux de contrôle d'un seul passage ne peut pas prédire le futur, il
fait donc souvent des choix sous-optimaux parce qu'il ne peut pas voir l'ensemble
de la vidéo. Par exemple, supposez que vous ayez une vidéo de deux minutes
consistant en deux moitiés distinctes. La première moitié est une scène
riche en mouvements pendant 60 secondes, ce qui, hors de tout contexte, demande
environ 2500kbps afin d'avoir l'air correct.
Une scène de 60 secondes beaucoup plus statique suit et peut être très bien à
300kbps. Supposez que vous demandiez 1400kbps sur la
théorie que ceci soit suffisant pour les deux scènes. Un taux de
contrôle en un seul passage fera quelques "fautes" dans un cas comme celui-là.
Premièrement, il essaiera de viser 1400kbps pour les deux segments. Alors que le
premier segment va manquer de bits et donc avoir beaucoup d'artefacts de blocs,
le second segment va avoir trop de bits et les gaspiller. Ceci est d'autant plus difficile
à éviter que le problème se produit à la transition entre les deux scènes. Les premières
secondes de la seconde partie vont être grandement sur-quantifiés, parce que
le taux de contrôle suppose qu'il va avoir les mêmes besoins en bitrate que pour
la première moitié de la vidéo. Cette "période d'erreur" de sur-quantification pour
les mouvements faibles va étrangement mauvais, et utilisera en réalité moins
que les 300kbps qu'il aurait pris pour le rendre correct. Il y a des façons
d'atténuer les pièges de l'encodage en simple passe, mais ils peuvent avoir
tendance à empirer la mauvaise prédiction de bitrate.
Le taux de contrôle en multi-passes apporte d'énormes avantages sur une
compression mono-passe. En utilisant les statistiques récupérées depuis le
premier passage d'encodage, l'encodeur peut estimer, avec exactitude, le "coût"
(en bits) de l'encodage de n'importe quelle frame donnée, à n'importe quel
quantificateur donné. Cela permet d'avoir une allocation de bits beaucoup plus
rationnelle car mieux planifiée entre les scènes riches (beaucoup de
mouvements) et celles pauves en détails (peu de mouvements). Voir
ci-dessous pour quelques suggestions sur la manière
d'adapter cette allocation à vos besoins.
De plus, la compression en deux passes ne prend pas nécessairement deux fois plus de temps
que celle mono-passe. Vous pouvez jouer avec les options dans le première passe
pour avoir une vitesse plus élevée et une qualité plus faible.
Si vous choisissez bien vos options, vous pouvez obtenir un premier passage
très rapide.
La qualité résultante de la seconde passe sera légèrement plus basse parce
que la prédiction de taille sera moins précise, mais la différence de qualité
sera usuellement trop faible pour être visible. Essayez, par exemple,
d'ajouter au premier passage .
Ensuite, sur le second passage, utilisez des options plus lentes pour avoir une
meilleure qualité:
Encodage en trois passages?
x264 offre la possibilité de faire un nombre arbitraire de passages consécutifs.
Si vous spécifiez lors de la première passe, alors
utilisez pour la passe suivante, cette passe
lira les statistiques calculées lors du passage précédent, et écrira ses propres
statistiques. Une passe suivante aura une très bonne base depuis laquelle
faire des prédictions très précises de tailles de trame pour un quantificateur donné.
En pratique, les gains sur la qualité d'ensemble sont plutôt proches de zéro,
il est même possible qu'une troisième passe dégrade le PSNR global...
Pour utilisation typique, trois passages aident si vous obtenez une mauvaise
prédiction de bitrate ou un mauvais rendu lors des transitions de scènes
lors de l'utilisation de seulement deux passages.
Ceci peut se produire sur les clips extrêmement courts. Il y a aussi quelques
cas spéciaux dans lesquels trois (ou plus) passages sont utiles pour les
utilisateurs avancés, mais par souci de brièveté, ce guide ne traitera pas
ces cas spéciaux.
qcomp:
compense le nombre de bits alloués entre les trames
coûteuses car riches en mouvement et celles pauvres en mouvement. Dans
les cas extrêmes, vise un vrai bitrate constant.
Typiquement, cela rendrait des scènes riches en mouvements vraiment laides,
alors que les scènes plus statiques seraient absolument parfaites, mais cela
utiliserait aussi beaucoup plus de bits que nécessaire pour les rendre excellentes.
A l'autre extrême, rend les paramètres de quantifications
(QP) presque constants. Un QP constant n'a pas l'air mauvais, mais la plupart des
gens pensent qu'il est plus raisonnable d'enlever quelques bits des scènes
coûteuses (car la perte de qualité sera moins visible) et les ré-allouer
aux scènes qui sont plus faciles à encoder pour qu'elles aient une excellente qualité.
vaut 0.6 par défaut, ce qui peut être un
peu trop faible pour certains (des valeurs entre 0.7-0.8 sont aussi communément
utilisées).
keyint:
est seulement là pour permetre de jouer sur le compromis entre la
précision de la navigation dans les fichiers et leur compression.
Par défaut, est égal à 250.
Sur des sources à 25 fps, cela garantit que la navigation peut se faire
avec une précision de 10 secondes.
Si vous pensez qu'il est important et utile de pouvoir faire une recherche
avec une granularité de 5 secondes, mettez cette option à ;
cela dégradera un peu la qualité/bitrate. Si vous vous souciez seulement
de la qualité et non de la capacité à faire une recherche, vous pouvez le
mettre à des valeurs beaucoup plus élevées (mais gardez à l'esprit que plus
vous augmenterez, moins il aura de gain visuels).
Le flux vidéo aura encore des points de recherche à chaque changement de
de scène.
deblockalpha, deblockbeta:
Ce sujet risque d'être une source de controverses.
H.264 définit une procédure simple pour retirer les blocs sur les I-blocs
qui utilisent des forces et des seuils pré-régléss en fonction du QP du
bloc en question.
Par défaut, les blocs QP élevés sont fortement filtrés, les blocs à bas QP
ne seront pas "débloqués" du tout.
Les pré-réglages de force définies par les standards sont bien choisis et
il y a de grandes chances qu'elles aient des PSNR optimaux quel que soit la
vidéo que vous compressez.
Les paramètres et
permettent de spécifier des offsets par rapport aux seuils de "déblocage"
pré-définis.
Il semble que beaucoup de gens pensent que baisser la force du filtre de
"déblocage" de beaucoup (par exemple -3) est une bonne idée.
Ce n'est cependant presque jamais une bonne idée, et dans la plupart des cas,
ceux qui font cela ne comprennent pas très bien comment le déblocage
fonctionne par défaut.
La première et plus importante chose à savoir à propos du filtre de déblocage
in-loop est que les seuils par défaut sont à peu près toujours optimaux du point de vue du PSNR.
Dans les rares cas où ce n'est pas le cas, le décalage idéal est de plus ou
moins 1.
Ajuster les paramètres de déblocage avec une quantité plus importante a de forts
risques de dégrader le PSNR.
Renforcer le filtrage fera disparaître plus de détails; l'affaiblissement du filtre
augmentera la visibilité des blocs.
C'est une mauvaise idée que de baisser les seuils de déblocage si
votre source est de complexité spatiale basse (c-à-d avec peu de
détails ou de bruit).
Le filtre in-loop fait un travail plutôt bon en cachant les artefacts
qui se produisent.
Cependant, si la source a une complexité spatiale élevée, les
artefacts sont moins apparents.
Ceci vient du fait que "ringing" tend à ressembler à du détail
ou du bruit.
La vision humaine remarque facilement qu'un détail a été enlevé
mais elle le remarque plus difficilement s'il y a du bruit faussement
représenté.
Subjectivement, le bruit et les détails sont quelque peu interchangeables.
En baissant la force du filtre de déblocage, vous allez très probablement
avoir des erreurs croissantes en ajoutant des artefacts de ringing mais
l'oeil ne les remarquera pas parce qu'il les confondra avec des détails.
Ceci ne justifie toujours pas de diminuer
la force du filtre de déblocage.
Vous pouvez généralement obtenir une meilleure qualité de bruit lors du
post-traitement.
Si votre encodage en H.264 est trop flou ou sale, essayez de lui rajouter
quand vous jouez votre film encodé.
devrait cacher la plupart des artefacts
simples.
Cela aura l'air certainement mieux ce que ous obtiendriez en jouant
juste avec le filtre de déblocage.
Exemples de paramètre d'encodage
Les paramètres ci-dessous sont des exemples de différentes combinaisons
d'option de compression illustrant le compromis entre vitesse et
qualité pour un même bitrate.
Tous les paramètres d'encodage sont testés sur un échantillon vidéo à
720x448 @30000/1001 fps, le bitrate cible est à 900kbps, et la machine
est un AMD-64 3400+ à 2400 Mhz en mode 64 bits.
Chaque paramètre d'encodage exploite la vitesse de compression mesurée (en
frames par seconde) et la perte PSNR (en dB) en la comparant au paramètre
de "très haute qualité".
Veuillez comprendre que selon votre source, le type de votre machine et
les derniers développements logiciels, vous pourrez obtenir des résultats
très différents.
DescriptionOptions d'encodagevitesse (en fps)Perte PSNR relative (en dB)Très haute qualité6fps0dBHaute qualité13fps-0.89dBRapide17fps-1.48dBUtiliser MEncoder pour créer des fichiers conforme VCD/SVCD/DVD.Contraintes de FormatMEncoder est capable de créer des fichiers MPEG
au format VCD, SCVD et DVD en utilisant la bibliothèque
libavcodec.
Ces fichiers peuvent ensuite être utilisés avec
vcdimager
ou
dvdauthor
pour créer des disques lisibles par une platine de salon standard.
Les formats DVD, SVCD, et VCD sont sujets à de lourdes contraintes.
Seule une petite sélection des tailles d'image encodée et taux d'aspect
est disponible.
Si votre film ne respecte pas déjà ces conditions, vous pouvez
avoir à dimensionner, découper ou ajouter des bords noirs à l'image pour
la rendre conforme.
Contraintes de formatFormatRésolutionV. CodecV. BitrateTaux d'échantillonnageA. CodecA. BitrateFPSAspectNTSC DVD720x480, 704x480, 352x480, 352x240MPEG-29800 kbps48000 HzAC3,PCM1536 kbps (max)30000/1001, 24000/10014:3, 16:9 (seulement pour 720x480)NTSC DVD352x240
Ces résolutions sont rarement utilisées pour les DVDs
parce qu'ils ont une assez basse qualité.MPEG-11856 kbps48000 HzAC3,PCM1536 kbps (max)30000/1001, 24000/10014:3, 16:9NTSC SVCD480x480MPEG-22600 kbps44100 HzMP2384 kbps (max)30000/10014:3NTSC VCD352x240MPEG-11150 kbps44100 HzMP2224 kbps24000/1001, 30000/10014:3PAL DVD720x576, 704x576, 352x576, 352x288MPEG-29800 kbps48000 HzMP2,AC3,PCM1536 kbps (max)254:3, 16:9 (seulement pour 720x576)PAL DVD352x288MPEG-11856 kbps48000 HzMP2,AC3,PCM1536 kbps (max)254:3, 16:9PAL SVCD480x576MPEG-22600 kbps44100 HzMP2384 kbps (max)254:3PAL VCD352x288MPEG-11152 kbps44100 HzMP2224 kbps254:3
Si votre film a un aspect 2.35:1 (la plupart des films d'action récents), vous
devrez ajouter des bords noirs ou découper le film à un aspect 16:9
pour faire un DVD ou un VCD.
Si vous ajoutez des bords noirs, essayez de les aligner aux frontières de
16-pixels de façon à minimiser l'impact sur la performance d'encodage.
Le DVD a heureusement un bitrate suffisamment élevé pour que vous n'ayez pas trop
à vous inquiéter pour l'efficacité de l'encodage, mais le SVCD et le VCD sont
gaspillent tellement de bitrate qu'ils demandent beaucoup d'efforts pour avoir
une qualité acceptable.
Contraintes de Taille GOP
DVD, VCD, et SVCD vous contraignent aussi à des tailles relativement basses
de GOP (Group of Pictures ou "Groupe d'Images").
Pour des matériaux à 30 fps la plus large taille de GOP permise est 18.
Pour 25 ou 24 fps, le maximum est 15.
La taille du GOP est réglée en utilisant l'option .
Contraintes de Bitrate
Une vidéo VCD doit être nécessairement en CBR à 1152 kbps.
Cette contrainte grandement limitante vient aussi avec une taille du buffer
vbv de 327 kilobits extrêmement basse.
SVCD permet de varier des bitrates vidéo jusqu'à 2500 kbps, et une taille du buffer vbv légèrement
moins restrictive de 917 kilobits est permise.
Les bitrates de vidéo DVD peuvent aller jusqu'à 9800 kbps
(bien que les bitrates typiques valent à peu près la moitié de ça), et la taille
du buffer vbv est 1835 kilobits.
Options de sortieMEncoder a des options de contrôle du format
de sortie.
En utilisant ces options nous pouvons lui dire de créer le type correct de
fichier.
Les options pour le VCD et le SVCD sont appelées xvcd et xsvcd, parce que ce
sont des formats étendus.
Elles ne sont pas strictement conforme, principalement parce que la sortie
ne contient pas de décalages de scan.
Si vous avez besoin de générer une image SVCD, vous devriez passer le fichier
de sortie à vcdimager.
VCD:
-of mpeg -mpegopts format=xvcd
SVCD:
-of mpeg -mpegopts format=xsvcd
DVD:
-of mpeg -mpegopts format=dvd
DVD avec NTSC étiré:
-of mpeg -mpegopts format=dvd:telecine -ofps 24000/1001
Ceci permet au contenu progressif à 24000/1001 fps d'être encodé à
30000/1001 fps tout en conservant le support DVD.
Rapport d'aspect
L'argument d'aspect est utilisé pour encoder
le rapport d'aspect du fichier.
Durant la lecture le rapport d'aspect est utilisé pour redonner à la vidéo
la taille correcte.
16:9 ou "Écran Large"
-lavcopts aspect=16/9
4:3 ou "Plein Écran"
-lavcopts aspect=4/3
2.35:1 ou NTSC "Cinémascope"
-vf scale=720:368,expand=720:480 -lavcopts aspect=16/9
Pour calculer la taille correcte de dimensionnement, utilisez la largeur
étendu NTSC de 854/2.35 = 368
2.35:1 ou PAL "Cinémascope"
-vf scale="720:432,expand=720:576 -lavcopts aspect=16/9
Pour calculer la taille correcte de dimensionnement, utilisez la largeur
étendu PAL de 1024/2.35 = 432
Conversion du Taux d'échantillonnage
Si le taux d'échantillonnage de l'audio du fichier original n'est pas le même
que celui demandé par le format cible, la conversion du taux d'échantillonnage
est requis.
Ceci est réalisé en utilisant ensemble l'option et le
filtre audio .
DVD:
-srate 48000 -af lavcresample=48000
VCD et SVCD:
-srate 44100 -af lavcresample=44100
Utiliser libavcodec pour l'encodage VCD/SVCD/DVDIntroductionlibavcodec peut être utilisé pour créer
des vidéos conformes aux standards VCD/SVCD/DVD en utilisant les options appropriées.
lavcopts
Ceci est une liste de champs de que
vous pourriez avoir besoin de changer si vous voulez convertir
film en VCD, SVCD, ou DVD:
acodec:
pour le VCD, le SVCD, ou le DVD PAL;
est plus communément utilisé pour le DVD.
L'audio PCM peut aussi être utilisée pour le DVD, mais c'est surtout
une grosse perte d'espace.
Notez que l'audio MP3 n'est compatible avec aucun de ces formats, cependant
les lecteurs n'ont souvent aucun problème pour les jouer.
abitrate:
224 pour le VCD; jusqu'à 384 pour le SVCD; jusqu'à 1536 pour le DVD, mais
utilise communément une gamme de valeurs de 192 kbps pour le stéréo à
384 kbps pour le son canaux 5.1.
vcodec:
pour le VCD;
pour le SVCD;
est habituellement utilisé pour le DVD mais on peut
aussi utiliser pour des résolutions CIF.
keyint:
Utilisé pour régler la taille du GOP.
18 pour les matériaux à 30 fps, ou 15 pour les matériaux à 25/24 fps.
Les producteurs commerciaux semblent préférer des keyframe à des intervalles
de 12.
Il est possible d'augmenter cette valeur et de rester compatible avec la
plupart des lecteurs.
Un de 25 ne devrait jamais causer de problèmes.
vrc_buf_size:
327 pour le VCD, 917 pour le SVCD, et 1835 pour le DVD.
vrc_minrate:
1152, pour le VCD. Peut être laissé seul pour le SVCD et le DVD.
vrc_maxrate:
1152 pour le VCD; 2500 pour le SVCD; 9800 pour le DVD.
Pour le SVCD et le DVD, vous pouvez souhaiter utiliser des valeurs plus
basses selon vos préférences.
vbitrate:
1152 pour le VCD;
jusqu'à 2500 pour le SVCD;
jusqu'à 9800 pour le DVD.
Pour les deux derniers formats, les valeurs de vbitrate devrait être réglées
selon vos goûts.
Par exemple, si vous insistez pour faire tenir 20 heures ou plus sur un DVD,
vous pouvez utiliser vbitrate=400.
La qualité vidéo résultante sera probablement assez mauvaise.
Si vous essayez d'avoir la qualité maximum possible sur un DVD, utilisez
vbitrate=9800, mais sachez que cela pourrait vous forcer
à ne stocker que moins d'une heure de vidéo sur un DVD simple couche.
Exemples
Ceci est un paramétrage typique minimal de pour
encoder une vidéo:
VCD:
-lavcopts vcodec=mpeg1video:vrc_buf_size=327:vrc_minrate=1152:\
vrc_maxrate=1152:vbitrate=1152:keyint=15:acodec=mp2
SVCD:
-lavcopts vcodec=mpeg2video:vrc_buf_size=917:vrc_maxrate=2500:vbitrate=1800:\
keyint=15:acodec=mp2
DVD:
-lavcopts vcodec=mpeg2video:vrc_buf_size=1835:vrc_maxrate=9800:vbitrate=5000:\
keyint=15:acodec=ac3
Options Avancé
Pour une qualité d'encodage plus élevée, vous pouvez aussi souhaiter ajouter
des options d'amélioration de qualité à lavcopts, comme ,
, et autres.
Notez que, bien que et soient souvent
utile avec le MPEG-4, elles ne sont pas utilisables avec MPEG-1 ou MPEG-2.
Aussi, si vous essayez de créer un encodage DVD de très haute qualité,
peut-il être utile d'ajouter à lavcopts.
Le faire peut aider à réduire l'apparition de blocs dans les zones plates
colorées.
Pour résumer, la ligne suivante est un exemple de paramétrage de lavcopts
pour une meilleure qualité pour un DVD:
-lavcopts vcodec=mpeg2video:vrc_buf_size=1835:vrc_maxrate=9800:vbitrate=8000:\
keyint=15:trell:mbd=2:precmp=2:subcmp=2:cmp=2:dia=-10:predia=-10:cbp:mv0:\
vqmin=1:lmin=1:dc=10
Encodage Audio
Les VCD et SVCD supportent l'audio MPEG-1 layer II, en utilisant un des
encodeurs MP2 toolame,
twolame,
ou libavcodec.
Le MP2 libavcodec est loin d'être aussi bon que les deux autres bibliothèques,
cependant il devrait toujours être disponible en utilisation.
Les VCD ne supportent que l'audio avec un bitrate constant (CBR) alors que les SVCD
supportent aussi le bitrate variable (VBR).
Soyez prudents lors de l'utilisation du VBR car certains mauvais lecteurs
pourraient ne pas trop bien le supporter.
Pour l'audio DVD, le codec AC3 de libavcodec
est utilisé.
toolame
Pour un VCD et un SVCD:
-oac toolame -toolameopts br=224
twolame
Pour un VCD et un SVCD:
-oac twolame -twolameopts br=224
libavcodec
Pour un DVD avec un son 2 canaux:
-oac lavc -lavcopts acodec=ac3:abitrate=192
Pour un DVD avec un son 5.1 canaux:
-channels 6 -oac lavc -lavcopts acodec=ac3:abitrate=384
Pour un VCD et un SVCD:
-oac lavc -lavcopts acodec=mp2:abitrate=224
Combiner le tout
Cette section présente certaines commandes complètes pour créer des vidéos
compatibles VCD/SVCD/DVD.
DVD PAL
mencoder -oac lavc -ovc lavc -of mpeg -mpegopts format=dvd -vf scale=720:576,\
harddup -srate 48000 -af lavcresample=48000 -lavcopts vcodec=mpeg2video:\
vrc_buf_size=1835:vrc_maxrate=9800:vbitrate=5000:keyint=15:acodec=ac3:\
abitrate=192:aspect=16/9 -ofps 25 \
-o film.mpgfilm.aviDVD NTSC
mencoder -oac lavc -ovc lavc -of mpeg -mpegopts format=dvd -vf scale=720:480,\
harddup -srate 48000 -af lavcresample=48000 -lavcopts vcodec=mpeg2video:\
vrc_buf_size=1835:vrc_maxrate=9800:vbitrate=5000:keyint=18:acodec=ac3:\
abitrate=192:aspect=16/9 -ofps 30000/1001 \
-o film.mpgfilm.aviAVI PAL Contenant Audio AC3 vers DVD
Si la source a déjà l'audio en AC3, utilise la copie -oac au lieu de la ré-encoder.
mencoder -oac copy -ovc lavc -of mpeg -mpegopts format=dvd -vf scale=720:576,\
harddup -lavcopts vcodec=mpeg2video:vrc_buf_size=1835:vrc_maxrate=9800:\
vbitrate=5000:keyint=15:aspect=16/9 -ofps 25 \
-o film.mpgfilm.aviAVI NTSC Contenant Audio AC3 vers DVD
Si la source a déjà l'audio en AC3, et est en NTSC @ 24000/1001 fps:
mencoder -oac copy -ovc lavc -of mpeg -mpegopts format=dvd:telecine \
-vf scale=720:480,harddup -lavcopts vcodec=mpeg2video:vrc_buf_size=1835:\
vrc_maxrate=9800:vbitrate=5000:keyint=15:aspect=16/9 -ofps 24000/1001 \
-o film.mpgfilm.aviSVCD PAL
mencoder -oac lavc -ovc lavc -of mpeg -mpegopts format=xsvcd -vf \
scale=480:576,harddup -srate 44100 -af lavcresample=44100 -lavcopts \
vcodec=mpeg2video:mbd=2:keyint=15:vrc_buf_size=917:vrc_minrate=600:\
vbitrate=2500:vrc_maxrate=2500:acodec=mp2:abitrate=224 -ofps 25 \
-o film.mpgfilm.aviSVCD NTSC
mencoder -oac lavc -ovc lavc -of mpeg -mpegopts format=xsvcd -vf \
scale=480:480,harddup -srate 44100 -af lavcresample=44100 -lavcopts \
vcodec=mpeg2video:mbd=2:keyint=18:vrc_buf_size=917:vrc_minrate=600:\
vbitrate=2500:vrc_maxrate=2500:acodec=mp2:abitrate=224 -ofps 30000/1001 \
-o film.mpgfilm.aviVCD PAL
mencoder -oac lavc -ovc lavc -of mpeg -mpegopts format=xvcd -vf \
scale=352:288,harddup -srate 44100 -af lavcresample=44100 -lavcopts \
vcodec=mpeg1video:keyint=15:vrc_buf_size=327:vrc_minrate=1152:vbitrate=1152:\
vrc_maxrate=1152:acodec=mp2:abitrate=224 -ofps 25 \
-o film.mpgfilm.aviVCD NTSC
mencoder -oac lavc -ovc lavc -of mpeg -mpegopts format=xvcd -vf \
scale=352:240,harddup -srate 44100 -af lavcresample=44100 -lavcopts \
vcodec=mpeg1video:keyint=18:vrc_buf_size=327:vrc_minrate=1152:vbitrate=1152:\
vrc_maxrate=1152:acodec=mp2:abitrate=224 -ofps 30000/1001 \
-o film.mpgfilm.avi