Encodieren mit MEncoderErzeugen eines hochwertigen MPEG-4-Rips ("DivX") eines DVD-Films
Eine häufig gestellte Frage ist
"Wie mache ich den hochwertigsten Rip für eine gegebene Größe?".
Eine weitere Frage ist
"Wie mache ich den qualitativ bestmöglichen DVD-Rip? Die Dateigröße ist
mir egal, ich will einfach nur die beste Qualität."
Die letzte Frage ist zumindest etwas falsch gestellt. Wenn du dir
schließlich keine Gedanken um die Dateigröße machst, warum kopierst Du
dann nicht einfach den kompletten MPEG-2-Videostream der DVD?
Sicherlich, deine AVI wird am Ende 5GB groß sein, so oder so, jedoch ist
dies mit Sicherheit deine beste Option, wenn du die beste Qualität
erhalten willst und dich nicht um die Größe kümmerst.
Tatsache ist, der Grund eine DVD in MPEG-4 umzuencodieren ist
gerade weil dir die Größe wichtig ist.
Es ist sehr schwierig, ein Rezept zum Erzeugen eines sehr
hochwertigen DVD-Rips anzubieten. Es gilt mehrere Faktoren zu
berücksichtigen, und du solltest dich mit diesen Details auskennen oder
du wirst voraussichtlich am Ende von den Resultaten enttäuscht.
Nachfolgend werden wir einige dieser Themen etwas näher untersuchen
und uns danach ein Beispiel ansehen. Wir gehen davon aus, dass Du
libavcodec zum Encodieren des
Videos verwendest, obwohl diese Theorie genauso gut auf andere Codecs
zutrifft.
Ist dies alles zu viel für dich, solltest du womöglich auf eins der vielen
guten Frontends zurückgreifen, die in der
MEncoder-Sektion
unserer diesbezüglichen Projektseite zu finden sind.
Auf diese Weise solltest du in der Lage sein, hochwertige Rips zu
erhalten ohne viel nachdenken zu müssen, da die meisten dieser Tools dazu entworfen
wurden, clevere Entscheidungen für dich zu treffen.
Vorbereitung aufs Encodieren: Identifiziere Quellmaterial und Framerate
Bevor du über das Encodieren eines Films nachdenkst, solltest du einige einleitende
Schritte vornehmen.
Der erste und allerwichtigste Schritt vor dem Encodieren sollte sein,
festzustellen, mit welchem Inhaltstyp du umgehst.
Kommt dein Quellmaterial von einer DVD oder einem Rundfunk-/Kabel-/Satelliten-TV,
wird es in einem von zwei Formaten abgespeichert: NTSC für Nord-Amerika und Japan,
PAL für Europa usw.
Es ist wichtig, sich klar zu machen, dass dies ganz einfach die Formatierung
für die Präsentation auf einem Fernsehgerät ist und häufig
nicht mit dem originalen Format des Films
korrespondiert. Die Erfahrung zeigt, dass NTSC-Material schwieriger zu
encodieren ist, da mehr Elemente in der Quelle zu identifizieren sind.
Um eine geeignete Encodierung zu produzieren, solltest du das originale
Format kennen.
Fehler, dies sollte man berücksichtigen, führen zu diversen Fehlerstellen
in deiner Encodierung, einschließlich hässlicher Kammartefakte (combing/interlacing)
und doppelten oder gar verlorenen Frames.
Abgesehen davon, dass sie unschön sind, beeinflussen diese Artefakte die
Codierungseffizienz negativ:
Du erhältst eine schlechtere Qualität pro Bitrateneinheit.
Identifizieren der Quellframerate
Hier ist eine Liste der verbreiteten Typen des Quellmaterials, in der Du
diese und ihre Eigenschaften voraussichtlich finden wirst:
Standardfilm: Produziert für
theatralische Anzeige bei 24fps.
PAL-Video: Aufgenommen mit einer
PAL-Videokamera bei 50 Feldern pro Sekunde.
Ein Feld besteht ganz einfach aus den ungerade oder gerade nummerierten
Zeilen eines Frames.
Das Fernsehen wurde entworfen, diese Felder als billige Form einer
analogen Komprimierung im Wechsel zu aktualisieren.
Das menschliche Auge kompensiert dies angeblich, aber wenn du
Interlacing einmal verstanden hast, wirst du lernen, es auch auf
dem TV-Bildschirm zu erkennen und nie wieder Spass am Fernsehen haben.
Zwei Felder machen keinen kompletten
Frame, da sie in einer 50-stel Sekunde zeitlich getrennt aufgenommen
werden und so nicht Schlange stehen solange keine Bewegung da ist.
NTSC-Video: Aufgenommen mit einer
NTSC-Videokamera bei 60000/1001 Feldern pro Sekunde oder 60 Feldern
pro Sekunde zu Zeiten vor dem Farbfernsehen.
Ansonsten ähnlich wie PAL.
Animation: Üblicherweise bei
24fps gezeichnet, kommt jedoch auch in Varianten mit gemischter
Framerate vor.
Computer Graphics (CG): Kann
irgendeine Framerate sein, jedoch sind einige üblicher als andere;
24 und 30 Frames pro Sekunde sind typisch für NTSC und 25fps ist
typisch für PAL.
Alter Film: Diverse niedrigere
Frameraten.
Identifizieren des Quellmaterials
Filme, die sich aus Frames zusammensetzen, werden den progressiven
zugeordnet, während die aus unabhängigen Feldern bestehenden
entweder interlaced (engl. für verschachteln) oder Video
genannt werden - somit ist letzterer Terminus zweideutig.
Um das ganze noch komplizierter zu machen, sind manche Filme ein
Gemisch aus einigen den oben beschriebenen Formen.
Das wichtigste Unterscheidungsmerkmal zwischen all diesen
Formaten ist, dass einige Frame-basiert, andere wiederum
Feld-basiert sind.
Immer wenn ein Film für die
Anzeige auf dem Fernseher vorbereitet wird (einschließlich
DVD), wird er in ein Feld-basiertes Format konvertiert.
Die verschiedenen Methoden, mit denen dies bewerkstelligt werden
kann, werden zusammengenommen als "telecine" bezeichnet, von welchen
das verrufene NTSC "3:2 pulldown" eine Abart darstellt.
Sofern das Originalmaterial nicht Feld-basiert war (bei gleicher
Feldrate), erhältst du einen Film in einem anderen Format als
das Original.
Es gibt einige verbreitete Typen des pulldown:PAL 2:2 pulldown: Das schönste von
allen.
Jeder Frame wird durch das wechselweise Extrahieren und Anzeigen
der geradzahligen und ungeradzahligen Zeilen für die Dauer von zwei
Feldern dargestellt.
Hat das Originalmaterial 24fps, beschleunigt dieser Prozess den Film
um 4%.
PAL 2:2:2:2:2:2:2:2:2:2:2:3 pulldown:
Jeder 12-te Frame, anstatt nur jeder 2-te, wird für die Dauer von zwei
Feldern dargestellt.
Dies vermeidet die 4% Geschwindigkeitssteigerung, macht jedoch das
Umkehren des Prozesses viel schwieriger.
Es ist üblicherweise in Musical-Produktionen zu sehen, wo das Anpassen der
Geschwindigkeit um 4% sicherlich das musikalische Ergebnis kaputt machen würde.
NTSC 3:2 telecine: Frames werden
abwechselnd für die Dauer von 3 oder 2 Feldern angezeigt.
Dies verleiht der Feldrate das 2.5-fache der originalen Framerate.
Das Resultat wird dadurch auch leicht von 60 Feldern pro Sekunde auf
60000/1001 Felder pro Sekunde verlangsamt, um die NTSC-Felddrate
beizubehalten.
NTSC 2:2 pulldown: Verwendet zur
Darstellung von 30fps Material auf NTSC.
Schön, genau wie das 2:2 PAL pulldown.
Es gibt auch Methoden zur Konvertierung zwischen NTSC- und PAL-Video,
jedoch liegen diese Themen jenseits des Rahmens dieser Anleitung.
Wenn du auf solch einen Film stößt und ihn encodieren willst, solltest
du besser eine Kopie im originalen Format suchen.
Die Konvertierung zwischen diesen beiden Formaten ist hochdestruktiv und
kann nicht spurlos rückgängig gemacht werden, somit wird deine Encodierung
außerordentlich darunter leiden, wenn sie aus einer konvertierten Quelle
erzeugt wurde.
Wenn ein Video auf DVD gespeichert wird, werden fortlaufend Feldpaare
als Frames gruppiert, auch wenn nicht beabsichtigt ist, diese gleichzeitig
zu zeigen.
Der bei DVD und digitalem TV verwendete MPEG-2-Standard bietet einen Weg
für beides, die originalen progressiven Frames zu encodieren und die Anzahl
der Felder, für die ein Frame gezeigt werden soll, im Header dieses Frames
zu speichern.
Wurde diese Methode angewandt, wird dieser Film oft als "soft telecined"
beschrieben, da der Prozess eher nur den DVD-Player anweist, pulldown
auf den Film anzuwenden, als den Film selbst abzuändern.
Dieser Fall sollte möglichst bevorzugt werden, da er (eigentlich ignoriert)
leicht vom Encoder rückgängig gemacht werden kann und da er die maximale
Qualität beibehält.
Wie auch immer, viele DVD- und Rundfunkproduktionsstudios verwenden
keine passenden Encodierungstechniken, sie produzieren stattdessen Filme mit
"hard telecine", bei denen Felder sogar in encodiertes MPEG-2 dupliziert
werden.
Die Vorgehensweisen für den Umgang mit solchen Fällen werden
später in diesem Handbuch
behandelt.
Wir lassen dich jetzt mit einigen Anleitungen zur Identifizierung der
Materialtypen zurück, mit denen du es zu tun hast:
NTSC-Bereiche:
Wenn MPlayer angibt, dass die Framerate
während des Betrachtens des Films zu 24000/1001 gewechselt hat
und diese nie wieder zurückwechselt, handelt es sich meist mit
Sicherheit um progressiven Inhalt, der "soft telecined" wurde.
Wenn MPlayer anzeigt, dass die Framerate
zwischen 24000/1001 und 30000/1001 vor und zurück wechselt, und Du
siehst hin und wieder Kammartefakte, dann gibt es mehrere Möglichkeiten.
Die Segmente mit 24000/1001 fps sind meist mit Sicherheit progressiver
Inhalt, "soft telecined", jedoch könnten die Teile mit 30000/1001 fps
entweder "hard telecined" 24000/1001 fps Inhalt oder 60000/1001 Felder
pro Sekunde NTSC-Video sein.
Verwende die selben Richtwerte wie in den folgenden zwei Fällen, um zu
bestimmen, um was es sich handelt.
Wenn MPlayer nie einen Frameratenwechsel
anzeigt und jeder einzelne Frame mit Bewegung gekämmt (combed) erscheint,
ist dein Film ein NTSC-Video bei 60000/1001 Feldern pro Sekunde.
Wenn MPlayer nie einen Frameratenwechsel
anzeigt und zwei von fünf Frames gekämmt (combed) erscheinen, ist der
Inhalt deines Films "hard telecined" 24000/1001 fps.
PAL-Bereiche:
Wenn du niemals irgend ein Combing siehst, ist dein Film 2:2 pulldown.
Siehst du alle halbe Sekunde abwechselnd ein- und ausgehendes Combing,
dann ist dein Film 2:2:2:2:2:2:2:2:2:2:2:3 pulldown.
Hast du immer während Bewegungen Combing gesehen, dann ist dein Film
PAL-Video bei 50 Feldern pro Sekunde.
Tipp:MPlayer kann das Filmplayback
mittels der Option -speed verlangsamen oder Frame für Frame abspielen.
Versuche 0.2 zu verwenden, um den Film sehr lamgsam
anzusehen oder drücke wiederholt die Taste ".", um jeweils
einen Frame abzuspielen und identifiziere dann das Muster, falls du bei voller
Geschwindigkeit nichts erkennen kannst.
Konstanter Quantisierungsparameter vs. Multipass
Es ist möglich, deinen Film in einer großen Auswahl von Qualitäten zu
encodieren.
Mit modernen Videoencodern und ein wenig Pre-Codec-Kompression
(Herunterskalierung und Rauschunterdrückung), kann eine sehr gute
Qualität bei 700 MB für einen 90-110-minütigen Breitwandfilm erreicht werden.
Des Weiteren können alle Filme - sogar die längsten - mit nahezu perfekter
Qualität bei 1400 MB encodiert werden.
Es gibt drei Annäherungen für das Encodieren eines Videos: konstante Bitrate
(CBR), konstanter Quantisierungsparameter und Multipass (ABR, oder mittlere Bitrate).
Die Komplexität der Frames eines Filmes und somit die Anzahl der für
deren Komprimierung erforderlichen Bits kann von einer Szene zur anderen
außerordentlich variieren.
Moderne Videoencoder können sich durch Variieren der Bitrate an diese
Anforderungen anpassen.
In einfachen Modi wie CBR kennen die Encoder jedoch nicht den
Bitratenbedarf zukünftiger Szenen und sind somit nicht in der Lage,
die angeforderte mittlere Bitrate über längere Zeitspannen zu
überschreiten.
Erweiterte Modi wie etwa Multipass-Encodierung können die Statistik
früherer Durchgänge berücksichtigen; dies behebt das oben erwähnte
Problem.
Anmerkung:
Die meisten Codecs, die ABR-Encodierung unterstützen, unterstützen nur
die Encodierung in zwei Durchgängen (two pass) während einige andere wie
etwa x264,
XviD
und libavcodec Multipass
unterstützen, was die Qualität bei jedem Durchgang leicht verbessert.
Jedoch ist diese Verbesserung weder messbar noch ist sie nach dem
4-ten Durchgang oder so spürbar.
Aus diesem Grund werden in diesem Abschnitt die Encoderierung mit 2 Durchläufen
(two pass) und Multipass abwechselnd angewandt.
In jedem dieser Modi bricht der Videocodec (wie etwa
libavcodec)
den Videoframe in 16x16 Pixel Macroblöcke und wendet danach einen
Quantisierer auf jeden Macroblock an. Je niedriger der Quantisierer desto
besser die Qualität und desto höher die Bitrate.
Die Methode, die der Filmencoder zur Bestimmung des auf einen gegebenen
Macroblock anzuwendenden Quantisierer verwendet, variiert und ist in
hohem Maße einstellbar. (Dies ist eine extrem übertriebene Vereinfachung
des aktuellen Prozesses aber nützlich, um das Grundkonzept zu verstehen.)
Wenn du eine konstante Bitrate festlegst, wird der Videocodec das Video
so encodieren, dass so viele Details wie notwendig und so wenig
wie möglich ausgesondert werden, um unterhalb der vorgegebenen Bitrate zu
bleiben. Wenn du dich wirklich nicht um die Dateigröße kümmerst, könntest
du auch CBR verwenden und eine nahezu endlose Bitrate festlegen.
(In der Praxis bedeutet dies einen Wert, der hoch genug ist, kein Limit
aufzuwerfen wie 10000Kbit.) Ohne echte Einschränkung der Bitrate wird
der Codec als Ergebnis den niedrigsten möglichen Quantisierer für jeden
Macroblock anwenden (wie durch für
libavcodec
spezifiziert, Standardwert ist 2).
Sobald du eine Bitrate festlegst, die niedrig genug ist, den
Codec zur Anwendung eines höheren Quantisierers zu zwingen, bist Du
nahezu sicher dabei, die Qualität deines Videos zu ruinieren.
Um dies zu vermeiden, solltst du möglicherweise dein Video wie
in der später in diesem Handbuch beschriebenen Methode reduzieren.
Im Allgemeinen solltst du CBR vollkommen meiden, wenn dir Qualität
wichtig ist.
Mit konstantem Quantisierer wendet der Codec denselben Quantisierer, wie
durch die Option (für
libavcodec) spezifiziert, auf jeden
Macroblock an.
Willst du einen Rip mit höchstmöglicher Qualität und ignorierst dabei
wiederum die Bitrate, kannst du verwenden.
Dies wird dieselbe Bitrate und PSNR (peak signal-to-noise ratio) liefern
wie CBR mit =infinity und der Standardeinstellung
=2.
Das Problem mit konstantem Quantisierer ist, dass der vorgegebene Quantisierer
zum Einsatz kommt, egal ob der Macroblock ihn benötigt oder nicht. Dies heißt,
es wäre möglich, einen höheren Quantisierer auf einen Macroblock anzuwenden,
ohne sichtbare Qualität zu opfern. Warum die Bits für einen unnötig kleinen
Quantisierer verschwenden? Deine CPU hat soundso viele Arbeitsgänge Zeit zur
Verfügung, die Festplatte jedoch nur soundso viele Bits.
Bei einer Encodierung mit zwei Durchläufen (two pass), wird der erste Durchgang
den Film so rippen, als würde CBR vorliegen, jedoch wird ein Log die Eigenschaften
jedes Frames beibehalten. Diese Daten werden danach während des zweiten Durchgangs
dazu verwendet, intelligente Entscheidungen zur Wahl des Quantisierers zu treffen.
Während schneller Action oder hochdetaillierter Szenen werden womöglich
höhere Quantisierer, während langsamen Bewegungen und Szenen mit weniger Details
niedrigere Quantisierer verwendet.
Normalerweise ist die Anzahl der Bewegungen wichtiger als die der Details.
Wenn du verwendest, verschwendest du Bits. Wenn
du anwendest, wirst du keinen Rip mit bestmöglicher
Qualität erhalten. Angenommen du rippst eine DVD mit
und das Resultat ist 1800Kbit. Wenn du in zwei Durchgängen mit
encodierst, wird das daraus resultierende Video
eine bessere Qualität bei
gleicher Bitrate haben.
Da du nun davon überzeugt bist, dass zwei Durchgänge (two pass) den besten
Weg darstellen, stellt sich jetzt tatsächlich die Frage, welche Bitrate
verwendet werden soll? Die Antwort ist, dass es nicht nur eine
Antwort gibt. Idealerweise willst du eine Bitrate wählen, die die beste Balance
zwischen Qualität und Dateigröße ergibt. Die kann abhängig vom Quellvideo
variieren.
Interessiert die Größe nicht, stellen etwa 2000Kbit plus oder minus 200Kbit
einen guten Ausgangspunkt für einen sehr hochqualitativen Rip dar.
Bei einem Video mit schneller Action oder hohen Details, oder wenn du schlicht
und ergreifend ein sehr kritisches Auge besitzst, könntest du dich für 2400
oder 2600 entscheiden.
Bei einigen DVDs kannst du eventuell keinen Unterschied bei 1400Kbit feststellen.
Um ein besseres Gefühl zu bekommen, ist es eine gute Idee, mit Szenen bei
unterschiedlichen Bitraten herumzuexperimentieren.
Wenn du eine bestimmte Größe anvisierst, musst du die Bitrate irgendwie
kalkulieren.
Aber zuvor solltest du wissen, wieviel Platz du für den/die Audiotrack(s)
reservieren musst, daher solltest Du
diese(n) zuerst rippen.
Du kannst die Bitrate mit folgender Gleichung berechnen:
Bitrate = (zielgroesse_in_MByte - soundgroesse_in_MByte) * 1024 * 1024 / laenge_in_sek * 8 / 1000
Um zum Beispiel einen zweistündigen Film auf eine 702MB CD mit einem 60MB
Audiotrack zu bekommen, sollte die Videobitrate folgendermaßen sein:
(702 - 60) * 1024 * 1024 / (120*60) * 8 / 1000 = 740kbpsRandbedingungen für effizientes Encodieren
Aufgrund der Natur der MPEG-Komprimierung gibt es zahlreiche
Randbedingungen, denen du zum Erreichen maximaler Qualität folgen
solltest.
MPEG splittet das Video in Macroblöcke genannte 16x16 Quadrate auf,
jeder davon zusammengesetzt aus 4 8x8 Blöcken mit
Luma-(Intensitäts)-Informationen und zwei halb-auflösenden 8x8
Chroma-(Farb)-Blöcken (einer für die Rot-Cyan-Achse und der andere für
die Blau-Gelb-Achse).
Selbst wenn Breite und Höhe deines Films kein Vielfaches von 16 sind,
wird der Encoder ausreichend 16x16 Macroblöcke zur Abdeckung des
gesamten Bildbereichs verwenden und der Extraplatz wird verschwendet.
Folglich ist es keine gute Idee, im Interesse der Maximierung der
Qualität bei fester Dateigröße, Abmessungen zu verwenden, die kein
Vielfaches von 16 sind.
Die meisten DVDs besitzen ein bestimmtes Maß schwarzer Balken
an ihren Rändern. Diese dort zu belassen kann die Qualität auf
verschiedene Art und Weise negativ beeinflussen.
MPEG-Kompression hängt ebenso in höchstem Maße von den
Frequenzbereichs-Transformationen ab, insbesondere von der
Discrete Cosine Transform (DCT), die der Fourier Transform ähnelt.
Diese Art Encodierung ist für darstellende Muster und weiche
Übergänge effizient, hat jedoch große Probleme mit scharfen Kanten.
Um diese zu encodieren muss sie viel mehr Bits verwenden,
oder es wird andernfalls ein als Ringing bekannter Artefakt
auftreten.
Die Discrete Frequency Transform (DCT) erfolgt separat auf jeden
Macroblock (eigentlich auf jeden Block), somit trifft dieses Problem
nur zu, wenn sich in einem Block eine scharfe Kante befindet.
Beginnt dein schwarzer Rand exakt an den Grenzen zum Vielfachen von
16 Pixeln, stellt dies kein Problem dar.
Seis drum, die schwarzen Ränder bei DVDs werden in den seltensten
Fällen schön angeordnet, daher wirst du sie in der Praxis immer
abschneiden müssen, um diesen Nachteil zu vermeiden.
Zusätzlich zu den Frequenzbereichs-Transformationen verwendet die
MPEG-Kompression Bewegungsvektoren, um den Wechsel von einem Frame
zum anderen darzustellen.
Bewegungsvektoren arbeiten bei Inhalt, der von den Kanten eines Bildes
her einfließt, normalerweise weniger effizient, da dieser im vorherigen
Frame nicht vorhanden ist. Solange sich das Bild bis voll zur Kante des
encodierten Bereichs hin vergrößert, haben Bewegungsvektoren kein Problem
mit Inhalt, der sich aus den Kanten des Bildes hinausbewegt. Die Präsenz
schwarzer Ränder kann jedoch Ärger machen:
Die MPEG-Kompression speichert für jeden Macroblock einen Vektor,
um ausfindig zu machen, welcher Teil des vorherigen Frames in diesen
Macroblock als Basis zur Vorhersage des nächsten Frames kopiert
werden soll. Nur die verbleibenden Unterschiede müssen encodiert werden.
Überspannt der Macroblock die Kante des Bildes und enthält einen
Teil des schwarzen Randes, werden Bewegungsvektoren aus anderen
Teilen des Bildes den schwarzen Rand überschreiben. Dies bedeutet, dass
jede Menge Bits entweder zur wiederholten Schwärzung des überschriebenen
Randes aufgewendet werden müssen, oder es wird (eher) erst gar kein
Bewegungsvektor genutzt und alle Änderungen innerhalb dieses Macroblocks
müssen explizit encodiert werden. So oder so wird die Encodiereffizienz
außerordentlich reduziert.
Nochmal, dieses Problem trifft nur dann zu, wenn schwarze Ränder
nicht an den Grenzen eines Vielfachen von 16 anstehen.
Zuletzt noch was, angenommen wir haben einen Macroblock im Inneren des
Bildes und ein Objekt bewegt sich aus Richtung Nähe der Kante des Bildes
her in diesen Block hinein. Die MPEG-Encodierung kann nicht sagen
"kopiere den Teil, der innerhalb des Bildes liegt, den schwarzen Rand
aber nicht". Somit wird der schwarze Rand ebenfalls mit hinein kopiert
und jede Menge Bits müssen zur Encodierung des Teils des Bildes, der
dort angenommen wird, aufgewendet werden.
Läuft das Bild ständig zur Kante des encodierten Bereichs hin, besitzt
MPEG spezielle Optimierungen, um immer wieder dann die Pixel am Rand des
Bildes zu kopieren, wenn ein Bewegungsvektor von außerhalb des
encodierten Bereichs ankommt. Dieses Feature wird nutzlos, wenn der Film
schwarze Ränder hat. Im Gegensatz zu den Problemen 1 und 2 hilft hier
kein Anordnen der Ränder am Vielfachen von 16.
Obwohl die Ränder komplett schwarz sind und sich nie ändern, ist
zumindest ein minimaler Overhead damit verbunden, mehr Macroblöcke
zu besitzen.
Aus all diesen Gründen wird empfohlen, schwarze Ränder komplett abzuschneiden.
Mehr noch, liegt ein Bereich mit Rauschen/Verzerrung an der Kante des Bildes,
steigert dessen Abschneiden ebenso die Encodiereffizienz. Videophile Puristen,
die den Originalzustand so nah wie möglich sichern wollen,
mögen dieses Abschneiden (cropping) beanstanden, wenn du jedoch nicht planst,
bei konstantem Quantisierer zu encodieren, wird der Qualitätsgewinn, den Du
durch dieses Abschneiden erreichst, beträchtlich über dem Verlust an Informationen
an den Kanten liegen.
Abschneiden und Skalieren
Wiederaufruf der vorherigen Sektion, dass die letzte von Dir
encodierte Bildgröße ein Vielfaches von 16 sein sollte (bei beidem,
Breite und Höhe).
Diese kann durch Abschneiden, Skalieren erreicht werden oder durch
eine Kombination von beidem.
Beim Abschneiden gibt es ein paar Richtwerte, die befolgt werden müssen,
um eine Zerstörung des Films zu vermeiden.
Das normale YUV-Format, 4:2:0, speichert Chroma-(Farb)-Informationen
in einer Unterstichprobe (subsampled), z.B. wird Chroma nur halb so oft
in jede Richtung gesampelt wie Luma-(Intensitäts)-Informationen.
Beobachte dieses Diagramm, in dem L Luma-Samplingpunkte bedeuten und C
für Chroma steht.
LLLLLLLLCCCCLLLLLLLLLLLLLLLLCCCCLLLLLLLL
Wie du sehen kannst, kommen Zeilen und Spalten des Bildes natürlich paarweise.
Folglich müssen deine Abschneide-Offsets und
Abmessungen geradzahlig sein.
Sind sie dies nicht, wird Chroma nicht mehr korrekt mit Luma abgeglichen.
In der Theorie ist es möglich, mit ungeraden Offsets abzuschneiden, jedoch
erfordert dies ein Resampling von Chroma, was potentiell eine mit Verlust
verbundene Operation bedeutet und vom Crop-Filter nicht unterstützt
wird.
Weiterhin wird interlaced Video folgendermaßen gesampelt:
Oberes FeldUnteres FeldLLLLLLLLCCCCLLLLLLLLLLLLLLLLCCCCLLLLLLLLLLLLLLLLCCCCLLLLLLLLLLLLLLLLCCCCLLLLLLLL
Wie du erkennen kannst, wiederholt sich das Muster bis nach 4 Zeilen nicht.
Somit müssen bei interlaced Video dein y-Offset und die Höhe für das
Ausschneiden ein Vielfaches von 4 sein.
Die ursprüngliche DVD-Auflösung ist 720x480 für NTSC und 720x576 für PAL, es
gibt jedoch ein Aspektkennzeichen, das spezifiziert, ob Vollbild (4:3) oder
Breitwandfilm (16:9) vorliegt. Viele (wenn nicht die meisten) Breitwandfilm-DVDs
sind nicht grundsätzlich 16:9, sondern entweder 1.85:1 oder 2.35:1 (Cinescope).
Dies bedeutet, dass es schwarze Bänder im Video geben wird, die herausgeschnitten
werden müssen.
MPlayer stellt einen Crop-Erkennungsfilter
zur Verfügung, der das Ausschnittsrechteck ()
bestimmt.
Starte MPlayer mit
, und er wird die Crop-Einstellungen
zum Entfernen der Ränder ausgeben.
du solltest den Film lange genug laufen lassen, damit die gesamte Bildfläche
verwendet wird, um akkurate Crop-Werte zu erhalten.
Teste danach die Werte, die von MPlayer
über die Befehlszeile mittels ausgegeben wurden
und passe das Rechteck nach deinen Bedürfnissen an.
Der Filter kann dabei helfen, indem er dir erlaubt,
das Rechteck interaktiv über dem Film zu positionieren.
Vergiss nicht, den oben genannten Teilbarkeitsrichtwerten zu folgen, sodass du
die Chroma-Ebenen nicht verkehrt anordnest.
In bestimmten Fällen könnte Skalieren nicht wünschenswert sein.
Skalierung in vertikaler Richtung ist mit interlaced Video
schwierig, und wenn du das Interlacing beibehalten willst, solltest
du für gewöhnlich das Skalieren bleiben lassen.
Hast du nicht vor zu skalieren, willst aber nach wie vor Abmessungen
in einem Vielfachen von 16 verwenden, musst du über den Rand
hinausschneiden.
Schneide aber lieber nicht über den Rand hinaus, da schwarze Ränder
sehr schlecht zu encodieren sind!
Weil MPEG-4 16x16 Macroblöcke nutzt, solltest du dich vergewissern,
dass jede Abmessung des zu encodierenden Videos ein Vielfaches von
16 ist oder du verschlechterst andernfalls die Qualität, speziell bei
niedrigeren Bitraten. Du kannst dies durch Abrunden der Breite und
Höhe des Ausschnittsrechtecks hinunter auf den nächsten Wert eines
Vielfachen von 16 erreichen.
Wie früher bereits erklärt, wirst du beim Abschneiden das y-Offset
um die Hälfte der Differenz der alten und neuen Höhe erhöhen wollen,
sodass das daraus resultierende Video aus der Mitte des Frames genommen
wird. Und stelle wegen der Art, wie ein DVD-Video gesampelt wird, sicher,
dass das Offset eine gerade Zahl ist. (Verwende in der Tat - als eine
Regel - nie ungerade Werte für irgendwelche Parameter beim Abschneiden
oder Skalieren eines Videos) Wenn du dich beim Wegwerfen einiger extra
Pixel nicht wohl fühlst, ziehst du es stattdessen vor, das Video zu
skalieren.
Wir werden uns dies im unten stehenden Beispiel mal ansehen.
Du kannst den -Filter sogar alles oben erwähnte
für dich erledigen lassen, da dieser einen optionalen Parameter
besitzt, der standardmäßig gleich 16 ist.
Pass auch auf "halbschwarze" Pixel an den Kanten auf. Stelle sicher, dass
du diese ebenfalls mit abschneidest oder du vergeudest dort Bits, wo sie
doch besser anderswo verwendet werden sollten.
Nachdem nun alles gesagt ist, wirst du möglicherweise bei einem
Video landen, dessen Pixel nicht ganz 1.85:1 oder 2.35:1, aber ziemlich
nahe dran sind. Du könntest ein neues Seitenverhältnis manuell berechnen,
aber MEncoder bietet eine Option für
libavcodec genannt
, die das für dich erledigt.
Skaliere dieses Video auf keinen Fall hoch, um die Pixel abzugleichen
solange du keinen Festplattenplatz verschwenden willst.
Das Skalieren sollte beim Playback gemacht werden und der Player wird das
in der AVI gespeicherte Seitenverhältnis zur Bestimmung der besten
Auflösung verwenden.
Unglücklicherweise erzwingen nicht alle Player diese Auto-Skalierinformation,
und deshalb willst du vielleicht trotzdem neu skalieren.
Auswahl von Auflösung und Bitrate
Wenn du nicht vor hast, im Modus mit konstantem Quantisier zu encodieren,
musst du eine Bitrate auswählen.
Das Konzept der Bitrate ist denkbar einfach.
Sie ist die (mittlere) Anzahl Bits, die pro Sekunde zum Speichern des
Films verbraucht werden.
Normalerweise wird die Bitrate in Kilobit (1000 Bit) pro Sekunde gemessen.
Die Größe deines Films auf der Platte ist die Bitrate multipliziert mit der
Dauer des Films, plus einem kleinen "Overhead" (siehe zum Beispiel in der
Sektion über
den AVI-Container).
Weitere Parameter wie Skalierung, Cropping, usw. werden die Dateigröße
nicht ändern, solange du nicht auch
die Bitrate veränderst!
Die Bitrate skaliert nicht proportional
zur Auflösung.
Dies bedeutet, eine Datei 320x240 mit 200 KBit/Sek wird nicht dieselbe
Qualität aufweisen wie der gleiche Film bei 640x480 und 800 KBit/Sek!
Dafür gibt es zwei Gründe:
Wahrnehmbar: du bemerkst
MPEG-Artefakte eher, wenn sie größer hochskaliert sind!
Artefakte erscheinen bei einer Skalierung von Blöcken (8x8).
Dein Auge wird in 4800 kleinen Blöcken nicht so leicht Fehler sehen
wie es welche in 1200 großen Blöcken sieht (vorausgesetzt du skalierst
beide auf Vollbild).
Theoretisch: Wenn du ein Bild
runterskalierst, aber nach wie vor die selbe Größe der (8x8)
Blöcke zur Frequenzraumtransformation verwendest, bewegst Du
mehr Daten in die Hochfrequenzbänder.
Grob gesagt, jedes Pixel enthält mehr des Details als es dies
zuvor tat.
Somit enthält dein herunterskaliertes Bild 1/4 der Information
in räumlichen Richtungen, es könnte immer noch einen hohen Anteil
Information im Frequenzbereich enthalten (vorausgesetzt dass die
hohen Frequenzen im originalen 640x480 Bild nicht ausgenutzt wurden).
Vergangene Leitfäden legten nahe, eine Bitrate und Auflösung zu wählen,
die auf eine "Bits pro Pixel"-Näherung basieren, dies ist jedoch im
allgemeinen aus oben genannten Gründen nicht gültig.
Eine bessere Schätzung scheint zu sein, dass Bitraten proportional zur
Quadratwurzel der Auflösung skalieren, sodass 320x240 und 400 KBit/Sek
vergleichbar mit 640x480 bei 800 KBit/Sek wären.
Dies wurde aber nicht mit theoretischer oder empirischer Strenge verifiziert.
Desweiteren ist es in Anbetracht der Tatsache, dass Filme in Bezug auf Rauschen, Details,
Bewegungsgrad usw. außerordentlich variieren, zwecklos, allgemeine Empfehlungen
für die Bits pro Diagonallänge (dem Analog zu Bits pro Pixel
unter Verwendung der Quadratwurzel) abzugeben.
So weit haben wir nun die Schwierigkeit der Wahl von Bitrate und
Auflösung diskutiert.
Berechnen der Auflösung
Die folgenden Schritte werden dich in der Berechnung der Auflösung
deiner Encodierung anleiten, ohne das Video allzusehr zu verzerren,
indem verschiedene Typen von Informationen über das Quellvideo in
Betracht gezogen werden.
Zuerst solltest du die encodierte Auflösung berechnen:
ARc = (Wc x (ARa / PRdvd )) / Hcwobwei:
Wc und Hc die Breite und Höhe des zugeschnittenen Videos darstellen
ARa das angezeigte Seitenverhältnis ist, das üblicherweise 4/3 oder 16/9 beträgt
PRdvd das Pixelverhältnis der DVD ist, welches gleich 1.25=(720/576) für
PAL-DVDs und 1.5=(720/480) für NTSC-DVDs beträgt
Dann kannst du die X- und Y-Auflösung berechnen, gemäß eines gewisse Faktors
der Kompressionsqualität (CQ):
ResY = INT(SQRT( 1000*Bitrate/25/ARc/CQ )/16) * 16
und
ResX = INT( ResY * ARc / 16) * 16
Okay, aber was ist der CQ?
Der CQ repräsentiert die Anzahl Bits pro Pixel und pro Frame der Encodierung.
Grob ausgedrückt, je größer der CQ, desto geringer die Wahrscheinlichkeit,
Encodierungsartefakte zu sehen.
Trotz allem, wenn du eine Zielgröße für deinen Film hast (1 oder 2 CDs zum Beispiel),
gibt es eine begrenzte Gesamtzahl an Bits, die du aufwenden kannst; deswegen ist es
notwendig, einen guten Kompromiss zwischen Komprimierbarkeit und Qualität zu suchen.
Der CQ hängt von der Bitrate, der Effektivität des Videocodecs und der
Filmauflösung ab.
Um den CQ anzuheben, könntest du typischerweise den Film unter der Annahme
herunterskalieren, dass die Bitrate mit der Funktion der Zielgröße und der
Länge des Films berechnest, die ja konstant sind.
Mit MPEG-4 ASP-Codecs wie XviD
und libavcodec, resultiert ein CQ
unter 0.18 für gewöhnlich in einem ziemlich blockhaften Bild, weil nicht
genug Bits zum Codieren der Information jedes Macroblocks vorhanden sind.
(MPEG4, wie auch viele andere Codecs, gruppiert Pixel nach Blöcken verschiedener
Pixel, um das Bild zu komprimieren; sind nicht genügend Bits vorhanden,
werden die Kanten dieser Blöcke sichtbar.)
Es ist daher weise, einen CQ im Bereich von 0.20 bis 0.22 für einen 1 CD-Rip
und 0.26-0.28 für einen 2 CD-Rip mit Standard-Encodieroptionen zu nehmen.
Höherentwickelte Encodieroptionen wie die hier für
libavcodec
und
XviD
aufgelisteten sollten es möglich machen, dieselbe Qualität mit einem CQ im Bereich
von 0.18 bis 0.20 für einen 1 CD-Rip und 0.24 bis 0.26 für einen 2 CD-Rip zu erreichen.
Mit den MPEG-4 ASP-Codecs wie x264,
kannst du einen CQ im Bereich von 0.14 bis 0.16 mit Standard-Encodieroptionen
verwenden, und solltest bis auf 0.10 bis 0.12 mit den
erweiterten Encodieroptionen von x264
runter gehen können.
Bitte nimm zur Kenntnis, dass der CQ lediglich eine richtungsweisendes Maß ist,
da sie vom encodierten Inhalt abhängt. Ein CQ von 0.18 kann für einen
Bergman-Film recht hübsch aussehen, im Gegensatz zu einem Film wie
The Matrix, der jede Menge High-Motion-Szenen enthält.
Auf der anderen Seite ist es nutzlos, den CQ höher als 0.30 zu schrauben,
da du ohne spürbaren Qualitätsgewinn Bits vergeuden würdest.
Beachte ebenso, dass wie früher in diesem Handbuch bereits angemerkt,
niedrig auflösende Videos einen größeren CQ benötigen, um gut auszusehen
(im Vergleich z.B. zur DVD-Auflösung).
Filtern
Zu lernen, wie man MEncoders Videofilter
verwendet, ist essentiell, um gute Encodierungen zu produzieren.
Jede Videoverarbeitung wird über Filter ausgeführt -- Ausschneiden,
Skalieren, Farbanpassung, Rauschentfernung, Scharfzeichnen, Deinterlacing,
telecine, inverses telecine und Deblocking, um nur ein paar davon aufzuzählen.
Zusammen mit der gewaltigen Zahl unterstützter Inputformate, ist die Vielfalt der
in MEncoder verfügbaren Filter eine seiner
Hauptvorteile im Vergleich zu ähnlichen Programmen.
Filter werden in einer Kette über die Option -vf geladen:
-vf filter1=Optionen,filter2=Optionen,...
Die meisten Filter nehmen mehrere numerische, kommagetrennte
Optionen entgegen, jedoch variiert die Syntax der Optionen von
Filter zu Filter, also lies bitte die Manpage für Details
zu den Filtern, die du verwenden willst.
Filter wirken auf das Video in der Reihenfolge ein, in der sie geladen werden.
Zum Beispiel wird folgende Kette:
-vf crop=688:464:12:4,scale=640:464
zuerst den Bereich 688x464 aus dem Bild schneiden mit der oberen, linken
Ecke bei (12,4) und danach das Ergebnis auf 640x464 herunter skalieren.
Bestimmte Filter müssen zu oder nahe dem Anfang der Filterkette geladen
werden, um Vorteile aus den Informationen des Videodecoders zu ziehen,
die ansonsten durch andere Filter verloren gehen oder ungültig gemacht
würden.
Die wichtigsten Beispiele sind
(Nachbearbeitung (postprocessing), nur wenn es Deblock- oder
Dering-Operationen durchführt), (ein weiterer
Postprozessor zum Entfernen von MPEG-Artefakten),
(umgekehrtes telecine) und (zur Konvertierung
von soft telecine nach hard telecine).
Im Allgemeinen solltest du den Film so wenig wie möglich Filtern, um
nahe an der originalen DVD-Quelle zu bleiben. Ausschneiden ist oft
notwendig (wie oben beschrieben), vermeide aber das Skalieren von Videos.
Obwohl das Herunterskalieren manchmal vorgezogen wird, um höhere Quantisierer
zu verwenden, wollen wir beide diese Dinge vermeiden: Erinnere dich daran,
dass wir von Anfang an beschlossen hatten, einen Kompromiss zwischen
Bits und Qualität zu schließen.
Passe ebenso kein Gamma, Kontrast, Helligkeit, usw. an. Was auf deinem
Display gut aussieht, sieht auf anderen eventuell nicht gut aus. Diese
Anpassungen sollten nur im Playback vorgenommen werden.
Eine Sache, die du vielleicht machen willst, ist, das Video durch einen sehr
feinen Entrauschfilter (Denoise) zu schicken, wie etwa .
Nochmals, es geht darum, die Bits einer besseren Verwendung zuzuführen: Warum
Bits zum Encodieren des Rauschens verschwenden, wenn du dieses Rauschen auch
während des Playback entfernen kannst?
Die Parameter für zu erhöhen, wird überdies
die Komprimierbarkeit erhöhen, erhöhst du jedoch die Werte zu sehr, riskierst Du
eine Verringerung der Bildsichtbarkeit. Die oben vorgeschlagenen Werte
() sind ziemlich konservativ; du solltest dich frei
fühlen, mit höheren Werten herumzuexperimentieren und die Ergebnisse
selbst zu beobachten.
Interlacing und Telecine
Nahezu alle Filme sind bei 24 fps aufgenommen. Weil NTSC 30000/1001 fps entspricht,
müssen mit diesen 24 fps Videos einige Verarbeitungen durchgeführt werden,
um sie mit der korrekten NTSC-Framerate laufen zu lassen. Der Prozess wird 3:2
pulldown genannt, allgemein telecine zugeordnet (weil pulldown des öfteren
während des telecine-Prozesses angewandt wird), und naiv so beschrieben,
dass er durch Verlangsamung des Films auf 24000/1001 fps und dem
Wiederholen jeden vierten Frames arbeitet.
Keine spezielle Verarbeitung ist jedoch bei einem Video für PAL-DVDs
durchzuführen, das bei 25 fps läuft. (Technisch gesehen kann PAL telecined
werden, 2:2 pulldown genannt, dies ist jedoch in der Praxis nicht von Bedeutung.)
Der 24 fps Film wird einfach mit 25 fps abgespielt. Das Resultat ist, dass
der Film ein wenig schneller abläuft, doch solange du kein Alien bist, wirst
du möglicherweise keinen Unterschied wahrnehmen.
Die meisten PAL-DVDs haben pitch-korrigiertes Audio, dadurch hören sie sich
bei 25 fps abgespielt korrekt an, obwohl der Audiotrack (und infolgedessen der
gesamte Film) eine 4% kürzere Abspielzeit hat wie NTSC-DVDs.
Weil das Video in einer PAL-DVD nicht verändert wurde, musst du dich nicht
viel um die Framerate sorgen. Die Quelle ist 25 fps und dein Rip wird 25
fps haben. Wenn du jedoch einen NTSC-DVD-Film rippst, musst du eventuell
umgekehrtes telecine anwenden.
Für mit 24 fps aufgenommene Filme ist das Video auf der NTSC-DVD entweder telecined
30000/1001 oder hat andernfalls progressive 24000/1001 fps und es ist vorgesehen,
on-the-fly vom DVD-Player telecined zu werden. Auf der anderen Seite sind TV-Serien
üblicherweise nur interlaced, nicht telecined. Dies ist keine feste Regel: Einige
TV-Serien sind interlaced (wie etwa Buffy die Vampirjägerin), wogegen andere
eine Mixtur aus progressive und interlaced sind (so wie Angel oder 24) - wers kennt :).
Es wird strengstens empfohlen, die Sektion über
Wie mit telecine und interlacing in NTSC-DVDs umgehen
durchzulesen, um den Umgang mit den verschiedenen Möglichkeiten zu lernen.
Wenn du aber hauptsächlich nur Filme rippst, gehst du wahrscheinlich entweder
mit 24 fps progressivem oder telecined Video um, in welchem Falle du
den Filter mittels
verwenden kannst.
Interlaced Video encodieren
Ist der Film, den du encodieren willst, interlaced (NTSC-Video oder
PAL-Video), wirst du wählen müssen, ob du ihn deinterlacen willst
oder nicht.
Während das Deinterlacing deinen Film zwar auf progressiven Scan-Displays
wie Computermonitoren und Projektoren verwendbar macht, wird dich dies
doch etwas kosten: Die Feldrate von 50 oder 60000/1001 Feldern pro Sekunde
wird auf 25 oder 30000/1001 Frames pro Sekunde halbiert und annähernd die
Hälfte der Informationen in deinem Film geht während Szenen mit
signifikanter Bewegung verloren.
Deswegen wird empfohlen, wenn du aus Gründen hochqualitativer
Archivierung encodierst, kein Deinterlacing durchzuführen.
Du kannst den Film immer noch beim Playback deinterlacen,
wenn du ihn auf progressiven Scan-Geräten anzeigst. Und zukünftige
Player werden in der Lage sein, auf volle Feldrate zu
deinterlacen, mit Interpolation auf 50 oder 60000/1001 komplette
Frames pro Sekunde aus interlaced Video heraus.
Spezielle Sorgfalt solltest du bei der Arbeit mit interlaced Video walten lassen:
Ausschneidehöhe und y-Offset müssen Vielfache von 4 sein.
Jedes vertikale Skalieren muss im interlaced Modus durchgeführt werden.
Nachbearbeitungs- (postprocessing) und Rauschunterdrückungsfilter (denoising)
funktionieren eventuell nicht wie erwartet, wenn du nicht speziell darauf achtest,
dass sie zu einem Zeitpunkt nur ein Feld verarbeiten, und sie können das Video
kaputt machen, wenn sie inkorrekt angewendet werden.
Mit diesen Dingen im Kopf, hier das erste Beispiel:
mencoder capture.avi -mc 0 -oac lavc -ovc lavc -lavcopts \
vcodec=mpeg2video:vbitrate=6000:ilme:ildct:acodec=mp2:abitrate=224
Beachte die Optionen und .
Anmerkungen zur Audio-/VideosynchronisationMEncoders Algorithmen der Audio-/Videosynchronisation
wurden mit der Intention entwickelt, Dateien mit kaputter Sychronisation wieder herzustellen.
In einigen Fällen können unnötiges Überspringen und Duplizieren
von Frames und möglicherweise leichte A/V-Desynchronisation verursachen, auch wenn sie
mit dem richtigen Input verwendet werden
(gewiss, Probleme mit A/V-Synchronisation treffen nur zu, wenn du den Audiotrack während
der Transcodierung des Videos verarbeitest oder kopierst, wozu auch nachhaltig
ermutigt wird).
Hierfür müsstest du mit der Option in die
Grundeinstellung der A/V-Synchronisation wechseln oder diese in deine
~/.mplayer/mencoder Konfigurationsdatei eintragen,
solange du ausschließlich mit guten Quellen arbeitest (DVD, TV-Capture,
hochqualitativen MPEG-4-Rips usw.) und mit nicht-kaputten ASF/RM/MOV-Dateien.
Wenn du dich überdies gegen merkwürdige Frameübersprünge und -duplikationen
absichern willst, kannst du beides verwenden,
und .
Dies verhindert jede A/V-Synchronisation und kopiert die Frames
eins-zu-eins, somit kannst du sie nicht verwenden, falls du irgendwelche Filter
verwendest, die unvorhersagbar Frames hinzufügen oder streichen oder falls
deine Input-Datei eine variable Framerate besitzt!
Deshalb wird eine allgemeine Anwendung von nicht empfohlen.
Die von MEncoder unterstützte sogenannte
"3-pass" Audioencodierung soll laut Berichten A/V-Desynchronisation
verursachen.
Dies geschieht definitiv dann, wenn sie in Verbindung mit bestimmten Filtern
verwendet wird, daher wird nicht empfohlen, den
3-pass-Audio-Modus anzuwenden.
Dieses Feature ist nur aus Kompatibilitätsgründen übrig geblieben und für
erfahrene Benutzer, die wissen, wann es sicher anzuwenden ist und wann nicht.
Wenn du zuvor noch nie etwas vom 3-pass-Modus gehört hast, vergiss, dass wir es je
erwähnt haben!
Es gab auch Berichte über A/V-Desynchronisation, wenn
mit MEncoder von stdin encodiert wurde.
Lass das bleiben! Verwende immer eine Datei oder ein CD/DVD/usw-Laufwerk
als Input.
Auswahl des Videocodecs
Welcher Videocodec die beste Wahl ist, hängt von mehreren Faktoren
wie Größe, Qualität, Streambarkeit, Brauchbarkeit und Popularität, manche
davon weitgehend vom persönlichen Geschmack und technischen
Randbedingungen ab.
Kompressionseffizienz:
Es ist leicht zu verstehen, dass die meisten Codecs der neueren Generation
dafür gemacht wurden, Qualität und Komprimierung zu verbessern.
Deshalb behauptet der Autor dieses Handbuches und viele andere Leute, dass
du nichts verkehrt machen kannst,
Sei trotzdem vorsichtig: MPEG-4 AVC-Videos in DVD-Auflösung zu
decodieren erfordert einen schnellen Rechner (z.B. einen Pentium 4
über 1.5GHz oder einen Pentium M über 1GHz).
wenn du MPEG-4 AVC-Codecs wie
x264 anstatt MPEG-4 ASP-Codecs
wie libavcodec MPEG-4 oder
XviD wählst.
(Zukunftsorientierte Codec-Entwickler interessiert eventuell Michael
Niedermayers Meinung
"why MPEG4-ASP sucks"
zu lesen.)
Ebenso solltest du mit MPEG-4 ASP eine bessere Qualität erhalten als mit
MPEG-2-Codecs.
Allerdings können neuere Codecs, die noch stark in der Entwicklung stecken,
unter unentdeckten Bugs leiden, die die Encodierung ruinieren können.
Dies nimmt man schlicht in Kauf, wenn man "bleeding edge"-Technologie
verwendet.
Außerdem erfordert der Umgang mit einem neuen Codec und sich mit dessen Optionen
vertraut zu machen eine Zeit, bis du weißt, was alles anzupassen
ist, um die erhoffte Bildqualität zu erreichen.
Hardware-Kompatibilität:
Gewöhnlich dauert es bei neuen standalone Video-Playern lange, bis der
Support für die neuesten Videocodecs eingebunden ist.
Als ein Ergebnis unterstützen die meisten nur MPEG-1 (wie VCD, XVCD
und KVCD), MPEG-2 (wie DVD, SVCD und KVCD) und MPEG-4 ASP (wie DivX,
LMP4 von libavcodec und
XviD)
(Vorsicht: Im Allgemeinen werden nicht alle MPEG-4 ASP-Features unterstützt).
Sieh bitte in den technischen Spezifikationen deines Players nach (falls
welche vorhanden sind) oder google nach mehr Informationen.
Beste Qualität pro Encodierzeit:
Codecs, die es schon einige Zeit gibt (wie
libavcodec MPEG-4 und
XviD), sind gewöhnlich heftig
mit allen möglichen intelligenten Algorithmen und SIMD Assembly-Code optimiert.
Das sind sie deshalb, weil sie darauf abzielen, das beste Verhältnis von Qualität
pro Encodierzeit zu liefern.
Jedoch haben sie oft einige sehr fortschrittliche Optionen, die,
wenn aktiviert, das Encodieren bei marginalem Gewinn wirklich langsam
machen.
Wenn du es auf die Wahnsinnsgeschwindigkeit abzielst, solltest du
in der Nähe der Standardeinstellungen des Videocodecs bleiben
(obwohl du ruhig weitere Optionen ausprobieren solltest, die in
anderen Sektionen dieses Handbuchs angesprochen werden).
Vielleicht überlegst du auch, einen Codec auszuwählen, der mit
Multi-Threading klarkommt, was nur für Benutzer von Rechnern
mit mehreren CPUs von Nutzen ist.
libavcodec MPEG-4 erlaubt
dies zwar, aber die Geschwindigkeitsgewinne sind begrenzt und es gibt
einen leicht negativen Effekt in Bezug auf die Bildqualität.
Die Multi-Thread-Encodierung von XviD,
durch die Option aktiviert, kann zum Ankurbeln
der Encodiergeschwindigkeit - um in typischen Fällen etwa 40-60% -
bei wenn überhaupt geringer Bildverschlechterung verwendet werden.
x264 erlaubt ebenfalls
Multi-Thread-Encodierung, was im Moment das Encodieren um 15-30% beschleunigt
(abhängig von den Encodier-Einstellungen) bei gleichzeitiger Verringerung des
PSNR um etwa 0.05dB.
Persönlicher Geschmack:
Hier beginnt die Angelegenheit oft irrational zu werden: Aus den selben
Gründen, aus denen manche über Jahre an DivX 3 hängen, während neuere
Codecs bereits Wunder wirken, ziehen einige Leute
XviD
oder libavcodec MPEG-4 dem
x264 vor.
Du solltest dir dein eigenes Urteil bilden; lass dich nicht von Leuten
vollquasseln, die auf den einen Codec schwören.
Nimm ein paar Beispiel-Clips von Originalquellen und vergleiche die
verschiedenen Encodier-Optionen und Codecs, um den einen zu finden, mit
dem du am besten klarkommst.
Der beste Codec ist der, den du beherrschst und der in deinen Augen
auf deinem Display am besten aussieht.
Dieselbe Encodierung kann auf dem Monitor eines anderen vollkommen
anders aussehen oder wenn sie von einem anderen Decoder abgespielt wird,
also mach deine Encodierungen zukunftssicher indem du sie unter verschiedenen
Setups ablaufen lässt.!
Sieh dazu bitte in der Sektion
Auswahl der Codecs und Containerformate
nach der Liste der unterstützten Codecs.
Audio
Audio ist ein leichter zu lösendes Problem: Wenn du Wert auf Qualität legst,
lass es einfach so wie es ist.
Gerade AC3 5.1 Streams sind meist 448Kbit/s und jedes Bit wert.
Möglicherweise gerätst du in Versuchung, Audio in hochwertiges Vorbis
umzuwandeln, aber nur weil du heute keinen A/V-Receiver für AC3-pass-through
besitzt, bedeutet dies nicht, dass du nicht morgen doch einen hast.
Halte deine DVD-Rips zukunftssicher, indem du den AC3-Stream beibehältst.
Du behältst den AC3-Stream entweder, indem du ihn
während der Encodierung
direkt in den Video-Stream kopierst.
Du kannst den AC3-Stream aber auch extrahieren, um ihn in Container wie NUT
oder Matroska zu muxen.
mplayer source_file.vob -aid 129 -dumpaudio -dumpfile sound.ac3
dumpt Audiotrack Nummer 129 aus der Datei source_file.vob
(NB: DVD-VOB-Dateien verwenden gewöhnlich andere Audionummerierungen,
was bedeutet, dass der VOB-Audiotrack 129 der 2-te Audiotrack der Datei ist)
in die Datei sound.ac3.
Aber manchmal hast du wirklich keine andere Wahl als den Sound weiter zu
komprimieren, sodass mehr Bits fürs Video aufgewendet werden können.
Die meisten Leute entscheiden sich für eine Audiokomprimierung mit MP3- oder
Vorbis-Audiocodecs.
Wobei letzterer ein sehr platzsparender Codec ist, MP3 wird von Hardware-Playern
besser unterstützt, wobei sich dieser Trend auch ändert.
Verwende nicht beim Encodieren
einer Datei, die Audio enhält, sogar wenn du Audio später separat
encodierst und muxt.
Zwar kann es im Idealfall manchmal funktionieren, wenn du
verwendest, wahrscheinlich um einige Probleme in deinen
Encodier-Befehlszeileneinstellungen zu verbergen.
In anderen Worten, einen Soundtrack während dem Encodieren zu haben, stellt sicher,
vorausgesetzt du siehst keine Meldungen wie
Too many audio packets in the buffer, dass du in der Lage sein
wirst, eine korrekte Synchronisation zu erhalten.
Du brauchst MEncoder zur Verarbeitung des Sounds.
Du kannst zum Beispiel den originalen Soundtrack während dem Encodieren mit
kopieren oder ihn mittels
in eine "leichte"
4 kHz Mono WAV-PCM konvertieren.
Anderenfalls wird er - in einigen Fällen - eine Videodatei erzeugen, die
nicht mit Audio synchron läuft.
So was kommt vor, wenn die Anzahl der Videoframes in der Quelldatei nicht
mit der Gesamtlänge der Audioframes zusammenpasst oder immer dann, wenn
Unstetigkeiten/Splices vorhanden sind, wo Audioframes oder extra Audioframes
fehlen.
Der korrekte Weg, mit dieser Art Problem umzugehen, ist Stille (silence)
einzufügen oder Audio an diesen Punkten wegzuschneiden.
Seis drum, MPlayer kann das nicht, also wenn du
AC3-Audio demuxt und es in einer separaten Anwendung encodierst (oder
es mit MPlayer in eine PCM dumpst), die Splices
bleiben inkorrekt und der einzige Weg sie zu korrigieren ist, Videoframes
an diesem Splice zu streichen bzw. zu duplizieren.
Solange MEncoder Audio beim Encodieren des
Videos sieht, kann er dieses Streichen/Duplizieren erledigen, was
gewöhnlich OK ist, da es bei voller Schwärze/Szenenwechsel stattfindet,
aber wenn MEncoder Audio nicht erkennen kann,
wird er einfach alle Frames so wie sie ankommen verarbeiten und sie werden
einfach nicht zum endgültigen Audiostream passen, wenn du beispielsweise
deinen Audio- und Videotrack in eine Matroska-Datei mergst.
Zuallererst wirst du den DVD-Sound in eine WAV-datei konvertieren müssen, die
der Audiocodec als Input nutzen kann.
Zum Beispiel:
mplayer source_file.vob -ao pcm:file=destination_sound.wav -vc dummy -aid 1 -vo null
wird den zweiten Audiotrack aus der Datei source_file.vob
in die Datei destination_sound.wav dumpen.
Vielleicht willst du den Sound vor dem Encodieren normalisieren, da
DVD-Audiotracks gemeinhin bei niedriger Lautstärke aufgenommen sind.
Du kannst beispielsweise das Tool normalize verwenden,
das in den meisten Distributionen zur Verfügung steht.
Wenn du Windows nutzt, kann ein Tool wie BeSweet
denselben Job erledigen.
Du wirst entweder nach Vorbis oder MP3 komprimieren.
Zum Beispiel:
oggenc -q1 destination_sound.wav
wird destination_sound.wav mit
der Encodierqualität 1 encodieren, was annähernd 80Kb/s ergibt und
die Minimalqualität darstellt, mit der du encodieren solltest, wenn du
Wert auf Qualität legst.
Nimm bitte zur Kenntnis, dass MEncoder aktuell keine Vorbis-Audiotracks
in die Output-Datei muxen kann, da er nur AVI- und MPEG-Container als
Output unterstützt, wobei es beim Audio-/Videoplayback zu
Synchronisationproblemen mit einigen Playern führen wird, wenn die AVI-Datei
VBR-Audiostreams wie z.B. Vorbis enthält.
Keine Bange, dieses Dokument wird dir zeigen, wie du das mit
Third-Party-Programmen hinbekommst.
Muxen
Nun da du dein Video encodiert hast, wirst du es höchstwahrscheinlich
mit einem oder mehr Audiotracks in einen Movie-Container wie etwa
AVI, MPEG, Matroska oder NUT muxen.
MEncoder ist aktuell nur in der Lage,
Audio und Video nativ in MPEG- und AVI-Containerformate auszugeben.
Zum Beispiel:
mencoder -oac copy -ovc copy -o output_movie.avi -audiofile input_audio.mp2input_video.avi
würde die Video-Datei input_video.avi
und die Audio-Datei input_audio.mp2
in die AVI-Datei output_movie.avi mergen.
Dieser Befehl funktioniert mit MPEG-1 Layer I, II und III Audio (eher
bekannt als MP3), WAV und auch mit ein paar weiteren Audioformaten.
MEncoder zeichnet sich aus durch experimentellen Support für
libavformat, das eine
Programmbibliothek des FFmpeg-Projekts ist, welches das Muxen und
Demuxen einer Vielzahl von Containern unterstützt.
Zum Beispiel:
mencoder -oac copy -ovc copy -o output_movie.asf -audiofile input_audio.mp2input_video.avi -of lavf -lavfopts format=asf
wird das selbe machen, wie das obere Beispiel, außer dass der
Output-Container ASF sein wird.
Bitte nimm zur Kenntnis, dass dieser Support hochexperimentell ist
(aber von Tag zu Tag besser wird) und nur funktionieren wird, wenn du
MPlayer mit aktiviertem Support für
libavformat kompiliert
hast (was meint, dass eine Pre-Packaged Binary Version in den meisten
Fällen nicht funktionieren wird).
Verbessern der Mux- und A/V-Synchronisationszuverlässigkeit
Es kann vorkommen, dass du ernsthafte A/V-Synchronisationsprobleme hast während
du versuchst, deine Video- und einige Audiotracks zu muxen, wobei es nichts
ändert, wenn du das Audiodelay anpasst, du bekommst nie eine korrekte
Synchronisation zu Stande.
Dies kann vorkommen, wenn du manche Videofilter verwendest, die einige Frames
weglassen oder duplizieren, wie etwa die inverse telecine-Filter.
ich kann dich nur dazu ermutigen, den -Videofilter
ans Ende der Filterkette anzuhängen, um solcherlei Problemen aus dem Weg
zu gehen.
Ohne verlässt sich MEncoder,
wenn er einen Frame duplizieren will, darauf, dass der Muxer eine Marke auf den
Container setzt, sodass der letzte Frame nochmals angezeigt wird, um
während des Schreibens des aktuellen Frames synchron zu bleiben.
Mit wird MEncoder
statt dessen einfach den zuletzt angezeigten Frame nochmal in die Filterkette
einschieben.
Dies bedeutet, dass der Encoder exakt denselben Frame
zweimal entgegen nimmt und komprimiert.
Dies ergibt eine etwas größere Datei, verursacht jedoch keine Probleme
beim Demuxen oder Remuxen in ein anderes Containerformat.
Du kommst auch nicht um den Einsatz von im
Zusammenhang mit Containerformaten herum, die nicht allzu fest mit
MEncoder verlinkt sind, wie etwa diejenigen,
welche von libavformat unterstützt
werden, der keine Frameduplikation auf Container-Level unterstützt.
Limitierungen des AVI-Containers
Obwohl es das am breitesten unterstützte Containerformat nach MPEG-1 ist,
besitzt AVI auch einige gravierende Nachteile.
Der vielleicht offensichtlichste ist der Overhead.
Für jeden Block der AVI-Datei werden 24 Byte auf Header und Indizes
verschwendet.
Dies heißt übersetzt etwas mehr als 5 MB pro Stunde oder 1-2.5%
Overhead für einen 700 MB Film. Das sieht nicht nach viel aus, könnte aber
die Differenz zwischen einem Video mit 700 KBit/Sek oder 714 KBit/Sek
bedeuten, und jedes bisschen mehr an Qualität zählt.
Zu dieser schockierenden Ineffizienz kommen bei AVI noch folgende
wesentlichen Einschränkungen:
Nur Inhalt mit festen fps kann gespeichert werden. Dies ist insbesondere
dann einschränkend, wenn das Originalmaterial, das du encodieren willst,
gemischter Inhalt ist, zum Beispiel ein Mix aus NTSC-Video und
Filmmaterial.
Eigentlich gibt es Hacks, die es ermöglichen, Inhalt mit gemischter
Framerate in einer AVI unterzubringen, diese vergrößern jedoch den
(ohnehin großen) Overhead fünffach oder mehr und sind somit ungeeignet.
Audio in AVI-Dateien muss entweder konstante Bitrate (CBR) oder
konstante Framegröße haben (also alle Frames decodieren zur selben Anzahl
Samples).
Unglücklicherweise erfüllt Vorbis, der effektivste Codec, keine dieser
Anforderungen.
Deshalb wirst du einen weniger effizienten Codec wie MP3 oder AC3 verwenden
müssen, wenn du planst, einen Film in AVI zu speichern.
Nachdem ich nun all dies erzählt habe, muss ich anmerken, momentan
unterstützt MEncoder keinen Output mit
variablen fps oder Vorbis-Encodierung.
Deswegen magst du dies nicht als Einschränkung ansehen, falls
MEncoder das einzige Tool ist, das du
nutzt, um deine Ecodierungen zu produzieren.
Es ist dennoch möglich, MEncoder nur zur
Videoencodierung zu verwenden und danach externe Tools, um Audio
zu encodieren und in ein anderes Containerformat zu muxen.
Muxen in den Matroska-Container
Matroska ist ein freies, offenes Containerformat, das darauf abzielt,
eine Menge erweiterter Features bereitzustellen, mit denen ältere Container
wie AVI nicht umgehen können.
Zum Beispiel unterstützt Matroska Audioinhalt mit variabler Bitrate (VBR),
variable Frameraten (VFR), Kapitel, Dateianhänge,
Fehlererkennung Error Detection Code (EDC) und modern A/V-Codecs wie "Advanced Audio
Coding" (AAC), "Vorbis" oder "MPEG-4 AVC" (H.264), so gut wie nichts
womit AVI etwas anfangen kann.
Die zum Erzeugen von Matroska-Dateien erforderlichen Tools werden
zusammen mkvtoolnix genannt und stehen
für die meisten Unix-Plattformen wie auch Windows
zur Verfügung.
Weil Matroska ein offener Standard ist, findest du vielleicht andere
Tools, die sich besser für dich eignen, aber da mkvtoolnix das am meisten
Verbreitete ist und von Matroska selbst unterstützt wird, werden wir nur
dessen Anwendung einbeziehen.
Möglicherweise der einfachste Weg, mit Matroska anzufangen, ist
MMG zu verwenden, das grafische Frontend,
das mit mkvtoolnix daherkommt, und dem
guide to mkvmerge GUI (mmg)
zu folgen.
Du kannst Audio und Video-Dateien auch per Befehlszeile muxen:
mkvmerge -o output.mkvinput_video.aviinput_audio1.mp3input_audio2.ac3
würde die Video-Datei input_video.avi
und die zwei Audio-Dateien input_audio1.mp3
und input_audio2.ac3 in die Matroska-Datei
output.mkv mergen.
Matroska, wie zuvor beschrieben, ist in der Lage, noch viel mehr als
das zu tun, wie etwa multiple Audiotracks (inklusive Feintuning der
Audio-/Videosynchronisation), Kapitel, Untertitel, Splitting, usw...
Sieh bitte in den Dokumentationen dieser Anwendungen nach mehr Details.
Wie mit telecine und interlacing in NTSC-DVDs umgehenEinführungWas ist telecine?
Wenn du nicht viel von dem verstehst, was in diesem Dokument beschrieben wird, lies den
Wikipedia-Artikel über Telecine.
Dies ist eine verständliche und einigermaßen umfassende
Beschreibung dessen, was telecine ist.
Eine Anmerkung zu Zahlen
Viele Dokumente, einschließlich des oben verlinkten Handbuchs, beziehen
sich auf den Wert Felder pro Sekunde von NTSC-Video als 59.94 und den
korrespondierenden Frames pro Sekunde als 29.97 (für telecined und
interlaced) und 23.976 (für progressiv). Zur Vereinfachung runden
manche dieser Dokumente sogar auf 60, 30 und 24 auf.
Streng genommen sind alle diese Zahlen Näherungswerte. Das schwarz/weiße
NTSC-Video war exakt 60 Felder pro Sekunde, später wurde jedoch 60000/1001
gewählt, um die Farbdaten anzupassen, solange man gleichzeitig
zu Schwarz/weiß-Fernsehen kompatibel blieb. Digitales NTSC-Video
(so wie auf einer DVD) hat ebenfalls 60000/1001 Felder pro Sekunde. Hieraus
wird interlaced und telecined Video als 30000/1001 Frames pro Sekunde
enthaltend abgeleitet; progressive Video hat 24000/1001 Frames pro Sekunde.
Ältere Versionen der MEncoder-Dokumentation
und viele archivierten Posts in Mailing-Listen beziehen sich auf 59.94,
29.97 und 23.976.
Alle MEncoder-Dokumentationen wurden insofern
aktualisiert, dass sie fraktionale Werte verwenden, und du solltest dies
auch tun.
ist inkorrekt.
sollte statt dessen benutzt werden.
Wie telecine angewandt wird
Jedes Video, das zur Anzeige auf einem NTSC-Fernseh-Set vorgesehen ist,
muss 60000/1001 Felder pro Sekunde haben. Für TV-Filme und Shows
hergestellt sind sie häufig direkt mit 60000/1001 Feldern pro Sekunde
aufgenommen, die Mehrheit der Kinofilme jedoch mit 24 oder 24000/1001
Frames pro Sekunde. Wenn cinematische Movie-DVDs gemastert werden,
wird das Video danach fürs Fernsehen mittels eines telecine genannten
Prozesses konvertiert.
Auf einer DVD wird das Video eigentlich nie als 60000/1001 Felder
pro Sekunde abgelegt. Für ein Video, das ursprünglich 60000/1001 war,
wird jedes Feldpaar zu einem Frame kombiniert, was dann 30000/1001
Frames pro Sekunde ergibt. Hardware-DVD-Player lesen dann ein im
Videostream eingebettetes Kennzeichen aus, um zu bestimmen, ob die gerade
oder ungerade nummerierten Zeilen das erste Feld formen sollen.
Üblicherweise bleibt ein Inhalt mit 24000/1001 Frames pro Sekunde
so wie er ist, wenn er für eine DVD encodiert wird, und der DVD-Player
muss das Telecining on-the-fly bewerkstelligen. Manchmal jedoch wird das
Video telecined bevor es auf der DVD gespeichert wird;
selbst wenn es ursprünglich 24000/1001 Frames pro Sekunde war, wird es
60000/1001 Felder pro Sekunde. Wenn es auf der DVD gespeichert wird,
werden Feldpaare zu 30000/1001 Frames pro Sekunde kombiniert.
Wenn man das aus 60000/10001 Feldern pro Sekunde geformten Einzelframes
erzeugte Video betrachtet, ist telecined oder anderenfalls Interlacing
klar sichtbar woimmer Bewegung auftritt, da ein Feld (sagen wir, die
geradzahlig nummerierten Zeilen) einen Moment zur Zeit 1/(60000/1001) Sekunden
später als das andere repräsentiert. Spielt man ein interlaced Video auf
einem Computer ab, sehen beide hässlich aus, weil der Monitor eine höhere
Auflösung besitzt und weil das Video Frame für Frame anstatt Feld für Feld
angezeigt wird.
Anmerkungen
Dieser Abschnitt gilt nur für NTSC-DVDs und nicht für PAL.
Die MEncoder-Beispielzeilen überall im
Dokument sind nicht zum
eigentlichen Gebrauch vorgesehen. Sie sind schlicht das bloße Minimum,
das zum Encodieren der betreffenden Videokategorie benötigt wird.
Wie mache ich gute DVD-Rips oder wie feintune ich
libavcodec auf maximale
Qualität gehören nicht zum Umfang dieses Dokuments.
Es gibt ein paar Fußnoten speziell für dieses Handbuch, die so ähnlich
verlinkt sind:
[1]
Wie kann man sagen, welchen Typ Video man hatProgressiv
Progressive Video wurde ursprünglich mit 24000/1001 fps gefilmt und
ohne Änderung auf der DVD abgespeichert.
Wenn du eine progressive DVD in MPlayer abspielst,
wird MPlayer folgende Zeile ausgeben, sobald
das Abspielen des Films beginnt:
demux_mpg: 24000/1001 fps progressive NTSC content detected, switching framerate.
Von diesem Punkt an vorwärts sollte demux_mpg nie erzählen, es finde
"30000/1001 fps NTSC content."
Wenn du progressives Video ankuckst, solltest du nie irgendein
Interlacing sehen. Sei trotzdem vorsichtig, weil manchmal ein winziges
bisschen telecine dort hineingemischt wurde, wo du es nicht erwartest.
Ich bin TV-Serien-DVDs begegnet, die eine Sekunde telecine bei jedem
Szenenwechsel haben oder an extrem zufälligen Stellen. Ich hatte mir einmal
eine DVD angesehen, die eine progressive erste Hälfte besaß, und die
zweite Hälfte war telecined. Willst duwirklich
gründlich sein, kannst du den kompletten Film scannen:
mplayer dvd://1 -nosound -vo null -benchmark
Das Verwenden von veranlasst
MPlayer, den Film so schnell er es nur kann
abzuspielen; dies dauert je nach Hardware trotzdem noch eine
Weile. Jedesmal wenn demux_mpg einen Frameratenwechsel meldet, wird dir
die Zeile unmittelbar darüber die Zeit zeigen, bei welcher der Wechsel
auftrat.
Manchmal wird progressive Video auf DVDs
"soft telecine" zugeordnet, weil es dazu vorgesehen ist,
vom DVD-Player telecined zu werden.
Telecined
Telecined Video war ursprünglich mit 24000/1001 aufgenommen, wurde aber
telecined, bevor es auf die DVD geschrieben wurde.
MPlayer meldet keine (nie)
Frameratenwechsel, wenn er telecined Video abspielt.
Beim Betrachten eines telecined Videos wirst du Interlacing-Artefakte
sehen, die zu "blinken" scheinen: sie erscheinen wiederholt
und verschwinden wieder.
Du kannst dir das so genauer hinschauen
mplayer dvd://1
Suche einen Teil mit Bewegung.
Benutze die Taste ., um jeweils einen Frame vorwärts zu rücken.
Schau auf das Muster der interlaced und progressive aussehenden
Frames. Ist das Muster, das du siehst PPPII,PPPII,PPPII,... dann ist das
Video telecined. Siehst du andere Muster, dann wurde das Video womöglich
mittels einiger Nicht-Standard-Methoden telecined;
MEncoder kann ein Nicht-Standard-telecine
nicht verlustfrei nach progressive konvertieren. Siehst du überhaupt
keine Muster, ist es höchstwahrscheinlich interlaced.
Manchmal wird telecined Video auf DVDs "hard telecine"
zugeordnet. Da hard telecine bereits 60000/1001 Felder pro Sekunde hat,
spielt der DVD-Player das Video ohne irgendeine Manipulation ab.
Ein anderer Weg, zu sagen, ob deine Quelle telecined ist oder nicht,
ist die Quelle mit den Befehlszeilenoptionen
und abzuspielen, um nachzusehen, wie
zu den Frames passt.
Ist die Quelle telecined, solltest du in der Befehlszeile ein 3:2 Muster
mit abwechselnd 0+.1.+2 und 0++1
anzeigen.
Diese Technik hat den Vorteil, dass du die Quelle nicht zu beobachten
brauchst, um sie zu identifizieren, was von Nutzen sein könnte, falls du
den Encodiervorgang automatisieren willst oder besagte Prozedur ferngesteuert
mittels einer langsamen Verbindung vornehmen willst.
Interlaced
Interlaced Video wurde ursprünglich als 60000/1001 Felder pro Sekunde
aufgenommen und auf der DVD als 30000/1001 Frames pro Sekunde abgespeichert.
Der interlacing-Effekt (oft "combing" genannt) ist ein Ergebnis
von Kammpaaren von Feldern in Frames. Jedes Feld wird einzeln als
1/(60000/1001) Sekunden angenommen, und wenn sie simultan angezeigt werden,
wird der Unterschied offensichtlich.
Wie bei telecined Video sollte MPlayer niemals
einen Frameratewechsel beim Abspielen des interlaced Inhalts melden.
Wenn du ein interlaced Video genau ansiehst, in dem du dich mit der Taste
. durch die Frames bewegst, wirst du sehen, dass
jeder einzelne Frame interlaced ist.
Gemischtes progressive und telecine
Alle "gemischten progressive und telecine" Videos wurden ursprünglich
als 24000/1001 Frames pro Sekunde aufgenommen, jedoch werden einige Teile
telecined beendet.
Spielt MPlayer diese Kategorie ab, wird er
(oft wiederholt) zwischen "30000/1001 fps NTSC"
und "24000/1001 fps progressive NTSC" zurück und vor wechseln.
Beobachte die untere Hälfte von MPlayers Ausgabe,
um diese Meldungen anzusehen.
Du solltest die Sektion "30000/1001 fps NTSC" überprüfen, um
sicher zu gehen, dass sie auch wirklich telecine sind und nicht einfach
interlaced.
Gemischtes progressive und interlaced
In "gemischtem progressive und interlaced" Inhalt wurde progressive
und interlaced Video zusammengeklebt.
Diese Kategorie sieht aus wie "gemischtes progressive und telecine",
bis du die Sektion 30000/1001 fps untersuchst und feststellst, dass
sie das telecine-Muster nicht haben.
Wie jede Kategorie encodieren
Wie ich anfangs angemerkt hatte, sind die
MEncoder-Beispielzeilen unten eigentlich
nicht zur Anwendung bestimmt;
sie demonstrieren nur die Minimalparameter zur korrekten Encodierung
jeder Kategorie.
Progressive
Progressive Video erfordert kein spezielles Filtern, um es zu encodieren.
Der einzige Parameter, den du gewiss anwenden solltest ist
. Andernfalls wird
MEncoder versuchen, bei 30000/1001 fps
zu encodieren und Frames duplizieren.
mencoder dvd://1 -oac copy -ovc lavc -ofps 24000/1001
Dennoch ist es öfters der Fall, dass ein Video, das progressive aussieht,
eigentlich kurze Teile telecine eingemischt hat. Solange du dir nicht
sicher bist, ist es am sichersten, das Video als
gemischtes progressive und telecine.
zu behandeln. Der Performance-Verlust ist gering
[3].
Telecined
Telecine kann umgekehrt werden, um den originalen 24000/1001-Inhalt zu erhalten,
indem man einen Prozess verwendet, der inverse-telecine genannt wird.
MPlayer enthält verschiedene Filter, um dies
zu erreichen; der beste Filter, wird in der Sektion
Gemischtes progressive und telecine
beschrieben.
Interlaced
In den meisten praktischen Fällen ist es nicht möglich, ein komplett
progressives Video aus interlaced Inhalt zu erhalten. Der einzige Weg,
dies ohne den Verlust der Hälfte der vertikalen Auflösung zu erreichen,
ist das Verdoppeln der Framerate, und man kann versuchen zu
"schätzen", wie die korrespondierenden Zeilen für jedes Feld
vervollständigt werden sollten (dies hat Nachteile - siehe Methode 3).
Das Video in interlaced Form encodieren. Normalerweise richtet Interlacing
verheerenden Schaden für die Fähigkeit des Encoders an, gut zu komprimieren,
libavcodec hat jedoch zwei
eigens für das ein wenig bessere Abspeichern von interlaced Video gedachte
Parameter: und . Auch wenn
die Verwendung von dringend zu empfehlen ist
[2], weil es
Macroblöcke wie nicht-interlaced an Stellen encodiert, an denen keine Bewegung
stattfindet. Beachte, dass hier NICHT notwendig ist.
mencoder dvd://1 -oac copy -ovc lavc -lavcopts ildct:ilme:mbd=2
Nutze einen Deinterlacing-Filter vor dem Encodieren. Es stehen verschiedene
dieser Filter zur Auswahl, jeder mit seinen eigenen Vor-
und Nachteilen. Ziehe zu Rate, um zu sehen, welche
verfügbar sind (suche nach "deint") und durchsuche die
MPlayer-Mailinglisten, um Diskussionen über die zahlreichen Filter
zu finden. Nochmals, die Framerate wechselt nicht, also kein
. Deinterlacing sollte außerdem nach dem Zuschneiden
(cropping) [1]
und vor dem Skalieren angewandt werden.
mencoder dvd://1 -oac copy -vf pp=lb -ovc lavc
Unglücklicherweise arbeitet diese Option im Zusammenhang mit
MEncoder fehlerhaft; sie sollte mit
MEncoder G2 gut funktionieren, den gibts aber
noch nicht. Du könntest Abstürze erleben. Seis drum, der Zweck von
ist es, einen vollen Frame aus jedem Feld
zu erzeugen, was eine Framerate von 60000/1001 ergibt. Der Vorteil dieses
Lösungsansatzes ist, dass nie irgendwelche Daten verloren gehen;
dennoch, da jeder Frame aus nur einem Feld kommt, müssen die fehlenden Zeilen
irgendwie interpoliert werden. Es gibt keine sehr guten Methoden, die
fehlenden Daten zu generieren, und so wird das Resultat ein bisschen aussehen,
als hätte man irgendeinen Deinterlacing-Filter verwendet. Die fehlenden Zeilen
zu generieren erzeugt auch weitere Probleme, einfach weil sich die Menge
an Daten verdoppelt. Somit sind höhere Encodier-Bitraten nötig, um
die Qualität beizubehalten und mehr CPU-Power wird für beides,
Encodieren und Decodieren, aufgewendet. Das Attribut tfields hat mehrere
verschiedene Optionen dafür, wie die fehlenden Zeilen jedes Frames erzeugt
werden.
Wenn du diese Methode nutzt, dann nimm Bezug auf das Handbuch und wähle,
welche Option auch immer am besten für dein Material aussieht.
Beachte, dass du wenn verwendet wird,
sowohl als auch spezifizieren musst,
um die doppelte Framerate der originalen Quelle zu erhalten.
mencoder dvd://1 -oac copy -vf tfields=2 -ovc lavc -fps 60000/1001 -ofps 60000/1001
Wenn du vorhast, dramatisch herunterzuskalieren, kannst du nur eins
der beiden Felder extrahieren und encodieren. Sicherlich, du wirst die
Hälfte der vertikalen Auflösung verlieren, aber wenn du planst, bis auf
1/2 des Originals herunter zu skalieren, macht der Verlust so gut wie
gar nichts aus. Das Resultat wird eine progressive Datei mit 30000/1001
Frames pro Sekunde sein. Die Prozedur ist,
zu verwenden, dann die Ränder abzuschneiden
[1] und angemessen
zu skalieren. Vergiss nicht, dass du die Skalierung anpassen musst, um
das Halbieren der vertikalen Auflösung zu kompensieren.
mencoder dvd://1 -oac copy -vf field=0 -ovc lavcGemischtes progressive und telecine
Um progressive und telecine Video komplett in progressive Video
umzuwandeln, müssen die telecined Teile inverse-telecined werden.
Die drei Wege, dies zu erreichen, werden unten beschrieben.
Beachte, dass du inverse-telecine immer
vor der Reskalierung durchführen solltest; es sei denn, du weißt wirklich,
was du tust; mache inverse-telecine auch vor dem Entfernen der Ränder
[1].
wird hier benötigt, weil das Output-Video
24000/1001 Frames pro Sekunde werden soll.
wurde entworfen, um auf telecined Material
inverse-telecine anzuwenden, während die progressiven Daten unangetastet
bleiben. Damit dies richtig funktioniert, muss
vom -Filter gefolgt werden, sonst
wird MEncoder abstürzen.
ist trotz allem die sauberste und akkurateste
Methode, die zum Encodieren von beidem telecine und
"gemischtem progressive und telecine" zur Verfügung steht.
mencoder dvd://1 -oac copy -vf pullup,softskip -ovc lavc -ofps 24000/1001
Eine ältere Methode ist, anstatt inverse-telecine auf die telecined Teile
anzuwenden, telecine auf nicht-telecined Teile und dann inverse-telecine auf das
ganze Video anzuwenden. Hört sich verwirrend an? softpulldown ist
ein Filter, der ein Video durchgeht und die komplette Datei telecined macht.
Lassen wir auf softpulldown entweder oder
folgen, wird das Endergebnis vollkommen progressiv.
wird benötigt.
mencoder dvd://1 -oac copy -vf softpulldown,ivtc=1 -ovc lavc -ofps 24000/1001
Ich habe selbst verwendet, aber lies hier, was
D Richard Felker III zu erzählen hat:
Es ist OK, aber IMO versucht er zu oft eher ein deinterlace
als ein inverse telecine durchzuführen (ganz wie Settop-DVD-Player
& progressive TVs), was ein hässliches Flimmern erzeugt und
andere Artefakte. Wenn du vorhast, es anzuwenden, musst du zumindest
einige Zeit darauf verwenden, die Optionen zu tunen und zuerst den Output
zu beobachten, damit du auch sicher sein kannst, dass du nichts
vermasselst.
Gemischtes progressive und interlaced
Es gibt zwei Optionen für den Umgang mit dieser Kategorie, jede von
beiden stellt einen Kompromiss dar. Du solltest basierend auf
Dauer/Stelle jedes Typs entscheiden.
Behandle es wie progressive. Die interlaced Teile werden interlaced
aussehen und einige der interlaced Felder müssen weggelassen werden,
was ein wenig zu Sprüngen führt. Du kannst einen
Nachbearbeitungsfilter verwenden, wenn du willst, aber dies wird die
progressive-Anteile geringfügig verringern.
Diese Option sollte definitiv nicht verwendet werden, wenn du eventuell
Video auf einem interlaced Gerät anzeigen willst (mit einer TV-Karte
zum Beispiel). Wenn du interlaced Frames in einem Video mit 24000/1001
Frames pro Sekunde hast, werden diese zusammen mit den progressive
Frames telecined. Die Hälfte der interlaced "Frames" werden für die
Dauer von drei Feldern (3/(60000/1001) Sekunden) angezeigt, was
einen flimmernden "Zeitrücksprung"-Effekt zur Folge hat, der
ziemlich schlecht aussieht. Solltest du dies dennoch versuchen,
musst du einen
Deinterlacing-Filter wie oder
anwenden.
Es wäre auch keine gute Idee für eine progressive Anzeige. Es wird
Paare aufeinander folgender interlaced Felder auslassen, was eine
Unstetigkeit zur Folge hat, die eher sichtbar ist als mit der
zweiten Methode, die einige progressive Frames zweimal anzeigt.
Ein interlaced Video mit 30000/1001 Frames pro Sekunde ist bereits
ein bisschen abgehackt, weil es wirklich mit 60000/1001 Felder pro
Sekunde angezeigt werden sollte, sodass sich die doppelten Frames
nicht zu sehr abzeichnen.
Egal welchen Weg du wählst, es ist das beste, deinen Inhalt
zu berücksichtigen und wie du ihn anzeigen willst. Ist dein Video
zu 90% progressive und du hast nie vor, es auf einem TV-Bildschirm
anzuzeigen, solltest du einen progressive-Ansatz wählen. Ist es nur
halb-progressive, willst du es eventuell so encodieren, als sei alles
interlaced.
Behandle es wie interlaced. Einige Frames des progressive-Anteils
müssen dupliziert werden, was zu Sprüngen führt. Nochmal,
Deinterlacing-Filter können die progressive-Anteile leicht verringern.
FußnotenÜber das Zuschneiden (cropping):
Videodaten auf DVDs werden in einem YUV 4:2:0 genannten Format abgelegt.
In einem YUV-Video, werden Helligkeit und Chrominanz separat gespeichert.
Da das menschliche Auge ein bisschen weniger empfindlich auf Farbe
reagiert als auf Helligkeit, ist in einem YUV 4:2:0 Bild nur ein
Chrominanz-Pixel für alle vier Helligkeits-Pixel vorhanden.
In einem progressive Bild, besitzt jedes Quadrat von vier luma-Pixeln (zwei
auf jeder Seite) ein gemeinsames chroma-Pixel. Du musst progressive YUV
4:2:0 zu geradzahligen Auflösungen zurechtschneiden und geradzahlige
Offsets verwenden. Zum Beispiel ist
OK,
aber nicht.
Wenn du es mit interlaced YUV 4:2:0 zu tun hast, ist die Situation
ein wenig komplizierter. Anstatt dass immer vier luma-Pixel im
Frame sich ein chroma-Pixel teilen, teilen sich
immer vier luma-Pixel in jedem Feld ein
chroma-Pixel. Wenn Felder zur Formung eines Frames interlaced werden,
ist jede Scanzeile ein Pixel hoch. Jetzt liegen anstatt je vier
luma-Pixel in einem Quadrat immer zwei Pixel nebeneinander und die
anderen zwei Pixel liegen zwei Scanzeilen weiter unten nebeneinander.
Die zwei luma-Pixel in der dazwischen liegenden Scanzeile sind vom
anderen Feld und teilen sich somit ein anderes chroma-Pixel mit
zwei luma-Pixeln zwei Scanzeile entfernt. All diese Konfusion macht
es notwendig, vertikale Ausschneide-Abmessungen und Offsets zu
haben, die ein Vielfaches von vier sind. Horizontal kann geradzahlig
bleiben.
Für telecined Video empfehle ich, das Zuschneiden nach dem inverse
telecining stattfinden zu lassen. Ist das Video einmal progressive,
musst du nur noch mit geraden Zahlen zuschneiden. Wenn du wirklich die
leichte Beschleunigung haben willst, die zuerst zuzuschneiden
möglicherweise bietet, musst du vertikal mit einem Vielfachen von vier
zuschneiden, oder der inverse-telecine Filter wird keine korrekten Daten
haben.
Für interlaced (nicht telecined) Video musst du immer
mit einem Vielfachen von vier zuschneiden, es sei denn, du verwendest
vor dem Schneiden.
Über Encodier-Parameter und Qualität:
Nur weil ich hier vorschlage, heißt das nicht,
dass es woanders benutzt werden soll. Zusammen mit
ist eine der Optionen von
libavcodec, welche die
Qualität am deutlichsten heben, und du solltest stets das letzte der beiden
anwenden, außer das Abfallen der Encodiergeschwindigkeit ist abschreckend
hoch (z.B. Encodierung in Echtzeit). Es gibt eine Menge anderer Optionen für
libavcodec, die die Encodierqualität
verbessern (und die Encodiergeschwindigkeit verringern), dies liegt aber jenseits
des Rahmens dieses Dokuments.
Über die Performance von pullup:
kann sicher (zusammen mit )
auf progressive Video angewandt werden und ist für gewöhnlich eine gute Idee,
es sei denn, die Quelle wurde definitiv als vollkommen progressive verifiziert.
Der Performaceverlust ist in den meisten Fällen gering. Bei einer Minimalencodierung
macht MEncoder
50% langsamer. Das Hinzufügen von Soundverarbeitung und erweiterten
überschattet diesen Unterschied
und drückt den Performanceabfall, der mit dem Verwenden von
verbunden war, runter auf 2%.
Encodieren mit der libavcodec
Codecfamilielibavcodec
stellt einfache Encodierung für eine Menge interessanter Video- und Audioformate
zur Verfügung.
Du kannst folgende Codecs encodieren (mehr oder weniger aktuell):
Videocodecs von libavcodecName des VideocodecsBeschreibungmjpeg
Motion-JPEG
ljpeg
Verlustfreies JPEG
h261
H.261
h263
H.263
h263p
H.263+
mpeg4
ISO Standard MPEG-4 (DivX, XviD-kompatibel)
msmpeg4
Pre-Standard MPEG-4 Variante von MS, v3 (AKA DivX3)
msmpeg4v2
Pre-Standard MPEG-4 von MS, v2 (in alten ASF-Dateien verwendet)
wmv1
Windows Media Video, Version 1 (AKA WMV7)
wmv2
Windows Media Video, Version 2 (AKA WMV8)
rv10
RealVideo 1.0
rv20
RealVideo 2.0
mpeg1video
MPEG-1 Video
mpeg2video
MPEG-2 Video
huffyuv
Verlustfreie (lossless) Kompression
asv1
ASUS Video v1
asv2
ASUS Video v2
ffv1
FFmpeg's verlustfreier (lossless) Videocodec
svq1
Sorenson Video 1
flv
Sorenson H.263, der in Flash Video benutzt wird
dvvideo
Sony Digital Video
snow
FFmpeg's experimenteller Wavelet-basierter Codec
Die erste Spalte enthält die Codecnamen, die nach der Konfiguration
vcodec übergeben werden müssen, wie:
Ein Beispiel mit MJPEG-Komprimierung:
mencoder dvd://2 -o title2.avi -ovc lavc -lavcopts vcodec=mjpeg -oac copyAudiocodecs von libavcodecName des AudiocodecsBeschreibungmp2MPEG Layer 2ac3AC3, AKA Dolby Digitaladpcm_ima_wavIMA adaptive PCM (4 Bit pro Sample, 4:1-Kompression)sonicexperimenteller verlustbehafteter/verlustfreier Codec
Die erste Spalte enthält die Codecnamen, die nach der Konfiguration
acodec übergeben werden müssen, wie:
Ein Beispiel mit AC3-Kompression:
mencoder dvd://2 -o title2.avi -oac lavc -lavcopts acodec=ac3 -ovc copy
Im Gegensatz zu den Videocodecs von libavcodec
machen dessen Audiocodecs keinen weisen Gebrauch von den Bits, die ihnen übergeben
werden, da es ihnen an einem minimalen psychoakustischen Modell fehlt (falls
überhaupt eins vorhanden ist), wodurch sich die meisten anderen
Codec-Implementierungen auszeichnen.
Beachte jedoch, dass all diese Audiocodecs sehr schnell sind und überall dort
hervorragend arbeiten, wo MEncoder mit
libavcodec kompiliert wurde (was
meistens der Fall ist) und nicht von externen Programmbibliotheken abhängt.
Encodieroptionen von libavcodec
Idealerweise möchtest du eventuell in der Lage sein, dem Encoder einfach zu sagen,
er soll in den "hochqualitativen" Modus wechseln und weiter machen.
Das wäre vermutlich nett, aber unglücklicherweise schwer zu implementieren, da
verschiedene Encodieroptionen unterschiedliche Qualitätsresultate hervorbringen,
abhängig vom Quellmaterial.
Das liegt daran, dass die Komprimierung von den visuellen Eigenschaften des fraglichen Videos abhängt.
Zum Beispiel haben Anime und Live-Action sehr unterschiedliche Eigenschaften und
benötigen aus diesm Grund verschiedene Optionen, um optimale Encodierung zu erreichen.
Die gute Neuigkeit ist, dass einige Optionen wie ,
und nie ausgelassen werden sollten.
Siehe unten nach der detaillierten Beschreibung allgemeiner Encodieroptionen.
Anzupassende Optionen:vmax_b_frames: 1 oder 2 ist gut, abhängig vom Film.
Beachte, dass du, falls deine Encodierung von DivX5 decodierbar sein muss, den
Support für "closed GOP" aktivieren musst, indem du die
libavcodec-Option
verwendest, du musst jedoch Szenenerkennung deaktivieren, was wiederum keine gute
Idee ist, da es die Ecodierungseffizienz etwas angreift.
vb_strategy=1: hilft in Szenen mit viel
Bewegung (high-motion).
Bei manchen Videos wird vmax_b_frames der Qualität schaden, vmax_b_frames=2
zusammen mit vb_strategy=1 hilft jedoch.
dia: Bewegungssuchbereich. Größer ist besser
als kleiner.
Negative Werte sind ein komplett anderer Maßstab.
Gute Werte sind -1 für ein schnelle oder 2-4 für langsame Encodierung.
predia: Bewegungssuche Vorabdurchlauf (pre-pass).
Nicht so wichtig wie dia. Gute Werte sind 1 (Standard) bis 4. Erfordert preme=2, um
wirklich was zu nützen.
cmp, subcmp, precmp: Vergleichsfunktion zur
Bewegungseinschätzung.
Experimentiere mit Werten von 0 (Standard), 2 (hadamard), 3 (dct) und
6 (Ratenverzerrung).
0 ist am schnellsten und ausreichend für precmp.
Für cmp und subcmp ist 2 gut bei Anime, und 3 ist gut bei Live-Action.
6 kann leicht besser sein oder auch nicht, ist aber langsam.
last_pred: Anzahl der Bewegungsvorhersagen, die
vom vorherigen Frame genommen werden sollen.
1-3 oder so hilft bei geringer Geschwindigkeitseinbuße.
Höhere Werte sind langsam bei keinerlei Zusatzgewinn.
cbp, mv0: Kontrolliert die Auswahl von Macroblöcken.
Kleine Geschwindigkeitseinbußen bei kleinem Qualitätsgewinn.
qprd: adaptive Quantisierung basierend auf der
Komplexität des Macroblocks.
Kann hilfreich sein oder schaden, abhängig vom Video und anderen Optionen.
Dies kann Artefakte verursachen, es sei denn, du setzt vqmax auf einen halbwegs
kleinen Wert (6 ist gut, vielleicht so langsam wie 4); vqmin=1 sollte ebenfalls
helfen.
qns: sehr langsam, speziell wenn kombiniert
mit qprd.
Diese Option veranlasst den Encoder, durch Kompressionsartefakte entstandenes
Rauschen zu minimieren anstatt das encodierte Video strikt der Quelle anzupassen.
Verwende dies nicht, es sei denn du, hast bereits alles andere so weit wie möglich
optimiert und die Resultate sind immer noch nicht gut genug.
vqcomp: Frequenzkontrolle optimieren.
Welche Werte gut sind, hängt vom Film ab.
Du kannst dies sicher so lassen wie es ist, wenn du willst.
Wird vqcomp verringert, werden mehr Bits auf Szenen mit geringer Komlexität
gelegt, wird es erhöht, legt es diese Bits auf Szenen mit hoher Komlexität
(Standard: 0.5, Bereich: 0-1. empfohlener Bereich: 0.5-0.7).
vlelim, vcelim: Setzt die Schwelle für die
Eliminierung einzelner Koeffizienten bei Helligkeits- und Farbanteilen.
Sie werden in allen MPEG-ähnlichen Algorithmen getrennt encodiert.
Die Idee hinter diesen Optionen ist, einige gute Heuristiken zu verwenden,
um zu bestimmen, wenn ein Wechsel innerhalb eines Blocks kleiner als der
der von dir festgelegte Schwellenwert ist und in solch einem Fall den
Block einfach so zu encodieren als fände "kein Wechsel" statt.
Das spart Bits und beschleunigt womöglich die Encodierunng. vlelim=-4 und vcelim=9
scheinen gut für Live-Filme zu sein, helfen aber scheinbar nicht bei Anime;
beim Encodieren einer Animation solltest du sie womöglich unverändert lassen.
qpel: Bewegungsabschätzung auf ein viertel
Pixel (quarter pel).
MPEG-4 verwendet als Voreinstellung eine Halbpixel-Genauigkeit für die Bewegungssuche,
deswegen hat diese Option einen Overhead, da mehr Informationen in der
encodierte Datei untergebracht werden.
Der Kompressionsgewinn/-verlust hängt vom Film ab, ist aber in der Regel nicht
sonderlich effektiv bei Anime.
qpel zieht immer eine signifikante Erhöhung der CPU-Decodierzeit nach
sich (+25% in der Praxis).
psnr: wirkt sich eigentlich nicht auf
das Encodieren aus, schreibt jedoch eine Log-Datei mit Typ/Größe/Qualität
jedes Frames und gibt am Ende die Summe des PSNR Signal-zu-Rauschabstands
(Peak Signal to Noise Ratio) aus.
Optionen, mit denen besser nicht herumgespielt werden sollte:vme: Der Standardwert ist der beste.
lumi_mask, dark_mask: Psychovisuell adaptive
Quantisierung.
Du solltest nicht im Traum daran denken, mit diesen Optionen herumzuspielen,
wenn dir Qualität wichtig ist.
Vernünftige Werte mögen in deinem Fall effektiv sein, aber sei gewarnt,
dies ist sehr subjektiv.
scplx_mask: Versucht, Blockartefakte
zu verhindern, Postprocessing ist aber besser.
Beispiele für Encodierungseinstellungen
Die folgenden Einstellungen sind Beispiele verschiedener Kombinationen
von Encodierungsoptionen, die den Kompromiss Geschwindigkeit gegenüber
Qualität bei gleicher Zielbitrate beeinflussen.
Alle Encodierungseinstellungen wurden auf einem Beispielvideo
mit 720x448 @30000/1001 fps getestet, die Zielbitrate war 900kbps und
der Rechner war ein AMD-64 3400+ mit 2400 MHz im 64bit-Modus.
Jede Encodiereinstellung zeichnet sich aus durch die gemessene
Encodiergeschwindigkeit (in Frames pro Sekunde) und den PSNR-Verlust
(in dB) im Vergleich zu Einstellungen für "sehr hohe Qualität".
Bitte habe Verständnis, dass du abhängig von deiner Quelldatei,
deinem Rechnertyp und Entwicklungsfortschritten sehr unterschiedliche
Resultate erzielen wirst.
BeschreibungEncodieroptionenGeschwindigkeit (in fps)Relativer PSNR-Verlust (in dB)Sehr hohe Qualität6fps0dBHohe Qualität15fps-0.5dBSchnell42fps-0.74dBEchtzeit54fps-1.21dBMaßgeschneiderte inter/intra-Matrizen
Mit diesem Feature von libavcodec
bist du in der Lage, eigene inter- (I-Frames/Keyframes) und intra-Matrizen
(P-Frames/predicted Frames) zu setzen. Es wird von vielen Codecs unterstützt:
mpeg1video und mpeg2video
sollen damit funktionieren.
Eine typische Anwendung dieses Features ist, die von den
KVCD-Specifikationen
bevorzugten Matrizen zu setzen.
Die KVCD "Notch" Quantisierungsmatrix:
Intra:
8 9 12 22 26 27 29 34
9 10 14 26 27 29 34 37
12 14 18 27 29 34 37 38
22 26 27 31 36 37 38 40
26 27 29 36 39 38 40 48
27 29 34 37 38 40 48 58
29 34 37 38 40 48 58 69
34 37 38 40 48 58 69 79
Inter:
16 18 20 22 24 26 28 30
18 20 22 24 26 28 30 32
20 22 24 26 28 30 32 34
22 24 26 30 32 32 34 36
24 26 28 32 34 34 36 38
26 28 30 32 34 36 38 40
28 30 32 34 36 38 42 42
30 32 34 36 38 40 42 44
Anwendung:
$ mencoder input.avi -o output.avi -oac copy -ovc lavc -lavcopts inter_matrix=...:intra_matrix=... $ mencoder input.avi -ovc lavc -lavcopts
vcodec=mpeg2video:intra_matrix=8,9,12,22,26,27,29,34,9,10,14,26,27,29,34,37,
12,14,18,27,29,34,37,38,22,26,27,31,36,37,38,40,26,27,29,36,39,38,40,48,27,
29,34,37,38,40,48,58,29,34,37,38,40,48,58,69,34,37,38,40,48,58,69,79
:inter_matrix=16,18,20,22,24,26,28,30,18,20,22,24,26,28,30,32,20,22,24,26,
28,30,32,34,22,24,26,30,32,32,34,36,24,26,28,32,34,34,36,38,26,28,30,32,34,
36,38,40,28,30,32,34,36,38,42,42,30,32,34,36,38,40,42,44 -oac copy -o svcd.mpgBeispiel
Jetzt hast du gerade eben deine brandneue Kopie von Harry Potter und die
Kammer des Schreckens gekauft (natürlich die Breitbildedition), und du
willst diese DVD so rippen, dass du sie deinem Home Theatre PC hinzufügen
kannst. Dies ist eine Region-1-DVD, also ist sie NTSC. Das unten stehende
Beispiel wird auch auf PAL zutreffen, nur dass du
weglässt (weil die Ausgabeframerate die
gleiche ist wie die Eingabeframerate), und logischerweise werden die
Ausschnittsabmessungen anders sein.
Nach dem Start von , verfolgen wir den
detailliert in der Sektion Wie mit telecine
und interlacing in NTSC-DVDs umgehen beschriebenen Prozess und
entdecken, dass es progressive Video mit 24000/1001 fps ist, was bedeutet, dass
wir keinen inverse telecine-Filter wie oder
anwenden müssen.
Als Nächstes wollen wir das passende Ausschnittsrechteck bestimmen, also
verwenden wir den crop-Erkennungsfilter:
mplayer dvd://1 -vf cropdetect
Stelle sicher, dass du einen voll gefüllten Frame anstrebst (wie zum
Beispiel eine helle Szene), und dass du diese Ausgabe in
MPlayers Konsole siehst:
crop area: X: 0..719 Y: 57..419 (-vf crop=720:362:0:58)
Wir spielen den Film dann mit diesem Filter ab, um seine Korrektheit zu testen:
mplayer dvd://1 -vf crop=720:362:0:58
Und wir sehen, dass er einfach perfekt aussieht. Als Nächstes vergewissern wir
uns, dass Breite und Höhe ein Vielfaches von 16 sind. Die Breite ist gut,
aber die Höhe ist es nicht. Da wir in der 7-ten Klasse in Mathe nicht gefehlt
haben, wissen wir, dass das am nähesten liegende Vielfache von 16 kleiner
als 362 der Wert 352 ist (Taschenrechner ist erlaubt).
Wir könnten einfach verwenden, aber es wäre
nett, ein bisschen von oben und ein bisschen von unten wegzunehmen, sodass
wir zentriert bleiben. Wir haben die Höhe um 10 Pixel schrumpfen lassen, aber
wir wollen das y-Offset nicht um 5 Pixel erhöhen, da dies eine ungerade Zahl
ist und die Qualität nachteilig beeinflussen würde. Statt dessen werden wir
das y-Offset um 4 Pixel erhöhen:
mplayer dvd://1 -vf crop=720:352:0:62
Ein anderer Grund, Pixel von beidem - oben und unten - abzuschnipseln ist,
dass wir sicher gehen wollen, jegliches halbschwarze Pixel eliminiert zu
haben, falls welche existieren. Beachte, falls das Video telecined
ist, stelle sicher, dass der -Filter (oder für
welchen umgekehrten telecine-Filter auch immer du dich entschieden hast)
in der Filterkette auftaucht, bevor du zuschneidest. Ist es interlaced,
deinterlace es vor dem Zuschneiden.
(Wenn du dich entscheidest, interlaced Video beizubehalten, dann vergewissere dich, dass
das vertikale crop-Offset ein Vielfaches von 4 ist.)
Wenn du wirklich besorgt um den Verlust dieser 10 Pixel bist, ziehst du
statt dessen etwa das Herunterskalieren der Abmessungen auf das am nächsten
liegende Vielfache von 16 vor.
Die Filterkette würde dann etwa so aussehen:
-vf crop=720:362:0:58,scale=720:352
Das Video auf diese Art herunter zu skalieren wird bedeuten, dass eine
kleine Menge Details verloren geht, obwohl es vermutlich nicht wahrnehmbar
sein wird. Hoch zu skalieren führt zu niedrigerer Qualität (es sei denn,
du erhöhst die Bitrate). Ausschneiden sondert sämtliche dieser Pixel
aus. Es ist ein Kompromiss, den du unter allen Umständen
in Betracht ziehen solltest. Zum Beispiel, wenn das DVD-Video für das Fernsehen
hergestellt wurde, solltest du vertikales Skalieren vermeiden, da das
Zeilensampling mit der Art und Weise korrespondiert, für die der Inhalt
ursprünglich aufgenommen wurde.
Bei der Überprüfung sehen wir, dass unser Film ordentlich Action enthält
und sehr viele Details, also wählen wir 2400Kbit für unsere Bitrate.
Wir sind nun bereit, die 2-pass Encodierung durchzuführen. Erster Durchlauf:
mencoder dvd://1 -ofps 24000/1001 -oac copy -vf pullup,softskip,crop=720:352:0:62,hqdn3d=2:1:2 -ovc lavc \
-lavcopts vcodec=mpeg4:vbitrate=2400:v4mv:mbd=2:trell:cmp=3:subcmp=3:mbcmp=3:autoaspect:vpass=1 \
-o Harry_Potter_2.avi
Und der zweite Durchlauf ist derselbe, außer dass wir
festlegen:
mencoder dvd://1 -ofps 24000/1001 -oac copy -vf pullup,softskip,crop=720:352:0:62,hqdn3d=2:1:2 -ovc lavc \
-lavcopts vcodec=mpeg4:vbitrate=2400:v4mv:mbd=2:trell:cmp=3:subcmp=3:mbcmp=3:autoaspect:vpass=2 \
-o Harry_Potter_2.avi
Die Optionen werden die Qualität
außerordentlich erhöhen, auf Kosten der Encodierdauer. Es gibt
einen kleinen Grund, diese Optionen auszulassen, wenn das Primärziel
die Qualität ist. Die Optionen
wählen eine Vergleichsfunktion,
die eine höhere Qualität liefert als die Standardeinstellungen.
Du darfst mit diesem Parameter rumexperimentieren (ziehe die Manpage
zu möglichen Werten zu Rate) da verschiedene Funktionen abhängig vom
Quellmaterial einen starken Einfluss auf die Qualität haben. Wenn du zum Beispiel
meinst, dass libavcodec zu
viele Blockartefakte produziert, könntest du ja das experimentelle
NSSE als Vergleichsfunktion via wählen.
Für diesen Film wird das resultierende AVI 138 Minuten lang und nahezu
3GB groß sein. Und weil du erzählt hast, dass eine große Datei nichts
ausmacht, ist dies eine perfekt akzeptierbare Größe. Wolltest du sie aber
kleiner haben, könntest du eine niedrigere Bitrate hernehmen. Erhöhte
Bitraten haben verminderte Rückgaben, während wir also deutlich eine
Verbesserung von 1800Kbit nach 2000Kbit sehen, ist es oberhalb 2000Kbit
nicht so auffällig. Fühl dich frei solange herum zu experimentieren bis
du glücklich bist.
Weil wir das Quellvideo durch einen Denoise-Filter geschickt haben,
könntest du einige davon während des Playbacks wieder hinzufügen wollen.
Dies zusammen mit dem Nachbearbeitungsfilter
verbessert die Wahrnehmung der Qualität drastisch und hilft dabei,
blockhafte Artefakte aus dem Video zu eliminieren.
Mit MPlayers Option
kannst du den Nachbearbeitungsaufwand des spp-Filters abhängig von der
verfügbaren CPU variieren. An dieser Stelle kannst du auch Gamma- und/oder
Farbkorrektur zur besten Anpassung an dein Display verwenden, wenn du willst.
Zum Beispiel:
mplayer Harry_Potter_2.avi -vf spp,noise=9ah:5ah,eq2=1.2 -autoq 3Encodieren mit dem XviD-CodecXviD ist eine freie
Programmbibliothek zum Encodieren von MPEG-4 ASP-Videostreams.
Bevor du mit zu encodieren beginnst, musst du
MEncoder so einstellen, dass er es unterstützt.
Dieses Handbuch beabsichtigt, sich vorwiegend durch dieselbe Art von
Informationen auszuzeichnen wie x264's Encodier-Handbuch.
Beginne deshalb damit,
den ersten Teil
dieses Handbuchs zu lesen.
Welche Optionen sollte ich verwenden, um die besten Resultate zu erzielen?
Bitte beginne mit der Durchsicht der
XviD-Sektion von
MPlayers Manpage.
Diese Sektion ist als Ergänzung zur Manpage zu verstehen.
Die Standardeinstellungen von XviD sind bereits ein guter Kompromiss zwischen
Geschwindigkeit und Qualität, deshalb kannst du ruhig bei ihnen
bleiben, wenn nachfolgender Abschnitt dich allzusehr ins Grübeln bringt.
Encodieroptionen von XviDvhq
Diese Einstellung betreffen den Entscheidungsalgorithmus für
Macroblöcke, wobei gilt, je höher die Einstellung desto weiser die
Entscheidung.
Die Standardeinstellung kann für jede Encodierung sicher verwendet
werden, während höhere Einstellungen immer für PSNR hilfreich, jedoch
signifikant langsamer sind.
Nimm bitte zur Kenntnis, dass ein besserer PSNR nicht notwedigerweise
bedeutet, dass das Bild besser aussehen wird, aber er zeigt dir, dass
du näher am Original bist.
Wird er deaktiviert, beschleunigt dies die Encodierung spürbar; wenn
Geschwindigkeit ein Kriterium für dich ist, kann dieser Kompromiss es wert sein.
bvhq
Dies erledigt dieselbe Arbeit wie vhq, macht dies jedoch bei B-Frames.
Es hat einen vernachlässigbar kleinen Einfluss auf die Geschwindigkeit, und
verbessert geringfügig die Qualität (um etwa +0.1dB PSNR).
max_bframes
Eine höhere Anzahl von erlaubten hintereinander folgenden B-frames verbessert
gewöhnlich die Komprimierbarkeit, obwohl dies auch zu mehr Blockartefakten
führt.
Die Standardeinstellung ist ein guter Kompromiss zwischen Komprimierbarkeit
und Qualität, aber wenn du Bitraten-hungrig bist kannst du sie bis auf 3
hochschrauben.
Du kannst sie auch auf 1 oder 0 verringern, wenn du auf perfekte Qualität
abzielst, wenngleich du in diesem Fall sicherstellen solltest, dass deine
Zielbitrate hoch genug ist, um zu gewährleisten, dass der Encoder nicht
die Quantisierer höher setzen muss, um den Wert zu erreichen.
bf_threshold
Dies kontrolliert die B-Frame-Empfindlichkeit des Encoders, wobei ein
höherer Wert dazu führt, dass mehr B-Frames angewendet werden (und
umgekehrt).
Diese Einstellung muss zusammen mit
verwendet werden; bist du Bitraten-hungrig, solltest du beides erhöhen,
und ,
während du erhöhen und
verringern kannst, sodass der Encoder
B-Frames nur an Stellen anwendet, die diese auch
wirklich brauchen.
Eine niedrigere Zahl an und ein höherer Wert
bei ist möglicherweise keine kluge Wahl,
da dies den Encoder zwingt, B-Frames in Stellen zu setzen, die nicht
davon profitieren würden und dies daher die visuelle Qualität reduziert.
Wie auch immer, wenn du mit Standalone-Playern kompatibel bleiben musst,
die nur alte DivX-Profile unterstützen (der wiederum höchstens einen
aufeinander folgenden B-Frame unterstützt), wäre dies dein einziger Weg,
die Komprimierbarkeit mittels B-Frames zu verbessern.
trellis
Optimiert den Quantisierungsprozess um einen optimalen Kompromiss
zwischen PSNR und Bitrate zu erhalten, was signifikant Bit-sparend
wirkt.
Diese Bits können woanders im Video wieder verwendet werden
und verbessern die visuelle Gesamtqualität.
Du solltest es immer eingeschaltet lassen, da sein Einfluss auf
die Qualität gewaltig ist.
Gerade wenn du Geschwindigkeit haben willst, darfst du es nicht
deaktivieren, solange du nicht
und alle anderen CPU-hungrigeren Optionen auf
ein Minimum heruntergesetzt hast.
hq_ac
Aktiviert die Vorhersagemethode für einen besseren Koeffizientenaufwand, was
die Dateigröße leicht um etwa 0.15 bis 0.19% reduziert (was mit einer
PSNR-Erhöhung um weniger als 0.01dB einhergeht), während es eine
vernachlässigbar kleine Einwirkung auf die Geschwindigkeit hat.
Es empfiehlt sich deshalb, dies immer eingeschaltet zu lassen.
cartoon
Entworfen, um Kartoon-Inhalt besser zu encodieren, und hat keine Auswirkung
auf die Geschwindigkeit, da es lediglich die Heuristiken zur Bestimmung des
Modus für diese Art Inhalt abstimmt.
me_quality
Diese Einstellung ist da, um die Präzision der Bewegungseinschätzung zu
kontrollieren.
Je höher , desto präziser wird die Schätzung
der Originalbewegung sein, und desto besser wird der resultierende Ausschnitt
die Originalbewegung einfangen.
Die Standardeinstellung ist in jedem Fall die beste;
folglich ist es nicht empfehlenswert, sie herunter zu drehen,
es sei denn du hast es wirklich auf Geschwindigkeit abgesehen,
da alle durch eine gute Bewegungseinschätzung gesparten Bits
woanders verwendet würden, was die Gesamtqualität verbessern
würde.
Gehe deshalb nie unter 5, selbst wenn es der letzte Ausweg
sein sollte.
chroma_me
Verbessert die Bewegungsabschätzung dadurch, dass auch die
chroma-(Farb)-Informationen einbezogen werden, wobei
alleine nur luma (Graustufen)
verwendet.
Dies verlangsamt die Encodierung um 5-10%, verbessert aber die
visuelle Qualität durch Reduzieren von Blockeffekten ein wenig
und reduziert die Dateigröße um rund 1.3%.
Wenn du Geschwindigkeit haben willst, solltest du diese Option
deaktivieren, bevor du anfängst zu überlegen,
zu reduzieren.
chroma_opt
Ist dafür vorgesehen, die chroma-Bildqualität rund um reine
weiße/schwarze Kanten zu verbessern, eher noch als die
Kompression zu verbessern.
Dies kann dabei helfen, den "Rote Stufen"-Effekt zu reduzieren.
lumi_mask
Versucht, weniger Bitrate auf den Teil eines Bildes zu übergeben,
der vom menschlichen Auge nicht gut zu sehen ist, was dem Encoder
erlauben sollte, die eingesparten Bits auf wichtigere Teile des
Bildes anzuwenden.
Die durch diese Option gewonnene Encodierungsqualität hängt in
hohem Maße von persönlichen Vorlieben und von Monitortyp und
dessen Einstellungen ab (typischerweise wird es nicht gut aussehen,
wenn er hell oder ein TFT-Monitor ist).
qpel
Hebt die Anzahl Kandidaten der Bewegungsvektoren durch
Erhöhung der Präzision der Bewegungsabschätzung von einem
halben Pixel (halfpel) auf ein viertel Pixel
(quarterpel) an.
Die Idee dahinter ist, bessere Bewegungsvektoren zu finden,
was wiederum die Bitrate reduziert (deshalb wird die Qualität
verbessert).
Bewegungsvektoren mit viertel Pixel Präzision brauchen ein
paar Extrabits für die Codierung, die Bewegungsvektoren ergeben aber
nicht immer ein (viel) besseres Resultat.
Sehr oft verbraucht der Codec dennoch Bits für die Extrapräzision,
jedoch wird im Gegenzug eine geringe oder keine Extraqualität
gewonnen.
Unglücklicherweise gibt es keinen Weg, den möglichen Gewinn von
vorzuaussagen, also musst du eigentlich
mit und ohne encodieren, um sicher zu gehen.
kann fast die doppelte Encodierzeit in
Anspruch nehmen und erfordert etwa 25% mehr
Verarbeitungsleistung fürs Decodieren.
Es wird nicht von allen Standalone-Playern unterstützt.
gmc
Versucht, Bits beim Schwenken von Szenen einzusparen, indem es einen
einzelnen Bewegungsvektor für den gesamten Frame verwendet.
Dies erhöht fast immer den PSNR, verlangsamt aber signifikant
die Encodierung (genauso wie die Decodierung).
Deshalb solltest du es nur nutzen, wenn du
auf das Maximum gestellt hast.
XviDs GMC ist höher
entwickelt als das von DivX, wird aber nur von ein paar
Standalone-Playern unterstützt.
Encodierung Profile
XviD unterstützt Encodierungsprofile über die Option ,
die dazu verwendet werden, den Eigenschaften des XviD-Videostreams
Restriktionen so aufzuerlegen, dass es überall dort abgespielt werden kann,
wo das gewählte Profil unterstützt wird.
Die Restriktionen beziehen sich auf Auflösungen, Bitraten und
bestimmte MPEG-4-Features.
Die folgende Tabelle zeigt, was jedes Profil unterstützt.
EinfachEinfach erweitertDivXProfilname0123012345HandheldPortable NTSCPortable PALHome Theater NTSCHome Theater PALHDTVBreite [Pixel]1761763523521761763523523527201763523527207201280Höhe [Pixel]144144288288144144288288576576144240288480576720Framerate [fps]15151515303015303030153025302530Max. mittlere Bitrate [kbps]646412838412812838476830008000537.648544854485448549708.4Höchstwert mittlere Bitrate über 3 Sek. [kbps]800800080008000800016000Max. B-Frames0000011112MPEG-QuantisierungXXXXXXAdaptive QuantisierungXXXXXXXXXXXXInterlaced EncodierungXXXXXXXXXViertelpixelXXXXXXGlobale BewegungskompensierungXXXXXXEncodierungseinstellungen Beispiele
Die folgenden Einstellungen sind Beispiele unterschiedlicher
Kombinationen von Encodierungsoptionen, die den Kompromiss
zwischen Geschwindigkeit gegenüber Qualität bei gleicher
Zielbitrate betreffen.
Alle Encodierungseinstellungen wurden auf einem Beispielvideo
mit 720x448 @30000/1001 fps getestet, die Zielbitrate war 900kbps,
und der Rechner war ein
AMD-64 3400+ mit 2400 MHz im 64bit-Modus.
Jede Encodierungseinstellung zeichnet sich aus durch die gemessene
Encodiergeschwindigkeit (in Frames pro Sekunde) und den PSNR-Verlust
(in dB) im Vergleich zu Einstellungen für "sehr hohe Qualität".
Bitte hab Verständnis, dass du abhängig von deiner Quelldatei,
deinem Rechnertyp und Entwicklungsfortschritten sehr unterschiedliche
Resultate erzielen wirst.
BeschreibungEncodieroptionenGeschwindigkeit (in fps)Relativer PSNR-Verlust (in dB)Sehr hohe Qualität16fps0dBHohe Qualität18fps-0.1dBSchnell28fps-0.69dBEchtzeit38fps-1.48dBEncodieren mit dem x264-Codecx264 ist eine freie
Programmbibliothek zum Encodieren von H.264/AVC-Videostreams.
Bevor du mit zu encodieren beginnst, musst
du MEncoder so einstellen, dass er es unterstützt.
Encodieroptionen von x264
Bitte beginne mit der Durchsicht der
x264-Sektion von
MPlayers Manpage.
Diese Sektion ist als Anhang zur Manpage vorgesehen.
Hier wirst du Schnellhinweise dazu finden, welche Optionen am
wahrscheinlichsten die meisten Leute interessieren. Die Manpage
ist knapper gehalten, aber auch vollständiger, und zeigt oft
viel bessere technische Details.
EinführungDieses Handbuch berücksichtigt zwei Hauptkategorien der Encodieroptionen:
Optionen, die hauptsächlich Encodierdauer gegenüber Qualität abwägen
Optionen, die zur Erfüllung zahlreicher persönlicher Vorlieben und spezieller Anforderungen nützlich sind
Letztendlich kannst nur du entscheiden, welche Optionen für deine
Zwecke am besten geeignet sind. Die Entscheidung für die erste
Klasse der Optionen ist die einfachste:
Du musst nur entscheiden, ob du denkst, dass Qualitätsunterschiede
Geschwindigkeitsunterschiede rechtfertigen. Für die zweite Klasse
der Optionen sind die Vorzüge weitaus subjektiver, und mehr Faktoren
können involviert sein. Beachte, dass manche der Optionen für
"persönliche Vorlieben und spezielle Anforderungen"
noch große Auswirkungen auf Geschwindigkeit oder Qualität haben können,
das ist aber nicht, wozu sie primär benutzt werden. Ein paar der
Optionen für "persönliche Vorlieben" können sogar Änderungen
verursachen, die für manche Leute besser aussehen aber schlechter
für andere.
Bevor du fortfährst, musst du verstehen, dass dieses Handbuch nur
eine Qualitätsmetrik verwendet: globaler PSNR.
Für eine kurze Erklärung, was PSNR ist, schau dir
den Wikipedia-Artikel zu PSNR
an.
Globaler PSNR ist die letzte gemeldete PSNR-Nummer, wenn du die
Option in
einbindest.
Jedesmal wenn du eine Forderung nach PSNR liest, ist eine der Annahmen
hinter dieser Forderung, dass gleiche Bitraten verwendet werden.
Nahezu alle dieser Handbuchkommentare unterstellen, dass du
2-pass anwendest.
Beim Vergleich der Optionen gibt es zwei Hauptgründe, 2-pass-Encodierung
zu nutzen.
Der erste ist, 2-pass bringt rund 1dB PSNR, was einen sehr
großen Unterschied ausmacht.
Der zweite ist, Optionen zu testen, indem man direkte Qualitätsvergleiche
zu 1-pass-Encodierung anstellt, führt einen einen wichtigen verwirrenden
Faktor ein: die Bitrate variiert bei jeder Encodierung oft signifikant.
Es ist nicht immer einfach zu sagen, ob Qualitätsänderungen vorwiegend
auf geänderte Optionen zurückzuführen sind oder ob sie meist
essentielle, zufällige Unterschiede in der erhaltenen Bitrate reflektieren.
Optionen die primär Geschwindigkeit und Qualität betreffensubq:
Von den Optionen, die dir erlauben, einen Kompromiss zwischen
Geschwindigkeit und Qualität einzugehen, sind
und (siehe unten) gewöhnlich die bei weitem
wichtigsten.
Wenn du dich für die Optimierung von entweder Geschwindigkeit oder Qualität
interessierst, sind diese die ersten, die du in Erwägung ziehen solltest.
Bei der Dimension Geschwindigkeit, interagieren die Optionen
und ziemlich stark
miteinander.
Die Erfahrung zeigt, dass mit einem Referenzframe
(die Standardeinstellung) das ganze etwa 35% mehr Zeit in Anspruch nimmt als
.
Mit 6 Referenzframes wächst der Nachteil auf 60%.
Der Effekt, den auf den PSNR ausübt, scheint ziemlich
konstant zu sein, ungeachtet der Anzahl der Referenzframes.
Typischerweise erreicht einen 0.2-0.5 dB höheren globalen
PSNR im Vergleich zu .
Dies ist gewöhnlich ausreichend, um sichtbar zu werden.
ist der langsamste Modus mit der höchsten
Qualität.
Im Vergleich zu gewinnt sie gewöhnlich 0.1-0.4 dB
globalen PSNR mit Geschwindigkeitseinbußen, die sich zwischen 25%-100%
bewegen.
Im Unterschied zu anderen Levels von hängt das
Verhalten von nicht sehr von
und ab. Statt dessen hängt die Effektivität von
größtenteils von der Anzahl der verwendeten
B-Frames ab. Im Normalgebrauch bedeutet dies,
hat einen großen Einfluss auf Geschwindigkeit und Qualität
in komplexen, stark bewegten Szenen, kann aber auch einen geringen Effekt
in Szenen mit wenig Bewegung haben. Beachte, dass dennoch empfohlen wird,
immer auf etwas anderes als null
zu setzen (siehe unten).
frameref:
ist per Voreinstellung auf 1 gesetzt, jedoch
solltest du deshalb nicht darauf schließen, dass es unbedingt
auf 1 gesetzt sein muss.
Allein die Erhöhung von auf 2 bringt rund
0.15dB PSNR mit einem Geschwindigkeitsnachteil von 5-10%; dies sieht nach
einem guten Kompromiss aus.
bringt rund 0.25dB PSNR mehr als
, was einen sichtbaren Unterschied machen
sollte.
ist rund 15% langsamer als
.
Leider setzen vermindernde Rückgaben schnell ein.
kann erwartungsgemäß nur
0.05-0.1 dB mehr als bei zusätzlichen
15% Geschwindigkeitsnachteil.
Oberhalb sind die Qualitätsgewinne
für gewöhnlich sehr klein (obwohl du während der ganzen Diskussion
im Kopf behalten solltest, dass sie abhängig von deiner Quelle stark
variieren können).
In einem ziemlich typischen Fall wird
den globalen PSNR um ein bisschen mehr als 0.02dB gegenüber
verbessern, bei Geschwindigkeitseinbußen
von 15%-20%.
Bei so hohen -Werten ist das wirklich
einzig Gute, dass man sagen kann, dass ein weiteres Anheben dieses
Wertes ziemlich sicher nie den PSNR schädigen
wird, jedoch sind zusätzliche Qualitätsvorteile sogar kaum messbar,
geschweige denn wahrnehmbar.
Beachte:
Das Erhöhen von auf unnötig hohe Werte
kann und
tut dies üblicherweise auch
die Codiereffizienz schädigen, wenn du CABAC ausschaltest.
Mit eingeschaltetem CABAC (das Standardverhalten) scheint die
Möglichkeit, "zu hoch"
zu setzen, gegenwärtig zu weit entfernt um sich Sorgen zu machen,
und in der Zukunft werden womöglich Optimierungen diese Möglichkeit
ganz und gar ausschließen.
Wenn du auf Geschwindigkeit abzielst, ist ein vernünftiger
Kompromiss, im ersten Durchgang niedrigere - und
-Werte zu nehmen, und sie danach im
zweten Durchgang zu erhöhen.
Typischerweise hat dies einen vernachlässigbar negativen Effekt
auf die Encodierqualität: Du wirst womöglich unter 0.1dB PSNR
verlieren, was viel zu klein für einen sichtbaren Unterschied
sein sollte.
Trotzdem, unterschiedliche Werte für
können auf verschiedene Weise die Frametypenbestimmung beeinflussen.
Höchstwahrscheinlich sind dies außerordentlich seltene Fälle,
willst du jedoch wirklich sicher gehen, ziehe in Betracht, ob
dein Video entweder Vollbild- respektive Einblendungsmuster
oder sehr große temporäre Überdeckungen enthält, was einen I-Frame
erzwingen könnte.
Passe des ersten Durchgangs so an,
dass es groß genug ist, die Dauer des Einblendungszyklus
(oder der Überdeckungen) zu enthalten.
Zum Beispiel, wenn die Szene zwischen zwei Bildern über eine
Zeitspanne von drei Frames rückwärts und vorwärts springt,
setze des ersten Durchgangs auf 3
oder höher.
Dieser Sachverhalt kommt vermutlich extrem selten in
Videomaterial mit Live Action vor, erscheint aber manchmal
bei eingefangenen Computerspiel-Sequenzen.
me:
Diese Option dient der Wahl der Suchmethode der Bewegungseinschätzung.
Diese Option zu verändern stellt einen überschaubaren Kompromiss
zwischen Qualität und Geschwindigkeit dar.
ist nur ein paar Prozent schneller als
die Standardsuche, auf Kosten von unter 0.1dB globalem PSNR. Die
Standardeinstellung () ist ein angemessener
Kompromiss zwischen Qualität und Geschwindigkeit.
bringt ein wenig unter 0.1dB globalem PSNR,
mit Geschwindigkeitsnachteil, der abhängig von
variiert. Bei hohen -Werten (z.B. 12 oder so)
ist etwa 40% langsamer als die Standardeinstellung
. Mit fällt der
Geschwindigkeitsnachteil auf 25%-30%.
verwendet eine gründliche, für die praktische
Anwendung zu langsame Suche.
partitions=all:
Diese Option aktiviert die Verwendung von 8x4, 4x8 und 4x4 Unterteilungen
in den vorhergesagten Macroblöcken (zusätzlich zu den Standardunterteilungen).
Sie zu aktivieren führt zu einem
recht beständigen Geschwindigkeitsverlust von 10%-15%. Sie ist
ziemlich nutzlos bei Quellen, die nur langsame Bewegungen enthalten,
obwohl in manchen Quellen mit sehr viel Bewegung und vielen kleinen,
sich bewegenden Objekten Zugewinne von etwa 0.1dB erwartet werden können.
bframes:
Wenn du gewohnt bist, mit anderen Codecs zu encodieren, hast du
womöglich empfunden, dass B-Frames nicht immer nützlich sind.
Bei H.264 wurde dies geändert: es gibt neue Techniken und Blocktypen,
die in B-Frames möglich sind.
Für gewöhnlich kann selbst ein einfältiger Algorithmus zur Wahl
der B-Frames einen signifikanten PSNR-Vorteil bringen.
Es ist interessant festzustellen, dass die Anwendung von B-Frames
normalerweise den zweiten Durchgang ein bisschen beschleunigt,
und er kann auch eine Encodierung mit einfachem Durchgang etwas
schneller machen, wenn adaptive B-Frame-Bestimmung deaktiviert
ist.
Mit deaktivierter adaptiver B-Framebestimmung
( von )
ist der optimale Wert für diese Einstellung normalerweise nicht
mehr als , andernfalls leiden Szenen
mit sehr viel Bewegung darunter.
Mit aktivierter adaptiver B-Framebestimmung (das Standardverhalten)
ist es sicher, höhere Werte zu verwenden; der Encoder wird die Anwendung
von B-Frames in Szenen reduzieren, in denen sie die Kompression
schädigen könnten.
Der Encoder zieht es selten vor, mehr als 3 oder 4 B-Frames zu
verwenden; diese Option höher zu setzen wird einen geringen Effekt haben.
b_adapt:
Beachte: Dies ist standardmäßig eingeschaltet.
Ist diese Option aktiviert, wird der Encoder einen einigermaßen schnellen
Entscheidungsprozess zur Reduzierung der Anzahl B-Frames in Szenen anwenden, die
nicht viel von ihnen profitieren würden.
Du kannst dazu verwenden, zu optimieren wie
froh der Encoder über B-Frames sein soll.
Der Geschwindigkeitsnachteil adaptiver B-Frames ist gegenwärtig ziemlich
bescheiden, und genauso ist der potentielle Qualitätsgewinn.
Es sollte aber normalerweise nicht schaden.
Beachte, dass dies nur Geschwindigkeit und Frametypenbestimmung im ersten
Durchgang betrifft.
und haben keinen
Effekt auf nachfolgende Durchgänge.
b_pyramid:
Du kannst diese Option genauso gut aktivieren, falls du >=2 B-Frames
verwendest; wie die Manpage dir sagt, erreichst du eine kleine
Qualitätsverbesserung bei keinerlei Geschwindigkeitseinbuße.
Beachte, dass diese Videos von libavcodec-basierten Decodern
älter als etwa 5. März 2005 nicht gelesen werden können.
weight_b:
In typischen Fällen gibt es nicht viel Gewinn mit dieser Option.
Trotzdem, in überblendenden oder ins Schwarze übergehenden Szenen
liefert die gewichtete Vorhersage ziemlich große Einsparungen bei der Bitrate.
In MPEG-4 ASP wird ein Übergang ins Schwarze gewöhnlich am besten
als eine Serie aufwändiger I-Frames codiert; das Verwenden einer
gewichteten Vorhersage in B-Frames macht es möglich, wenigstens
manche von diesen in viel kleinere B-Frames zu wandeln.
Der Verlust an Encodierzeit ist minimal, da keine extra Bestimmungen
vorgenommen werden müssen.
Auch werden die CPU-Anforderungen des Encoders, im Gegensatz zu den
Einschätzungen mancher Leute, von gewichteter Vorhersage nicht sonderlich
beeinflusst, ansonsten bleibt alles gleich.
Leider hat der aktuelle Algorithmus zur adaptiven B-Frame-Bestimmung
eine starke Tendenz, B-Frames während des Fadens zu verhindern.
Bis sich dies ändert, kann es eine gute Idee sein,
zu deinen x264encopts hinzuzufügen, falls
du erwartest, dass Fades einen großen Effekt in deinem jeweiligen
Videoclip erzeugen.
Diverse Eigenschaften betreffende Optionen2-pass-Encodierung:
Oben wurde vorgeschlagen, immer 2-pass-Encodierung anzuwenden.
Es gibt aber durchaus Gründe, dies nicht zu tun. Beispielsweise bist du,
wenn du Live-TV aufnimmst und in Echtzeit encodierst,
gezwungen, einen einzigen Durchgang zu verwenden.
Auch ist ein Durchgang offensichtlich schneller als zwei Durchgänge;
wenn du exakt die gleichen Optionen bei beiden Durchgängen anwendest,
ist das Encodieren in zwei Durchgängen mindestens zweimal so langsam.
Noch gibt es sehr gute Gründe, in zwei Durchgängen zu encodieren.
Zum einen ist Ratenkontrolle in einem Durchgang kein Allheilmittel.
Sie trifft oft eine unvernünftige Auswahl, weil sie das große
Bild nicht sehen kann. Zum Beispiel angenommen, du hast ein zwei Minuten
langes Video bestehend aus zwei ausgeprägten Hälften. Die erste Hälfte
besitzt eine 60 Sekunden dauernde Szene mit sehr viel Bewegung, die
einzeln für sich etwa 2500kbps benötigt, um anständig auszusehen.
Direkt daruffolgend kommt eine viel weniger anspruchsvolle 60 Sekunden
lange Szene, die bei 300kbps gut aussieht. Angenommen du forderst in
der Theorie 1400kbps an, was beiden Szenen ausreichend entgegenkommen
würde. Die Ratenkontrolle in einem Durchgang wird in diesem Fall
ein paar "Fehler" machen. Zuallererst wird es in beiden Segmenten
1400kbps anpeilen. Das erste Segment könnte schwer überquantisiert enden,
was es unakzeptabel und unangemessen blockhaft aussehen lässt.
Das zweite Segment wird schwer unterquantisiert sein; es sieht vielleicht
perfekt aus, aber der Bitratenverlust dieser Perfektion wird komplett
unangemessen sein.
Noch schwerer vermeidbar ist das Problem am Übergang beider Szenen.
Die ersten Sekunden der Hälfte mit wenig Bewegung wird enorm
überquantisiert sein, weil die Ratenkontrolle noch die Art Anforderung
an die Bitrate erwartet, der sie in der ersten Hälfte des Videos begegnet
war. Diese "Fehlerperiode" der extrem überquantisierten Szene
mit wenig Bewegung wird fürchterlich schlecht aussehen, und wird sogar
weniger als die 300kbps in Anspruch nehmen als das, was sie genommen hätte, um annehmbar
auszusehen. Es gibt Mittel und Wege, diese Fälle des Encodierens in einem
Durchgang zu mildern, diese werden allerdingst dahin tendieren, die
fehlerhaften Vorhersagen der Bitraten zu häufen.
Multipass-Ratenkontrolle kann gegenüber der eines einzigen Durchgangs
enorm große Vorteile bieten.
Indem sie die im ersten Encodierungsdurchlauf gesammelte Statistik
verwendet, kann der Encoder mit angemessener Genauigkeit den Aufwand
(in Bit) abschätzen, den das Encodieren jeden gegebenen Frames bei
jedem gegebenen Quantisierer erfordert. Dies erlaubt eine viel
rationalere, besser geplante Zuweisung von Bits zwischen den
bithungrigen Szenen mit viel Bewegung und denen bescheidenen mit
wenig Bewegung.
Siehe unten für einige Ideen darüber, wie man
diese Zuweisungen nach seinem Geschmack optimiert.
Darüber hinaus brauchen zwei Durchgänge zweimal so lang wie ein Durchgang.
Du kannst die Optionen im ersten Durchgang auf höhere Geschwindigkeit
und niedrigere Qualität optimieren.
Wenn du deine Optionen geschickt wählst, kannst du einen sehr schnellen
ersten Durchgang hinkriegen.
Die resultierende Qualität im zweiten Durchgang wird geringfügig niedriger
ausfallen, weil die Größenvorhersage weniger akkurat ist, jedoch
ist die Qualitätsdifferenz normalerweise viel zu klein, um sichtbar zu sein.
Versuche zum Beispiel zu
des ersten Durchgangs hinzuzufügen.
Verwende dann im zweiten Durchgang langsamere, hochwertigere Optionen:
Encodierung mit drei Durchgängen?
x264 bietet die Möglichkeit, eine beliebige Anzahl aufeinander folgender
Durchgänge auszuführen. Wenn du im ersten Durchgang
spezifizierst, dann verwende im nachfolgenden
Durchgang, der nachfolgende Durchgang wird beides tun, die Statistik des
vorhergehenden Durchgangs lesen und seine eigene Statistik schreiben.
Ein zusätzlicher Durchgang, der diesem folgt, wird eine sehr gute Basis
haben, von der aus er hochpräzise Vorhersagen der Framegrößen bei
einem gewählten Quantisierer machen kann.
In der Praxis ist der damit erzielte gesamte Qualitätsgewinn
gewöhnlich nahezu null, und ziemlich wahrscheinlich resultiert ein dritter
Durchgang in einem geringfügig schlechteren globalen PSNR als der Durchgang
davor. In der typischen Anwendung helfen drei Durchgänge, wenn du entweder
eine schleche Vorhersage der Bitraten oder schlecht aussehende Szenenübergänge
beim Verwenden nur eines Durchlaufs bekommst.
Dies passiert mit ziemlicher Wahrscheinlichkeit bei extrem kurzen Clips.
Ebenso gibt es ein paar Spezialfälle, in denen drei (oder mehr) Durchgänge
erfahrenen Nutzern dienlich sind, aber um es kurz zu machen, dieses Handbuch
behandelt die Diskussion solcher speziellen Fälle nicht.
qcomp:
wägt die Anzahl der für "aufwändige" Frames
mit viel Bewegung vorgesehenen Bits gegen die für "weniger aufwändige"
Frames mit wenig Bewegung ab.
Bei einem Extrem zielt auf eine echte konstante
Bitrate ab. Typischerweise würde dies Szenen mit viel Bewegung vollkommen
ätzend aussehen lassen, während Szenen mit wenig Bewegung womöglich absolut
perfekt aussehen, jedoch öfter mehr Bitrate verwenden würden, als sie es für
lediglich sehr gutes Aussehen bräuchten. Beim anderen Extrem
erreicht nahezu konstante Quantisierungsparameter
(QP). Ein konstanter QP sieht nicht schlecht aus, die meisten Leute meinen
aber, es sei vernünftiger, etwas Bitrate aus den extrem aufwändigen Szenen
zu nehmen (wobei dort der Qualitätsverlust micht ganz so augenfällig ist)
und sie wieder den Szenen zuzuweisen, die bei sehr guter Qualität leichter
zu encodieren sind.
ist per Voreinstellung auf 0.6 gesetzt, was für den
Geschmack mancher Leute etwas zu langsam sein könnte (0.7-0.8 werden im
Allgemeinen auch verwendet).
keyint:
ist einzig und allein zur Abwägung der
Durchsuchbarkeit der Datei gegenüber der Codiereffiziez da.
Als Standardwert ist auf 250 gesetzt. In
Material mit 25fps garantiert dies, auf 10 Sekunden genau
suchen zu können. Wenn du meinst, es wäre wichtig und nützlich,
auf 5 Sekunden genau suchen zu können, setze es auf ;
dies wird der Qualität/Bitrate leicht schaden. Wenn es dir nur um Qualität
geht und nicht um die Durchsuchbarkeit, kannst du viel höhere Werte
setzen (vorausgesetzt du verstehst, daß es verringerte Resultate gibt, die verschwindend
klein werden oder sogar gegen null gehen). Der Videostream wird nach
wie vor suchbare Stellen besitzen, solange einige Szenenwechsel
vorhanden sind.
deblock:
Dieses Thema ist im Begriff etwas kontrovers zu geraten.
H.264 definiert eine simple Deblocking-Prozedur bei I-Blöcken, die
von vorgegebenen Stärken und vom QP des strittigen Blocks
abhängigen.
Mit dem Standardwert werden hohe QP-Blöcke stark gefiltert, und
niedrige QP-Blöcke werden überhaupt nicht entblockt.
Die vom Standard definierten vorgegebenen Stärken sind mit
Bedacht gewählt und die Chancen stehen sehr gut, dass sie
PSNR-optimal sind, egal welches Video auch immer du zu encodieren
versuchst.
Der Parameter erlaubt dir, Offsets festzulegen,
um Deblocking-Schwellen voreinzustellen.
Viele Leute scheinen zu glauben, es sei eine gute Idee, die Stärke
des Deblocking-Filters um hohe Beträge abzusenken (sagen wir -3).
Dies ist jedoch meist keine gute Idee, und in den meisten Fällen
verstehen Leute, die das machen, nicht viel davon wie Deblocking
standardmäßig funktioniert.
Die erste und wichtigste Sache, die man über den
in-loop-Deblocking-Filter wissen sollte, ist, dass die
Standardschwellenwerte meistens PSNR-optimal sind.
In den seltenen Fällen, in denen sie nicht optimal sind, ist das
ideale Offset plus oder minus 1.
Die Deblocking-Parameter durch einen höheren Betrag anzupassen
garantiert meist, dem PSNR zu schaden.
Das Verstärken des Filters wird mehr Details verwischen; den
Filter zu schwächen wird das Auftreten von Blockeffekten
erhöhen.
Es ist definitiv eine schlechte Idee, die Deblocking-Schwellenwerte
herabzusetzen, falls deine Quelle eine vorwiegend niedrige räumliche
Komplexität besitzt (z.B. nicht viele Details oder Rauschen).
Der in-loop-Filter macht eigentlich einen exzellenten Job durch
das Kaschieren auftretender Artefakte.
Besitzt die Quelle eine hohe räumliche Komplexität, sind Artefakte
weniger bemerkbar.
Dies ist so, weil das Schwingen (ringing) dazu neigt, wie Details
oder Rauschen auszusehen.
Die viselle Wahrnehmung des Menschen erkennt leicht, wenn Details
entfernt wurden, aber erkennt nicht so leicht, wenn Rauschen falsch
dargestellt wird.
Wird die Qualität subjektiv, sind Details und Rauschen etwas
austauschbares.
Durch das Herabsetzen der Deblocking-Filterstärke verstärkst du
höchstwahrscheinlich Fehler durch Hinzufügen von
Schwingungsartefakten, aber dem Auge fällt nichts auf, weil
es die Artefakte mit Details verwechselt.
Dies rechtfertigt jedoch nach wie vor
nicht das Herabsetzen der Deblocking-Filterstärke.
Du kannst im Allgemeinen besseres Qualitätsrauschen im Postprocessing
erzielen.
Falls deine H.264-Encodierungen zu verschwommen oder verschmiert
aussehen, versuche, mit
beim Abspielen des encodierten Films
herumzuspielen.
sollte die meisten weichen Artefakte
kaschieren.
Es wird meist mit Sicherheit besser aussehen als die Resultate, die
du durch einfaches Herumtüfteln mit dem Deblocking-Filter bekommen
hättest.
Beispiele für Encodieroptionen
Die folgenden Einstellungen sind Beispiele unterschiedlicher
Kombinationen von Encodier-Optionen, die einen Kompromiss zwischen
Geschwindigkeit und Qualität bei gleicher Zielbitrate darstellen.
All diese Encodier-Einstellungen wurden an einem Beispielvideo
mit 720x448 @30000/1001 fps getestet, die Zielbitrate war 900kbps,
und der Rechner war ein
AMD-64 3400+ mit 2400 MHz im 64bit-Modus.
Jede Encodier-Einstellung zeichnet sich durch eine gemessene
Encodiergeschwindigkeit (in Frames pro Sekunde) und dem
PSNR-Verlust (in dB) im Vergleich zu den "sehr
hochwertigen" Einstellung aus.
Bitte hab dafür Verständnis, dass du abhängig von deiner Quelle, deinem
Rechnertyp und Entwicklungsfortschritten sehr unterschiedliche Resultate
erhalten kannst.
BeschreibungEncodier-OptionenGeschwindigkeit (in fps)Relativer PSNR-Verlust (in dB)Sehr hohe Qualität6fps0dBHohe Qualität13fps-0.89dBSchnell17fps-1.48dBEncodieren mit der Video for Windows Codecfamilie
Video for Windows bietet einfaches Encodieren mittels binärer Video-Codecs.
Du kannst mit folgenden Codecs encodieren (solltest du mehr haben, teile es
uns bitte mit!)
Beachte, dass der Support hierfür sehr experimentell ist, und
einige Codecs arbeiten vielleicht nicht korrekt. Manche Codecs werden
nur in bestimmten Farbräumen funktionieren, versuche
und ,
falls ein Codec versagt oder einen falschen Output liefert.
Von Video for Windows unterstützte CodecsVideo-Codec DateinameBeschreibung (FourCC)md5sumKommentaraslcodec_vfw.dllAlparysoft verlustfreier (lossless) Codec vfw (ASLC)608af234a6ea4d90cdc7246af5f3f29aavimszh.dllAVImszh (MSZH)253118fe1eedea04a95ed6e5f4c28878benötigt avizlib.dllAVIzlib (ZLIB)2f1cc76bbcf6d77d40d0e23392fa8edadivx.dllDivX4Windows-VFWacf35b2fc004a89c829531555d73f1e6huffyuv.dllHuffYUV verlustfrei (lossless) (HFYU)b74695b50230be4a6ef2c4293a58ac3biccvid.dllCinepak Video (cvid)cb3b7ee47ba7dbb3d23d34e274895133icmw_32.dllMotion Wavelets (MWV1)c9618a8fc73ce219ba918e3e09e227f2jp2avi.dllImagePower MJPEG2000 (IPJ2)d860a11766da0d0ea064672c6833768bm3jp2k32.dllMorgan MJPEG2000 (MJ2C)f3c174edcbaef7cb947d6357cdfde7ffm3jpeg32.dllMorgan Motion JPEG Codec (MJPG)1cd13fff5960aa2aae43790242c323b1mpg4c32.dllMicrosoft MPEG-4 v1/v2b5791ea23f33010d37ab8314681f1256tsccvid.dllTechSmith Camtasia Screen Codec (TSCC)8230d8560c41d444f249802a2700d1d5vp31vfw.dllOn2 Open Source VP3 Codec (VP31)845f3590ea489e2e45e876ab107ee7d2vp4vfw.dllOn2 VP4 Personal Codec (VP40)fc5480a482ccc594c2898dcc4188b58fvp6vfw.dllOn2 VP6 Personal Codec (VP60)04d635a364243013898fd09484f913fbstürzt unter Linux abvp7vfw.dllOn2 VP7 Personal Codec (VP70)cb4cc3d4ea7c94a35f1d81c3d750bc8dfalscher FourCC?ViVD2.dllSoftMedia ViVD V2 Codec VfW (GXVE)a7b4bf5cac630bb9262c3f80d8a773a1
Die erste Spalte enthält die Codec-Namen, die nach dem Parameter
codec übergeben werden sollten, wie:
.
Der FourCC-Code, der von jedem Codec verwendet wird, steht in Klammern.
Ein Beispiel mit VP3-Kompression:
mencoder dvd://2 -o title2.avi -ovc vfw -xvfwopts codec=vp31vfw.dll -oac copyVerwenden des MEncoder zum Erzeugen VCD/SVCD/DVD-konformer Dateien.FormatbeschränkungenMEncoder ist in der Lage, MPEG-Dateien im VCD-, SCVD-
und DVD-Format durch Verwendung der
libavcodec-Programmbibliothek
zu erzeugen.
Diese Dateien können danach im Zusammenhang mit
vcdimager
oder
dvdauthor
zum Erzeugen von Disks verwendet werden, die auf einem Standard Set-Top-Player
abgespielt werden können.
Die Formate DVD, SVCD und VCD sind starken Beschränkungen unterworfen.
Es ist nur eine kleine Auswahl an encodierten Bildgrößen und Seitenverhältnissen
verfügbar.
Wenn dein Film nicht bereits die Anforderungen erfüllt, musst du das Bild
skalieren, zuschneiden oder schwarze Ränder hinzufügen, um es konform zu machen.
FormatbeschränkungenFormatAuflösungV. CodecV. BitrateSamplerateA. CodecA. BitrateFPSSeitenverhältnisNTSC DVD720x480, 704x480, 352x480, 352x240MPEG-29800 kbps48000 HzAC3,PCM1536 kbps (max)30000/1001, 24000/10014:3, 16:9 (nur für 720x480)NTSC DVD352x240
Diese Auflösungen werden selten für DVDs verwendet, da sie von
ziemlch niedriger Qualität sind.MPEG-11856 kbps48000 HzAC3,PCM1536 kbps (max)30000/1001, 24000/10014:3, 16:9NTSC SVCD480x480MPEG-22600 kbps44100 HzMP2384 kbps (max)30000/10014:3NTSC VCD352x240MPEG-11150 kbps44100 HzMP2224 kbps24000/1001, 30000/10014:3PAL DVD720x576, 704x576, 352x576, 352x288MPEG-29800 kbps48000 HzMP2,AC3,PCM1536 kbps (max)254:3, 16:9 (nur für 720x576)PAL DVD352x288MPEG-11856 kbps48000 HzMP2,AC3,PCM1536 kbps (max)254:3, 16:9PAL SVCD480x576MPEG-22600 kbps44100 HzMP2384 kbps (max)254:3PAL VCD352x288MPEG-11152 kbps44100 HzMP2224 kbps254:3
Wenn ein Film ein 2.35:1 Seitenverhältnis hat (die meisten aktuellen Action-Filme),
wirst du schwarze Ränder hinzufügen oder den Film auf 16:9 zuschneiden müssen,
um eine DVD oder VCD herzustellen.
Wenn du schwarze Ränder hinzufügst, versuche diese an 16-Pixel-Rändern
auszurichten, um den Einfluß auf die Encodier-Performance zu minimieren.
Zum Glück besitzen DVDs eine ausreichend hohe Bitrate, damit du dich
nicht zu sehr um die Encodier-Effizienz sorgen musst. SVCD
und VCD jedoch sind höchst mager an Bitrate und erfordern Aufwand, um akzeptable
Qualität zu erreichen.
GOP-Größenbeschränkungen
DVD, VCD und SVCD zwingen dich auch zu relativ niedrigen
GOP-Größen (Group of Pictures).
Für Material mit 30 fps ist die größte erlaubte GOP-Größe 18.
Für 25 oder 24 fps ist das Maximum 15.
Die GOP-Größe wird mittels der Option gesetzt.
Bitraten-Beschränkungen
VCD-Video muss bei CBR 1152 kbps sein.
Zu dieser nach oben begrenzten Einschränkung kommt auch noch eine
extrem niedrige vbv-Puffergröße von 327 Kilobit.
SVCD erlaubt das Variieren der Video-Bitraten auf bis zu 2500 kbps,
und eine etwas weniger restriktive vbv-Puffergröße von 917 Kilobit
ist erlaubt.
DVD-Video-Bitraten können sich bis auf irgendwo um die 9800 kbps
einpegeln (wenngleich typische Bitraten etwa halb so groß sind),
und die vbv-Puffergröße ist 1835 Kilobit.
Output-OptionenMEncoder besitzt Optionen zur Kontrolle des
Output-Formats.
Durch das Verwenden dieser Optionen können wir ihn anweisen, den
korrekten Dateityp zu erzeugen.
Die Optionen für VCD und SVCD werden xvcd und xsvcd genannt, weil sie
erweiterte Formate sind.
Sie sind nicht strikt Standard-konform, hauptsächlich weil der Output
keine Scan-Offsets enthält.
Wenn du ein SVCD-Image generieren musst, solltest du die Output-Datei
dem
vcdimager
übergeben.
VCD:
-of mpeg -mpegopts format=xvcd
SVCD:
-of mpeg -mpegopts format=xsvcd
DVD:
-of mpeg -mpegopts format=dvd
DVD mit NTSC-Pullup:
-of mpeg -mpegopts format=dvd:telecine -ofps 24000/1001
Dies erlaubt 24000/1001 fps progressive-Inhalt bei 30000/1001
fps encodiert zu werden, wobei die DVD-Konformität erhalten bleibt.
Seitenverhältnis
Der Parameter für das Seitenverhältnis von wird zum Encodieren
des Seitenverhältnisses einer Datei verwendet.
Während des Playbacks wird das Seitenverhältnis dazu benutzt, die korrekte
Größe des Videos wieder herzustellen.
16:9 oder "Breitbild"
-lavcopts aspect=16/9
4:3 oder "Vollbild"
-lavcopts aspect=4/3
2.35:1 oder "Cinemascope" NTSC
-vf scale=720:368,expand=720:480 -lavcopts aspect=16/9
Um die korrekte Skalierungsgröße zu berechnen, verwende die
erweiterte NTSC-Breite von 854/2.35 = 368
2.35:1 oder "Cinemascope" PAL
-vf scale="720:432,expand=720:576 -lavcopts aspect=16/9
Um die korrekte Skalierungsgröße zu berechnen, verwende die
erweiterte PAL-Breite von 1024/2.35 = 432
Aufrechterhalten der A/V-Synchronisation
Um die Audio-/Video-Synchronisation während der kompletten
Encodierung aufrechtzuerhalten, muss
MEncoder Frames auslassen oder duplizieren.
Dies funktioniert beim Muxen in eine AVI-Datei ziemlich gut,
aber meist schlägt das Aufrechterhalten der A/V-Synchronisation mit
anderen Muxern wie etwa MPEG garantiert fehl.
Dies ist der Grund, weshalb es nötig ist, den
-Video-Filter am Ende der Filterkette anzuhängen,
um diese Art Problem zu vermeiden.
Du findest mehr technische Informationen zu
im Abschnitt
Verbessern der Mux- und A/V-Synchronisationszuverlässigkeit
oder in der Manpage.
Sampleraten-Konvertierung
Wenn die Audio-Samplerate in der Originaldatei nicht dieselbe wie die
vom Zielformat angeforderte ist, wird eine Sampleraten-Konvertierung
erforderlich.
Dies wird erreicht, indem man die Option und
den Audio-Filter zusammen
anwedet.
DVD:
-srate 48000 -af lavcresample=48000
VCD und SVCD:
-srate 44100 -af lavcresample=44100Verwenden des libavcodec zur VCD/SVCD/DVD-EncodierungEinführunglibavcodec kann verwendet
werden, um ein VCD/SVCD/DVD-konformes Video durch die Anwendung der
passenden Optionen zu erzeugen.
lavcopts
Dies ist eine Liste von Feldern in , die du
möglicherweise ändern musst, um einen für VCD, SVCD
oder DVD konformen Film herzustellen:
acodec:
für VCD, SVCD oder PAL DVD;
wird am häufigsten für DVD verwendet.
PCM-Audio kann auch für DVD verwendet werden, aber dies ist meistens
eine riesen Platzverschwendung.
Beachte, dass MP3-Audio nicht konform für irgendeines dieser Formate
ist, aber Player haben oft ohnehin kein Problem, es abzuspielen.
abitrate:
224 für VCD; bis zu 384 für SVCD; bis zu 1536 für DVD, aber
übliche Werte reichen von 192 kbps für Stereo bis 384 kbps für
5.1-Kanal-Sound.
vcodec:
für VCD;
für SVCD;
wird gewöhnlich für DVD verwendet, man kann aber auch
für CIF-Auflösungen verwenden.
keyint:
Angewandt, um die GOP-Größe zu setzen.
18 für Material mit 30fps oder 15 für Material mit 25/24 fps.
Kommerzielle Hersteller scheinen Keyframe-Intervalle von 12 zu bevorzugen.
Es ist möglich, dies viel größer zu machen und dennoch die Kompatibilität
zu den meisten Player zu behalten.
Ein von 25 sollte nie irgendwelche Probleme machen.
vrc_buf_size:
327 für VCD, 917 für SVCD und 1835 für DVD.
vrc_minrate:
1152 für VCD. kann für SVCD und DVD so gelassen werden.
vrc_maxrate:
1152 für VCD; 2500 für SVCD; 9800 für DVD.
Für SVCD und DVD könntest du niedrigere Werte verwenden, abhängig von
deinen persönlichen Vorlieben und Anforderungen.
vbitrate:
1152 für VCD;
bis zu 2500 für SVCD;
bis zu 9800 für DVD.
Für letztere zwei Formate sollte vbitrate basierend auf persönliche
Vorlieben gesetzt werden.
Zum Beispiel, wenn du darauf bestehst, 20 Stunden oder so passend auf
eine DVD zu bringen, könntest du vbitrate=400 benutzen.
Die sich daraus ergebende Video-Qualität würde womöglich äußerst mies.
Wenn du versuchst, die maximal mögliche Qualität auf eine DVD zu quetschen,
nimm vbitrate=9800, aber sei gewarnt, dass dich dies zu weniger als
einer Stunde Video auf einer Single-Layer DVD zwingen würde.
Beispiele
Dies ist eine typische Zusammenstellung von mindestens zu verwendenden
-Optionen zum Encodieren eines Videos:
VCD:
-lavcopts vcodec=mpeg1video:vrc_buf_size=327:vrc_minrate=1152:\
vrc_maxrate=1152:vbitrate=1152:keyint=15:acodec=mp2
SVCD:
-lavcopts vcodec=mpeg2video:vrc_buf_size=917:vrc_maxrate=2500:vbitrate=1800:\
keyint=15:acodec=mp2
DVD:
-lavcopts vcodec=mpeg2video:vrc_buf_size=1835:vrc_maxrate=9800:vbitrate=5000:\
keyint=15:acodec=ac3Erweiterte Optionen
Für das Encodieren höherer Qualität könntest du auch qualitätssteigernde
Optionen an lavcopts anfügen, wie etwa ,
und weitere.
Beachte, dass und , obwohl
oft bei MPEG-4 nützlich, nicht auf MPEG-1 oder MPEG-2 anwendbar sind.
Außerdem, wenn du versuchst, eine sehr hochwertige DVD-Encodierung zu
machen, kann es nützlich sein, an lavcopts
anzufügen.
Wobei dies helfen könnte, das Auftreten von Blöcken in fahl-farbenen
Bereichen zu reduzieren.
Zusammenfassend ist dies ein Beispiel einer Zusammenstellung von lavcopts für
für eine höherwertige DVD:
-lavcopts vcodec=mpeg2video:vrc_buf_size=1835:vrc_maxrate=9800:vbitrate=8000:\
keyint=15:trell:mbd=2:precmp=2:subcmp=2:cmp=2:dia=-10:predia=-10:cbp:mv0:\
vqmin=1:lmin=1:dc=10Encodieren von Audio
VCD und SVCD unterstützen MPEG-1 Layer II Audio, indem sie einen
MP2-Encoder von
toolame,
twolame,
oder libavcodec
verwenden.
Der libavcodec MP2 ist weit davon entfernt, so gut zu sein wie die
anderen zwei Bibliotheken, dennoch sollte er immer verfügbar sein.
VCD unterstützt nur Audio mit konstanten Bitraten (CBR) wogegen SVCD
auch variable Bitraten (VBR) unterstützt.
Sei vorsichtig, wenn du VBR benutzt, weil einige schlechte
Standalone-Player diese nicht so gut unterstützen könnten.
Für DVD-Audio wird der AC3-Codec von
libavcodec
verwendet.
toolame
Für VCD und SVCD:
-oac toolame -toolameopts br=224twolame
Für VCD und SVCD:
-oac twolame -twolameopts br=224libavcodec
Für DVD mit 2-Kanal-Sound:
-oac lavc -lavcopts acodec=ac3:abitrate=192
Für DVD mit 5.1-Kanal-Sound:
-channels 6 -oac lavc -lavcopts acodec=ac3:abitrate=384
Für VCD und SVCD:
-oac lavc -lavcopts acodec=mp2:abitrate=224Zusammenfassung
Diese Sektion zeigt einige komplette Befehle zum Erzeugen von
VCD/SVCD/DVD-konformen Videos.
PAL DVDmencoder -oac lavc -ovc lavc -of mpeg -mpegopts format=dvd -vf scale=720:576,\
harddup -srate 48000 -af lavcresample=48000 -lavcopts vcodec=mpeg2video:\
vrc_buf_size=1835:vrc_maxrate=9800:vbitrate=5000:keyint=15:acodec=ac3:\
abitrate=192:aspect=16/9 -ofps 25 \
-o movie.mpgmovie.aviNTSC DVDmencoder -oac lavc -ovc lavc -of mpeg -mpegopts format=dvd -vf scale=720:480,\
harddup -srate 48000 -af lavcresample=48000 -lavcopts vcodec=mpeg2video:\
vrc_buf_size=1835:vrc_maxrate=9800:vbitrate=5000:keyint=18:acodec=ac3:\
abitrate=192:aspect=16/9 -ofps 30000/1001 \
-o movie.mpgmovie.aviPAL AVI mit enthaltenem AC3 Audio nach DVD
Hat die Quelle bereits AC3-Audio, nimm -oac copy anstatt es
erneut zu encodieren.
mencoder -oac copy -ovc lavc -of mpeg -mpegopts format=dvd -vf scale=720:576,\
harddup -lavcopts vcodec=mpeg2video:vrc_buf_size=1835:vrc_maxrate=9800:\
vbitrate=5000:keyint=15:aspect=16/9 -ofps 25 \
-o movie.mpgmovie.aviNTSC AVI mit AC3-Ton nach DVD
Hat die Quelle bereits AC3-Audio und ist NTSC @ 24000/1001 fps:
mencoder -oac copy -ovc lavc -of mpeg -mpegopts format=dvd:telecine \
-vf scale=720:480,harddup -lavcopts vcodec=mpeg2video:vrc_buf_size=1835:\
vrc_maxrate=9800:vbitrate=5000:keyint=15:aspect=16/9 -ofps 24000/1001 \
-o movie.mpgmovie.aviPAL SVCDmencoder -oac lavc -ovc lavc -of mpeg -mpegopts format=xsvcd -vf \
scale=480:576,harddup -srate 44100 -af lavcresample=44100 -lavcopts \
vcodec=mpeg2video:mbd=2:keyint=15:vrc_buf_size=917:vrc_minrate=600:\
vbitrate=2500:vrc_maxrate=2500:acodec=mp2:abitrate=224 -ofps 25 \
-o movie.mpgmovie.aviNTSC SVCDmencoder -oac lavc -ovc lavc -of mpeg -mpegopts format=xsvcd -vf \
scale=480:480,harddup -srate 44100 -af lavcresample=44100 -lavcopts \
vcodec=mpeg2video:mbd=2:keyint=18:vrc_buf_size=917:vrc_minrate=600:\
vbitrate=2500:vrc_maxrate=2500:acodec=mp2:abitrate=224 -ofps 30000/1001 \
-o movie.mpgmovie.aviPAL VCDmencoder -oac lavc -ovc lavc -of mpeg -mpegopts format=xvcd -vf \
scale=352:288,harddup -srate 44100 -af lavcresample=44100 -lavcopts \
vcodec=mpeg1video:keyint=15:vrc_buf_size=327:vrc_minrate=1152:vbitrate=1152:\
vrc_maxrate=1152:acodec=mp2:abitrate=224 -ofps 25 \
-o movie.mpgmovie.aviNTSC VCDmencoder -oac lavc -ovc lavc -of mpeg -mpegopts format=xvcd -vf \
scale=352:240,harddup -srate 44100 -af lavcresample=44100 -lavcopts \
vcodec=mpeg1video:keyint=18:vrc_buf_size=327:vrc_minrate=1152:vbitrate=1152:\
vrc_maxrate=1152:acodec=mp2:abitrate=224 -ofps 30000/1001 \
-o movie.mpgmovie.avi