FMUSER Bezdrôtové vysielanie videa a zvuku je jednoduchšie!
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> afrikánčina
sq.fmuser.org -> albánsky
ar.fmuser.org -> arabčina
hy.fmuser.org -> Arménsky
az.fmuser.org -> azerbajdžanský
eu.fmuser.org -> baskičtina
be.fmuser.org -> bieloruský
bg.fmuser.org -> Bulgarian
ca.fmuser.org -> katalánčina
zh-CN.fmuser.org -> čínština (zjednodušená)
zh-TW.fmuser.org -> čínština (tradičná)
hr.fmuser.org -> chorvátčina
cs.fmuser.org -> čeština
da.fmuser.org -> dánčina
nl.fmuser.org -> Dutch
et.fmuser.org -> estónčina
tl.fmuser.org -> filipínsky
fi.fmuser.org -> fínčina
fr.fmuser.org -> French
gl.fmuser.org -> galícijčina
ka.fmuser.org -> gruzínsky
de.fmuser.org -> nemčina
el.fmuser.org -> Greek
ht.fmuser.org -> haitská kreolčina
iw.fmuser.org -> hebrejčina
hi.fmuser.org -> hindčina
hu.fmuser.org -> Hungarian
is.fmuser.org -> islandský
id.fmuser.org -> indonézština
ga.fmuser.org -> írsky
it.fmuser.org -> Italian
ja.fmuser.org -> japončina
ko.fmuser.org -> kórejčina
lv.fmuser.org -> lotyšský
lt.fmuser.org -> litovčina
mk.fmuser.org -> macedónsky
ms.fmuser.org -> malajčina
mt.fmuser.org -> maltčina
no.fmuser.org -> Norwegian
fa.fmuser.org -> perzský
pl.fmuser.org -> poľština
pt.fmuser.org -> portugalčina
ro.fmuser.org -> rumunčina
ru.fmuser.org -> ruština
sr.fmuser.org -> srbčina
sk.fmuser.org -> slovenčina
sl.fmuser.org -> slovinčina
es.fmuser.org -> španielčina
sw.fmuser.org -> svahilčina
sv.fmuser.org -> švédčina
th.fmuser.org -> Thai
tr.fmuser.org -> turečtina
uk.fmuser.org -> ukrajinčina
ur.fmuser.org -> urdčina
vi.fmuser.org -> Vietnamese
cy.fmuser.org -> waleština
yi.fmuser.org -> jidiš
Predslov
Algoritmus kompresie videa H264 je dnes nepochybne najrozšírenejšou a najpopulárnejšou technikou kompresie videa. So zavedením knižníc otvoreného zdroja, ako sú x264 / openh264 a ffmpeg, už väčšina používateľov nemusí robiť príliš veľa podrobností o H264, čo výrazne znižuje náklady ľudí používajúcich H264.
Aby sme však mohli H264 dobre využívať, musíme prísť na základné princípy H264. Dnes sa pozrieme na základné princípy H264.
Prehľad H264
Technológia kompresie H264 využíva na kompresiu videodát hlavne nasledujúce metódy. zahŕňajú:
Intrarámcová predikčná kompresia rieši problém redundancie priestorových údajov.
Medzisnímková predikčná kompresia (odhad pohybu a kompenzácia) rieši problém redundancie údajov v časovej oblasti.
Integer Discrete Cosine Transform (DCT), ktorá transformuje priestorovú koreláciu na irelevantné údaje vo frekvenčnej doméne a potom ju kvantizuje.
Kompresia CABAC.
Komprimovaný rám je rozdelený na: rám I, rám P a rám B:
I frame: kľúčový rám, využívajúci technológiu kompresie vnútri rámu.
P rámec: dopredu referenčný rámec, pri kompresii sa odkazuje iba na predtým spracovaný rámec. Použite technológiu kompresie zvuku rámu.
B rám: Obojsmerný referenčný rám. Počas kompresie označuje predchádzajúci a nasledujúci rámec. Pomocou technológie kompresie medzi snímkami.
Okrem I / P / B rámcov existujú aj obrazové sekvencie GOP.
GOP: Medzi dvoma snímkami I je sekvencia obrázkov a v sekvencii obrázkov je iba jeden rámec. Ako je ukázané nižšie:
Teraz si podrobne popíšeme kompresnú technológiu H264.
Technológia kompresie H264
Základný princíp H264 je v skutočnosti veľmi jednoduchý, poďme si v krátkosti popísať proces kompresie dát H264. Video snímky zachytené kamerou (vypočítané na 30 snímok za sekundu) sa odosielajú do medzipamäte kodéra H264. Kodér musí najskôr rozdeliť makrobloky pre každý obrázok.
Vezmite si nasledujúci obrázok ako príklad:
Deliaci makroblok
H264 štandardne používa oblasť makra 16X16 ako blok makier a dá sa tiež rozdeliť na veľkosť 8X8.
Po rozdelení makrobloku vypočítajte hodnotu pixelov makrobloku.
Analogicky sa vypočíta hodnota pixelov každého makrobloku v obraze a všetky makrobloky sa spracujú nasledujúcim spôsobom.
Čiastkový blok
H264 používa pre relatívne ploché obrázky makrobloky 16X16. Aby sa však dosiahla vyššia miera kompresie, možno menšie čiastkové bloky rozdeliť aj na makrobloky 16x16. Veľkosť podbloku môže byť 8X16, 16X8, 8X8, 4X8, 8X4, 4X4, čo je veľmi flexibilné.
Na vyššie uvedenom obrázku má väčšina makroblokov 16X16 v červenom ráme modré pozadie a časť obrázka troch orlov je nakreslená v tomto makrobloku. Kvôli lepšiemu spracovaniu čiastkových obrázkov troch orlov sú H264 Multiple čiastkové bloky rozdelené do makroblokov 16X16.
Týmto spôsobom je možné po kompresii vnútri rámca získať efektívnejšie údaje. Obrázok nižšie je výsledkom kompresie vyššie uvedených makroblokov pomocou súborov mpeg-2 a H264. Ľavá polovica je výsledkom kompresie po rozdelení podbloku MPEG-2 a pravá polovica je výsledkom kompresie podbloku H264. Je vidieť, že metóda delenia H264 má viac výhod.
Po rozdelení makrobloku je možné zoskupiť všetky obrázky vo vyrovnávacej pamäti kodéra H264.
Zoskupenie rámcov
Pre video dáta existujú hlavne dva typy redundancie dát, jeden je redundancia dát v čase a druhý je redundancia dát v priestore. Spomedzi nich je časová redundancia údajov najväčšia. Najprv si povieme niečo o probléme redundancie času video dát.
Prečo je časová nadbytočnosť najväčšia? Za predpokladu, že kamera zaznamená 30 snímok za sekundu, údaje týchto 30 snímok väčšinou súvisia. Je tiež možné, že viac ako 30 rámcov údajov, desiatky rámcov alebo stovky rámcov údajov sú obzvlášť úzko spojené.
Pre tieto veľmi úzko súvisiace rámce v skutočnosti musíme uložiť iba jeden rámec údajov a z tohto rámca možno podľa určitých pravidiel predvídať ďalšie rámce, takže videodáta majú najväčšiu časovú redundanciu.
Aby sa dosiahlo, že príslušné rámce komprimujú dáta pomocou predikčnej metódy, je potrebné zoskupiť video rámce. Ako teda zistiť, že určité rámce úzko súvisia a dajú sa zoskupiť? Pozrime sa na príklad. Nižšie je zachytený videozáznam skupiny pohybujúcich sa biliardových gúľ. Biliardové gule sa kotúľajú z pravého horného rohu do ľavého dolného rohu.
Kodér H264 vylúči zakaždým dva susedné rámce na porovnanie makroblokov s cieľom vypočítať podobnosť dvoch rámcov. Ako je ukázané nižšie:
Prostredníctvom skenovania makroblokov a hľadania makroblokov je možné zistiť, že korelácia medzi týmito dvoma snímkami je veľmi vysoká. Ďalej sa zistilo, že stupeň korelácie tejto skupiny rámcov je veľmi vysoký. Preto je možné vyššie uvedené snímky rozdeliť do jednej skupiny. Algoritmus je: na susedných obrázkoch sú pixely, ktoré sa všeobecne líšia, iba do 10%, rozdiel jasu nepresahuje 2% a rozdiel farebnosti sa mení iba do 1%. Myslíme si, že to Grafy je možné zoskupiť.
V takejto skupine rámcov po kódovaní ponecháme iba úplné údaje prvého príspevku a ďalšie rámce sa vypočítajú s odvolaním sa na predchádzajúci rámec. Prvý rámec voláme IDR / I rámec a ďalšie rámce nazývame P / B rámec, preto kódovanú skupinu dátových rámcov nazývame GOP.
Odhad pohybu a kompenzácia
Po zoskupení rámcov v kodéri H264 je potrebné vypočítať pohybové vektory objektov v skupine rámcov. Na príklade vyššie uvedeného pohyblivého rámčeka s biliardovým videom sa pozrime, ako sa počíta s vektorom pohybu.
Kodér H264 najskôr vyberie dva rámce obrazových údajov z hlavičky vyrovnávacej pamäte postupne a potom vykoná skenovanie makroblokov. Ak sa na jednom z obrázkov nájde objekt, vyhľadávanie sa uskutoční v blízkosti druhého obrázka (vo vyhľadávacom okne). Ak sa objekt v súčasnosti nachádza na inom obrázku, je možné vypočítať vektor pohybu objektu. Nasledujúci obrázok ukazuje polohu biliardovej gule po vyhľadaní.
Z rozdielu medzi polohami biliardových gúľ na vyššie uvedenom obrázku možno vypočítať smer a vzdialenosť tabuľkového obrázka. H264 postupne zaznamenáva vzdialenosť a smer pohybu lopty v každom ráme a stáva sa nasledujúcim.
Po výpočte vektora pohybu sa odčíta rovnaká časť (tj. Zelená časť), aby sa získali údaje o kompenzácii. Nakoniec nám stačí komprimovať a uložiť údaje o kompenzácii a potom je možné pri dekódovaní obnoviť pôvodný obrázok. Komprimované údaje musia zaznamenať iba malé množstvo údajov. Nasledovne:
Pohybový vektor a kompenzáciu nazývame technológia medzisnímkovej kompresie, ktorá rieši redundanciu dát videozáznamov v čase. Okrem medzisnímkovej kompresie musí byť v rámci vykonaná aj kompresia údajov. Intrarámcová kompresia dát rieši redundanciu priestorových dát. Teraz predstavíme technológiu kompresie v rámci snímky.
Vnútorná predpoveď
Ľudské oko má určitý stupeň rozpoznania obrazu, je veľmi citlivé na jas nízkej frekvencie a nie je príliš citlivé na jas vysokej frekvencie. Preto na základe niektorých výskumov možno z obrazu odstrániť údaje, ktoré nie sú citlivé na ľudské oči. Týmto spôsobom je navrhnutá technológia intra predikcie.
Intrarámcová kompresia H264 je veľmi podobná JPEG. Po rozdelení obrázka na makrobloky je možné každý makroblok predvídať v 9 režimoch. Nájdite predikčný režim, ktorý je najbližšie k pôvodnému obrázku.
Nasledujúci obrázok predstavuje proces predikcie každého bloku makier na celom obrázku.
Porovnanie medzi obrazom po intra predikcii a pôvodným obrazom je nasledujúce:
Potom sa pôvodný obraz a intrapredikovaný obraz odčítajú, aby sa získala zvyšková hodnota.
Potom uložte informácie o predikčnom režime, ktoré sme dostali predtým, aby sme mohli pri dekódovaní obnoviť pôvodný obrázok. Účinok je nasledovný:
Po kompresii medzi snímkami a medzi snímkami sú údaje výrazne znížené, ale stále existuje priestor na optimalizáciu.
Vykonajte DCT na zvyškových dátach
Zvyškové údaje je možné podrobiť celočíselnej diskrétnej kosínusovej transformácii, aby sa odstránila korelácia údajov a údaje sa ďalej komprimovali. Ako je znázornené na obrázku nižšie, ľavá strana je makroblok pôvodných údajov a pravá strana je makroblok vypočítaných zvyškových údajov.
Makroblok zvyškových údajov sa digitalizuje, ako je znázornené na obrázku nižšie:
Konverzia DCT sa vykonáva na makrobloku zvyškových údajov.
Po odstránení súvisiacich údajov vidíme, že sa údaje ďalej komprimujú.
Po dokončení DCT to nestačí a na bezstratovú kompresiu je potrebný CABAC.
CABAC
Vyššie uvedená kompresia v rámci snímky je technikou stratovej kompresie. Inými slovami, po komprimácii sa obrázok nedá úplne obnoviť. CABAC je technológia bezstratovej kompresie.
Technológia bezstratovej kompresie môže byť pre každého najviac známa: Huffmanovo kódovanie, krátky kód pre vysokofrekvenčné slová, dlhý kód pre nízkofrekvenčné slová na dosiahnutie účelu kompresie dát. VLC použitá v MPEG-2 je tento druh algoritmu. Ako príklad si vezmeme AZ, A patrí k vysokofrekvenčným údajom a Z patrí k nízkofrekvenčným údajom. Uvidíte, ako sa to robí.
CABAC je tiež krátky kód pre vysokofrekvenčné údaje a dlhý kód pre nízkofrekvenčné údaje. Zároveň bude komprimovať na základe kontextu, ktorý je oveľa efektívnejší ako VLC. Účinok je nasledovný:
Teraz nahraďte AZ rámom videa a bude vyzerať nasledovne.
Z vyššie uvedeného obrázku je zrejmé, že schéma bezstratovej kompresie pomocou CACBA je oveľa efektívnejšia ako VLC.
zhrnutie
V tomto okamihu sme dokončili princíp kódovania H264. Tento článok hovorí hlavne o nasledujúcich bodoch:
1. Jianyin uviedla v H264 niektoré základné pojmy. Ako napríklad rám I / P / B, GOP.
2. Podrobne vysvetlil základné princípy kódovania H264 vrátane:
Delenie makroblokov
Zoskupenie obrázkov
Princíp technológie kompresie v rámci snímky
Princíp technológie medzisnímkovej kompresie.
DCT
Princíp kompresie CABAC.
|
Zadajte e-mail, aby ste dostali prekvapenie
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> afrikánčina
sq.fmuser.org -> albánsky
ar.fmuser.org -> arabčina
hy.fmuser.org -> Arménsky
az.fmuser.org -> azerbajdžanský
eu.fmuser.org -> baskičtina
be.fmuser.org -> bieloruský
bg.fmuser.org -> Bulgarian
ca.fmuser.org -> katalánčina
zh-CN.fmuser.org -> čínština (zjednodušená)
zh-TW.fmuser.org -> čínština (tradičná)
hr.fmuser.org -> chorvátčina
cs.fmuser.org -> čeština
da.fmuser.org -> dánčina
nl.fmuser.org -> Dutch
et.fmuser.org -> estónčina
tl.fmuser.org -> filipínsky
fi.fmuser.org -> fínčina
fr.fmuser.org -> French
gl.fmuser.org -> galícijčina
ka.fmuser.org -> gruzínsky
de.fmuser.org -> nemčina
el.fmuser.org -> Greek
ht.fmuser.org -> haitská kreolčina
iw.fmuser.org -> hebrejčina
hi.fmuser.org -> hindčina
hu.fmuser.org -> Hungarian
is.fmuser.org -> islandský
id.fmuser.org -> indonézština
ga.fmuser.org -> írsky
it.fmuser.org -> Italian
ja.fmuser.org -> japončina
ko.fmuser.org -> kórejčina
lv.fmuser.org -> lotyšský
lt.fmuser.org -> litovčina
mk.fmuser.org -> macedónsky
ms.fmuser.org -> malajčina
mt.fmuser.org -> maltčina
no.fmuser.org -> Norwegian
fa.fmuser.org -> perzský
pl.fmuser.org -> poľština
pt.fmuser.org -> portugalčina
ro.fmuser.org -> rumunčina
ru.fmuser.org -> ruština
sr.fmuser.org -> srbčina
sk.fmuser.org -> slovenčina
sl.fmuser.org -> slovinčina
es.fmuser.org -> španielčina
sw.fmuser.org -> svahilčina
sv.fmuser.org -> švédčina
th.fmuser.org -> Thai
tr.fmuser.org -> turečtina
uk.fmuser.org -> ukrajinčina
ur.fmuser.org -> urdčina
vi.fmuser.org -> Vietnamese
cy.fmuser.org -> waleština
yi.fmuser.org -> jidiš
FMUSER Bezdrôtové vysielanie videa a zvuku je jednoduchšie!
Kontakt
adresa:
Budova č. 305 Izba HuiLan č. 273 Huanpu Road Kanton Čína 510620
Kategórie
Prihlás sa na odber Newslettra