FMUSER Bezdrôtové vysielanie videa a zvuku je jednoduchšie!
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> afrikánčina
sq.fmuser.org -> albánsky
ar.fmuser.org -> arabčina
hy.fmuser.org -> Arménsky
az.fmuser.org -> azerbajdžanský
eu.fmuser.org -> baskičtina
be.fmuser.org -> bieloruský
bg.fmuser.org -> Bulgarian
ca.fmuser.org -> katalánčina
zh-CN.fmuser.org -> čínština (zjednodušená)
zh-TW.fmuser.org -> čínština (tradičná)
hr.fmuser.org -> chorvátčina
cs.fmuser.org -> čeština
da.fmuser.org -> dánčina
nl.fmuser.org -> Dutch
et.fmuser.org -> estónčina
tl.fmuser.org -> filipínsky
fi.fmuser.org -> fínčina
fr.fmuser.org -> French
gl.fmuser.org -> galícijčina
ka.fmuser.org -> gruzínsky
de.fmuser.org -> nemčina
el.fmuser.org -> Greek
ht.fmuser.org -> haitská kreolčina
iw.fmuser.org -> hebrejčina
hi.fmuser.org -> hindčina
hu.fmuser.org -> Hungarian
is.fmuser.org -> islandský
id.fmuser.org -> indonézština
ga.fmuser.org -> írsky
it.fmuser.org -> Italian
ja.fmuser.org -> japončina
ko.fmuser.org -> kórejčina
lv.fmuser.org -> lotyšský
lt.fmuser.org -> litovčina
mk.fmuser.org -> macedónsky
ms.fmuser.org -> malajčina
mt.fmuser.org -> maltčina
no.fmuser.org -> Norwegian
fa.fmuser.org -> perzský
pl.fmuser.org -> poľština
pt.fmuser.org -> portugalčina
ro.fmuser.org -> rumunčina
ru.fmuser.org -> ruština
sr.fmuser.org -> srbčina
sk.fmuser.org -> slovenčina
sl.fmuser.org -> slovinčina
es.fmuser.org -> španielčina
sw.fmuser.org -> svahilčina
sv.fmuser.org -> švédčina
th.fmuser.org -> Thai
tr.fmuser.org -> turečtina
uk.fmuser.org -> ukrajinčina
ur.fmuser.org -> urdčina
vi.fmuser.org -> Vietnamese
cy.fmuser.org -> waleština
yi.fmuser.org -> jidiš
(1) Redundantné informácie o videosignáli
Ak vezmeme ako príklad komponentný formát záznamu digitálneho videa YUV, predstavuje YUV jas a dva signály rozdielu farieb. Napríklad pre existujúci systém pal TV je vzorkovacia frekvencia jasového signálu 13.5 MHz; frekvenčné pásmo chroma signálu je zvyčajne polovica alebo menej signálu jasu, čo je 6.75 MHz alebo 3.375 MHz. Ak vezmeme príklad vzorkovacej frekvencie 4: 2: 2, signál Y prijíma 13.5 MHz, farebný signál U a V sa vzorkuje o 6.75 MHz a vzorkovací signál sa kvantizuje o 8 bitov, potom sa dá vypočítať kódová rýchlosť digitálneho videa. nasledovne:
13.5 * 8 + 6.75 * 8 + 6.75 * 8 = 216Mbit / s
Ak sa také veľké množstvo údajov uloží alebo prenesie priamo, bude ťažké použiť kompresnú technológiu na zníženie bitovej rýchlosti. Digitálny video signál je možné komprimovať podľa dvoch základných podmienok:
L. redundancia údajov. Napríklad priestorová redundancia, časová redundancia, redundancia štruktúry, redundancia informačnej entropie atď., To znamená, že existuje silná korelácia medzi pixelmi obrazu. Eliminácia tejto redundancie nevedie k strate informácií a je to bezstratová kompresia.
L. vizuálna nadbytočnosť. Niektoré charakteristiky ľudských očí, ako napríklad prah diskriminácie jasu, vizuálny prah, sa líšia citlivosťou na jas a farebnosť, čo znemožňuje zaviesť príslušné chyby v kódovaní a nebudú detekované. Vizuálne charakteristiky ľudských očí možno použiť na výmenu za kompresiu údajov s určitým objektívnym skreslením. Táto kompresia je stratová.
Kompresia digitálneho obrazového signálu je založená na vyššie uvedených dvoch podmienkach, čo spôsobuje, že obrazové dáta sú značne komprimované, čo vedie k prenosu a ukladaniu. Bežné metódy kompresie digitálneho videa sú zmiešané kódovanie, čo znamená kombinovať transformačné kódovanie, odhad pohybu a pohybovú kompenzáciu a entropické kódovanie na komprimovanie kódovania. Zvyčajne sa transformačné kódovanie používa na elimináciu medzisnímkovej redundancie obrazu a odhad pohybu a pohybová kompenzácia sa používajú na odstránenie medzisnímkovej redundancie obrazu a entropické kódovanie sa používa na ďalšie zlepšenie účinnosti kompresie. V krátkosti sú predstavené nasledujúce tri metódy kompresného kódovania.
a) Metóda kompresného kódovania
(b) Transformačné kódovanie
Funkciou transformačného kódovania je transformácia obrazového signálu opísaného v vesmírnej doméne na frekvenčnú doménu a následné kódovanie transformovaných koeficientov. Všeobecne možno povedať, že obraz má silnú koreláciu v priestore a pri transformácii na frekvenčnú doménu je možné realizovať dekoráciu a koncentráciu energie. Spoločná ortogonálna transformácia obsahuje diskrétnu Fourierovu transformáciu, diskrétnu kosínusovú transformáciu atď. Diskrétna kosínusová transformácia sa často používa v kompresii digitálneho videa.
Diskrétna kosínusová transformácia sa označuje ako DCT transformácia. Môže transformovať obrazový blok L * l z vesmírnej domény do frekvenčnej domény. Preto je potrebné v procese kompresie a kódovania obrazu na základe DCT rozdeliť obraz na neprekrývajúce sa obrazové bloky. Predpokladajme, že veľkosť obrázka je 1280 * 720, je rozdelený na 160 * 90 obrazových blokov s veľkosťou 8 * 8 bez prekrývania vo forme mriežky. Potom je možné vykonať transformáciu DCT pre každý obrazový blok.
Po rozdelení bloku je každý 8 * 8 bodový obrazový blok odoslaný do kodéra DCT a 8 * 8 obrazový blok je transformovaný z priestorovej domény do frekvenčnej domény. Obrázok nižšie zobrazuje príklad obrazového bloku 8 * 8, v ktorom číslo predstavuje hodnotu jasu každého pixelu. Z obrázku je zrejmé, že hodnoty jasu každého pixelu v tomto obrazovom bloku sú relatívne jednotné, najmä hodnota jasu susedných pixelov nie je príliš veľká, čo naznačuje, že obrazový signál má silnú koreláciu.
Skutočný blok obrázka 8 * 8
Nasledujúci obrázok zobrazuje výsledky DCT transformácie obrazového bloku na vyššie uvedenom obrázku. Z obrázku je zrejmé, že po transformácii DCT nízkofrekvenčný koeficient v ľavom hornom rohu koncentruje veľa energie, zatiaľ čo energia na vysokofrekvenčný koeficient v pravom dolnom rohu je veľmi malá.
Koeficienty obrazového bloku po transformácii DCT
Po transformácii DCT je potrebné kvantifikovať signál. Pretože ľudské oči sú citlivé na nízkofrekvenčné charakteristiky obrazu, napríklad na celkovú jasnosť objektov, a nie na vysokofrekvenčné detaily v obraze, môže sa v procese prenosu vysokofrekvenčné informácie prenášať menej alebo nie, iba nízkofrekvenčná časť. Kvantizačný proces redukuje prenos informácií kvantifikáciou koeficientov nízkofrekvenčnej oblasti a hrubou kvantáciou koeficientov vo vysokofrekvenčnej oblasti, čo odstraňuje vysokofrekvenčné informácie, ktoré nie sú citlivé na ľudské oči. Preto je kvantovanie stratovým kompresným procesom a hlavným dôvodom poškodenia kvality v kódovaní kompresie videa.
Proces kvantifikácie možno vyjadriť nasledujúcim vzorcom:
Medzi nimi FQ (U, V) predstavuje koeficient DCT po kvantovaní; f (U, V) predstavuje DCT koeficient pred kvantovaním; Q (U, V) predstavuje kvantizačnú váhovú maticu; q je kvantizačný krok; zaokrúhlenie označuje konsolidáciu a hodnota, ktorá sa má vydať, sa považuje za najbližšiu celočíselnú hodnotu.
Rozumne vyberte kvantizačný koeficient a výsledok po kvantovaní transformovaného obrazového bloku je zobrazený na obrázku.
DCT koeficient po kvantifikácii
Väčšina DCT koeficientov sa po kvantovaní zmení na 0, zatiaľ čo iba niekoľko koeficientov je nenulových hodnôt. V súčasnosti je potrebné komprimovať a kódovať iba tieto nenulové hodnoty.
b) Entropické kódovanie
Entropické kódovanie je pomenované preto, lebo priemerná dĺžka kódu po kódovaní je blízka entropickej hodnote zdroja. Entropické kódovanie je implementované pomocou VLC (kódovanie s premennou dĺžkou). Základným princípom je prideliť krátky kód symbolu s vysokou pravdepodobnosťou v zdroji a dlhý kód symbolu s malou pravdepodobnosťou výskytu, aby sa štatisticky získala kratšia priemerná dĺžka kódu. Kódovanie s premennou dĺžkou zvyčajne obsahuje Hoffmanov kód, aritmetický kód, kód spustenia atď. Kódovanie dĺžky spustenia je veľmi jednoduchá metóda kompresie, jej účinnosť kompresie nie je vysoká, rýchlosť kódovania a dekódovania je však vysoká a stále sa často používa, najmä po transformácii kódovania pomocou kódovania prevádzkovej dĺžky má dobrý účinok.
Najskôr sa AC koeficient bezprostredne nasledujúci za výstupným DC koeficientom kvantizátora naskenuje v type Z (ako je znázornené v riadku šípky). Z-sken transformuje dvojrozmerný kvantizačný koeficient do jednorozmernej sekvencie a potom pokračuje v kódovaní dĺžky behu. Nakoniec sa na kódovanie údajov po kódovaní behu použije ďalší kód s premennou dĺžkou, napríklad Hoffmanovo kódovanie. Prostredníctvom tohto druhu kódovania s premennou dĺžkou sa efektívnosť kódovania ďalej zvyšuje.
c) Odhad pohybu a kompenzácia pohybu
Odhad pohybu a kompenzácia pohybu sú účinné metódy na elimináciu korelácie časového smeru obrazových sekvencií. Vyššie opísané metódy transformácie, kvantovania a entropického kódovania DCT sú založené na jednom snímke snímok. Pomocou týchto metód možno eliminovať priestorovú koreláciu medzi pixelmi v obraze. V skutočnosti má obrazový signál okrem priestorovej korelácie aj časovú koreláciu. Napríklad pre digitálne video so statickým pozadím, ako je spoločné spravodajstvo a malý pohyb hlavnej časti obrazu, je rozdiel medzi každým obrázkom veľmi malý a korelácia medzi obrázkami je veľmi veľká. V takom prípade nemusíme kódovať každý obrázok snímky osobitne, ale môžeme kódovať iba zmenené časti susedných video snímok, aby sme ďalej znížili objem dát. Táto práca je realizovaná odhadom pohybu a kompenzáciou pohybu.
Technológia odhadu pohybu všeobecne rozdeľuje aktuálny vstupný obraz na niekoľko malých čiastkových blokov obrazu, ktoré sa navzájom neprekrývajú, napríklad veľkosť rámcového obrazu je 1280 * 720. Po prvé, je rozdelený na 40 * 45 obrazových blokov s 16 * 16 veľkostí, ktoré sa navzájom neprekrývajú vo forme mriežky, a potom v rámci vyhľadávacieho okna predchádzajúceho alebo druhého obrázka vyhľadajte blok pre každý obrazový blok, aby ste našli jeden obrazový blok v rozsahu okno na hľadanie Najpodobnejší blok obrázkov. Proces vyhľadávania sa nazýva odhad pohybu. Výpočtom polohových informácií medzi najpodobnejším obrazovým blokom a obrazovým blokom je možné získať pohybový vektor. Týmto spôsobom možno aktuálny obrazový blok odčítať od najpodobnejšieho obrazového bloku nasmerovaného pohybovým vektorom referenčného obrazu a možno získať zvyškový obrazový blok. Pretože každá hodnota pixelu v bloku zvyškového obrazu je veľmi malá, je možné pri kompresnom kódovaní dosiahnuť vyšší kompresný pomer. Tento proces odčítania sa nazýva kompenzácia pohybu.
Pretože je potrebné použiť referenčný obraz na odhad pohybu a kompenzáciu pohybu v procese kódovania, je veľmi dôležité zvoliť referenčný obraz. Kodér všeobecne rozdeľuje každý vstup snímkového obrazu na tri rôzne typy podľa rôznych referenčných snímok: I (intra) rámec, B (navádzanie na predpoveď) a P (predikcia) na snímanie. Ako je to znázornené na obrázku.
Typická postupnosť štruktúry rámca I, B, P
Ako je znázornené na obrázku, rámec I používa na kódovanie iba údaje v rámci a počas procesu kódovania nepotrebuje odhad pohybu a kompenzáciu pohybu. Je zrejmé, že keďže rámec I nevylučuje koreláciu časového smeru, je kompresný pomer relatívne nízky. V procese kódovania P rámec používa predný I rámec alebo P rámec ako referenčný obraz na kompenzáciu pohybu, v skutočnosti kóduje rozdiel medzi aktuálnym a referenčným obrazom. Režim kódovania B rámca je podobný P rámcu, jediný rozdiel je v tom, že na predpovedanie procesu kódovania je potrebné použiť predný I rámec alebo P rámec a neskorší I rámec alebo P rámec. Takže každé kódovanie P rámca musí používať jeden rámcový obraz ako referenčný obraz, zatiaľ čo rámec B potrebuje dva rámy ako referenciu. Oproti tomu má B snímka vyšší kompresný pomer ako P snímka.
d) Zmiešané kódovanie
Príspevok predstavuje niekoľko dôležitých metód kompresie a kódovania videa. V praxi sa tieto metódy neoddeľujú a zvyčajne sa kombinujú, aby sa dosiahol najlepší kompresný efekt. Nasledujúci obrázok zobrazuje model hybridného kódovania (tj. Transformačné kódovanie + odhad pohybu a kompenzácia pohybu + entropické kódovanie). Tento model je široko používaný v MPEG1, MPEG2, H.264 a ďalších štandardoch. Z obrázku vidíme, že aktuálny vstupný obraz musí byť najskôr rozdelený do blokov, blok obrazu získaného blokom sa odčíta od predikovaný obraz po kompenzácii pohybu, aby sa získal rozdielový obraz x, a potom sa uskutoční DCT transformácia a kvantizácia pre blok rozdielového obrazu. Kvantované výstupné údaje majú dve rôzne miesta: jedným je ich odoslanie na kódovanie entropie a kódovaný prúd kódu sa odošle do medzipamäte Uložiť do zariadenia a počkať na prenos. Ďalšou aplikáciou je potlačenie kvantifikácie a reverzná zmena signálu x ', ktorá pridá výstup obrazového bloku s kompenzáciou pohybu na získanie nového predikčného obrazového signálu a odošle nový predikčný obrazový blok do pamäte rámca.
|
Zadajte e-mail, aby ste dostali prekvapenie
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> afrikánčina
sq.fmuser.org -> albánsky
ar.fmuser.org -> arabčina
hy.fmuser.org -> Arménsky
az.fmuser.org -> azerbajdžanský
eu.fmuser.org -> baskičtina
be.fmuser.org -> bieloruský
bg.fmuser.org -> Bulgarian
ca.fmuser.org -> katalánčina
zh-CN.fmuser.org -> čínština (zjednodušená)
zh-TW.fmuser.org -> čínština (tradičná)
hr.fmuser.org -> chorvátčina
cs.fmuser.org -> čeština
da.fmuser.org -> dánčina
nl.fmuser.org -> Dutch
et.fmuser.org -> estónčina
tl.fmuser.org -> filipínsky
fi.fmuser.org -> fínčina
fr.fmuser.org -> French
gl.fmuser.org -> galícijčina
ka.fmuser.org -> gruzínsky
de.fmuser.org -> nemčina
el.fmuser.org -> Greek
ht.fmuser.org -> haitská kreolčina
iw.fmuser.org -> hebrejčina
hi.fmuser.org -> hindčina
hu.fmuser.org -> Hungarian
is.fmuser.org -> islandský
id.fmuser.org -> indonézština
ga.fmuser.org -> írsky
it.fmuser.org -> Italian
ja.fmuser.org -> japončina
ko.fmuser.org -> kórejčina
lv.fmuser.org -> lotyšský
lt.fmuser.org -> litovčina
mk.fmuser.org -> macedónsky
ms.fmuser.org -> malajčina
mt.fmuser.org -> maltčina
no.fmuser.org -> Norwegian
fa.fmuser.org -> perzský
pl.fmuser.org -> poľština
pt.fmuser.org -> portugalčina
ro.fmuser.org -> rumunčina
ru.fmuser.org -> ruština
sr.fmuser.org -> srbčina
sk.fmuser.org -> slovenčina
sl.fmuser.org -> slovinčina
es.fmuser.org -> španielčina
sw.fmuser.org -> svahilčina
sv.fmuser.org -> švédčina
th.fmuser.org -> Thai
tr.fmuser.org -> turečtina
uk.fmuser.org -> ukrajinčina
ur.fmuser.org -> urdčina
vi.fmuser.org -> Vietnamese
cy.fmuser.org -> waleština
yi.fmuser.org -> jidiš
FMUSER Bezdrôtové vysielanie videa a zvuku je jednoduchšie!
Kontakt
adresa:
Budova č. 305 Izba HuiLan č. 273 Huanpu Road Kanton Čína 510620
Kategórie
Prihlás sa na odber Newslettra