Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Część 2. Kompresja multimedialna

Dla moich studentów Vistula_EWS
by

Bogdan Kaminski

on 7 August 2017

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Część 2. Kompresja multimedialna

Klatka analogowa
Informacja wizyjna ma charakter 4D (3D+czas):
Film analogowy
rzutuje kamerą przestrzeń 3D na płaszczyznę obrazowania, którą w postaci ciągu kadrów (klatek) umieszcza na osi czasu
Telewizja analogowa
dodatkowo dyskretyzuje każdy kadr na linie obrazowe
Telewizja cyfrowa
dodatkowo (w stosunku do analogowej) dyskretyzuje każdą linię na piksele oraz kwantuje (dzieli) zakres kolorów na skończoną liczbę przedziałów.
Nas interesują obrazy cyfrowe w postaci tablicy pikseli. Każdy piksel ma swoją głębię bitową dla opisania koloru, co oznacza przydzielenie każdemu pikselowi obrazu określonej liczby bitów.
II.1. Kompresja obrazów
Klatka przed kompresją (500 KB)
Kompresja jest techniką przetwarzania danych, która pozwala zmniejszyć wymagania pamięciowe aplikacji. Przy pomocy
kodera
redukuje ona liczbę bitów potrzebnych na reprezentację obrazu, ale w taki sposób, by
dekoder
(podczas dekompresji) mógł zapewnić jak najbardziej wierną rekonstrukcję oryginału.

Definicja kompresji
Można podać uniwersalną strukturę kompresji (koder) i dekompresji (dekoder) obrazów cyfrowych, zawierająca określone fazy:
Główne fazy kompresji i dekompresji obrazów
Rozważmy, ile miejsca potrzebuje przykładowa encyklopedia multimedialna:
100.000 stron tekstu (1 KB na str.) – 0,1 GB
3000 obrazów RGB (512x512x24 b) – 2 GB
200 ilustracji wektorowych (512x512x16 b) – 0,1 GB
20 animacji po 100 s (512x512x16 b, 20fps) – 20 GB
2 h dźwięku stereo (198 Kbps) – 1 GB
40 filmów cyfrowych po 100 s, (512x512x24 b, 25 fps) – 90 GB.
Daje to łącznie ok. 112 GB, co jest niepraktyczne dla jakiegokolwiek zapisu na nośniku, nawet Blu-ray, nie wspominając o CD-ROM.
Jak teraz będzie wyglądało zapotrzebowanie na pamięć dla tej encyklopedii, gdy zastosujemy różnorodne kompresje?
Przykład uzasadniający potrzebę kompresji
Część II. Kompresja multimedialna
Rodzaj inf./Stopień kompr./Standard:
Tekst/2/ZIP
Obraz RGB/15/JPEG
Ilustracje/10/JPEG
Animacja/50/LZW
Dźwięk/7/LPC
Film cyfrowy/45/MPEG
Daje to:
Tekst – 100/2=50 MB
Obraz RGB – 2000/15 = 130 MB
Ilustracje/100/10 = 10 MB
Animacje – 20000/50 = 400 MB
Dźwięk – 1000/7 = 140 MB
Film cyfrowy – 90000/45 = 2 GB
Łącznie – ok.
2.7 GB
– co zapiszemy na 1 DVD.
Przykład cd.
Przepływność bitowa
Przepływność bitowa (
bitrate
) jest to współczynnik określający, ile bitów danych zostało użytych do zapisania dźwięku lub obrazu trwającego 1 sekundę.
Bitrate jest wyrażony w Kbps (kilobity na sekundę).
Im wyższa jest wartość bitrate, tym lepsza jakość dźwięku/obrazu, ale jednocześnie większy rozmiar pliku wynikowego.
Np. 60-sek plik MP3 zapisany z bitrate 128 będzie zajmował 7680 kilobitów (Kb), czyli 7680/8=960 kilobajtów (KB). Wartość bitrate może być stała (CBR) lub zmienna (VBR).
Pojęcia z teorii fraktali
http://bogdankaminski.pl/prezi/Fraktal.doc
Podstawy teoretyczne kompresji wideo
Klatka TV analog
Klatka TV digital
Klatka po kompresji (30 KB)
KODER
DEKODER
Modelowanie
Kwantyzacja
Kodowanie
binarne
Modelowanie
odwrotne
Kwantyzacja
odwrotna
Dekodowanie
binarne
Postać naturalna
Postać pośrednia
Postać dyskretna
Postać binarna
Do wyliczania kompresji wykorzystywane są procedury matematyczne i znajomośc fizyki.
Prykładowe pojęcia dla osób chcących zająć się teorią:
Transformacje Fouriera
http://bogdankaminski.pl/prezi/Transformaty_Fouriera.doc
Kodowanie Hauffmana
http://bogdankaminski.pl/prezi/Kodowanie_Huffmana.doc
Obliczanie stopnia kompresji
http://bogdankaminski.pl/prezi/Standard_G722.doc
Widzenie stereoskopowe
http://bogdankaminski.pl/prezi/Widzenie_stereoskopowe.doc
Dźwięk (naturalny lub generowany syntetycznie) jest elementem systemów multimedialnych np. w dziedzinach:
produkcja i dystrybucja programów radiowych i telewizyjnych
przechowywanie danych dźwiękowych w studiach i archiwach
interaktywna edukacja, trening, prezentacja
współpraca i rozrywka przez sieci.
Człowiek słyszy dźwięki w zakresie pasma 20 Hz–20 kHz. Sygnał dźwiękowy jest ciągły w dziedzinie czasu. Konwersja sygnału analogowego na cyfrowy realizowana jest poprzez próbkowanie wartości amplitudy, w stałych odcinkach czasu zgodnie z częstotliwością próbkowania.
II.2. Kompresja dźwięku
Stosowane częstotliwości próbkowania
Wielkość ta wyznacza wymaganą przepustowość sieci komunikacyjnej w celu transmisji sygnału.
Dźwięk może być prezentowany przy wykorzystaniu różnej liczby kanałów jako: 1-kanałowy (mono), 2-kanałowy (stereo), 5.1-kanałowy itp.
Np. sygnał stereo o jakości CD generuje strumień o przepływności około 1.41 Mbps (44100 próbek/s x 16 bitów/próbkę x 2 kanały). Nagranie o czasie 10 min. takiego sygnału wymaga pamięci ok. 105 MB = 1.41 Mbps x 600 s. Kompresja zmniejsza te wymagania.
W przypadku standardów MPEG można uzyskać kompresję równą 10, co daje plik 10.5 MB (105 MB/10).
Przepływność strumienia audio
Im większa cp, tym aproksymacja jest dokładniejsza. Zgodnie z teorią (Nyquista), cp musi być co najmniej dwa razy większa od największej częstotliwości sygnału dźwiękowego, którą chcemy wiernie zrekonstruować, np.:
pełny słyszalny zakres pasma częstotliwości (do 20 kHz) sygnału dźwiękowego próbkowany z cp 44.1 kHz już umożliwia jego odpowiednią rekonstrukcję.
szerokopasmowy sygnał mowy, o zakresie pasma częstotliwości do 7 kHz może być próbkowany z cp 16 kHz,
wąskopasmowy sygnał mowy (do 3.2 kHz) stosowany w telekomunikacji może być próbkowany z cp 8 kHz.
Częstotliwości próbkowania (cp)
Sposób przesyłania dźwięku
Dźwięk w postaci cyfrowej jest sygnałem wejściowym dla kodera. Ma on zwykle format PCM (
Pulse

Code

Modulation
). Po kompresji zakodowany dźwięk jest przesyłany siecią komunikacyjną do odbiornika (np. telefon GSM) lub archiwizowany na nośniku pamięci (np. HDD, CD, DVD). W czasie dekompresji sygnał jest rekonstruowany w dekoderze, a następnie prezentowany użytkownikowi.
Standard komperesji dźwięku w MPEG-2
Duża i mała częstotliwość próbkowania oraz porównanie ich dokładności
MPEG-2 jest standardem międzynarodowym.
Standard ma wiele tzw. części, z których 3 i 7 są dla kompresji dźwięku.
W MPEG-2 może wystąpić do 5.1,kanałów tj. 5 kanałów o pełnym paśmie + 1 kanał niskoczęstotliwościowy.
Wzrost częstotliwości próbkowania to lepsza aproksymacja sygnału dźwiękowego.
Częstotliwości próbkowania dźwięku spotykane w typowych zastosowaniach przedstawiono w poniższej tabeli:
cp (kHz) Zastosowanie
8.00 Telekomunikacja (np. GSM)
16.00 Komunikacja multimedialna
22.05 Komputery osobiste
32.00 Cyfrowe radio i telewizja
44.10 Dyski CD-Audio
48.00 Magnetofony DAT, HDTV
96.00 Dyski DVD, Blu-ray

Liczba kanałów 5.1.
5 kanałów o pełnej częstotliwości:
L – lewy
R – prawy
C - środkowy
LS – dookólny lewy
RS – dookólny prawy
+1 kanał niskiej częstotliwości LFE o pasmie 20-120 Hz.
KONIEC
kompresji

©Bogdan Kamiński©
.
®Wszelkie prawa zastrzeżone®
©Bogdan Kamiński©
.
®Wszelkie prawa zastrzeżone®
©Bogdan Kamiński©
.
®Wszelkie prawa zastrzeżone®
©Bogdan Kamiński©
.
®Wszelkie prawa zastrzeżone®
©Bogdan Kamiński©
.
®Wszelkie prawa zastrzeżone®
©Bogdan Kamiński©
.
®Wszelkie prawa zastrzeżone®
©Bogdan Kamiński©
.
®Wszelkie prawa zastrzeżone®
©Bogdan Kamiński©
.
®Wszelkie prawa zastrzeżone®
©Bogdan Kamiński©
.
®Wszelkie prawa zastrzeżone®
©Bogdan Kamiński©
.
®Wszelkie prawa zastrzeżone®
©Bogdan Kamiński©
.
®Wszelkie prawa zastrzeżone®
©Bogdan Kamiński©
.
®Wszelkie prawa zastrzeżone®
©Bogdan Kamiński©
.
®Wszelkie prawa zastrzeżone®
©Bogdan Kamiński©
.
®Wszelkie prawa zastrzeżone®
Full transcript