Konfiguracja sprzętu i oprogramowania

kompresja dynamiczna. Synteza i rozpoznawanie mowy

© 2014 strona

Lub szerokość geograficzna materiał fotograficzny to stosunek między maksymalną a minimalną wartością ekspozycji, którą można poprawnie uchwycić na zdjęciu. W przypadku fotografii cyfrowej zakres dynamiczny jest w rzeczywistości równoważny stosunkowi maksymalnych i minimalnych możliwych wartości użytecznego sygnału elektrycznego generowanego przez fotoczujnik podczas ekspozycji.

Zakres dynamiczny jest mierzony w krokach ekspozycji (). Każdy krok odpowiada podwojeniu ilości światła. Czyli np. jeśli dany aparat ma zakres dynamiczny 8 EV, to oznacza to, że maksymalna możliwa wartość sygnału użytecznego jego matrycy jest powiązana z minimum 2 8:1, co oznacza, że ​​aparat jest w stanie uchwycić obiekty różniące się jasnością w obrębie jednej klatki nie więcej niż 256 razy. Dokładniej, może uchwycić obiekty o dowolnej jasności, jednak obiekty, których jasność przekroczy maksymalną dopuszczalną wartość, wyjdą na obrazie olśniewającą bielą, a obiekty, których jasność będzie poniżej wartości minimalnej, będą kruczoczarne. Detale i faktury będą widoczne tylko na tych obiektach, których jasność pasuje do zakresu dynamicznego aparatu.

Aby opisać związek między jasnością najjaśniejszego i najciemniejszego z fotografowanych obiektów, często używa się nie do końca poprawnego terminu „zakres dynamiczny sceny”. Bardziej słusznie byłoby mówić o zakresie jasności lub poziomie kontrastu, ponieważ zakres dynamiczny jest zwykle cechą urządzenia pomiarowego (w tym przypadku matrycy aparatu cyfrowego).

Niestety, zakres jasności wielu pięknych scen, które napotykamy w prawdziwe życie może znacznie przekroczyć zakres dynamiczny aparatu cyfrowego. W takich przypadkach fotograf zmuszony jest decydować, które obiekty należy dopracować w najdrobniejszych szczegółach, a które pozostawić na zewnątrz. zakres dynamiczny bez poświęcania kreatywności. Aby w pełni wykorzystać zakres dynamiczny aparatu, czasami może być potrzebne nie tyle dokładne zrozumienie działania fotosensora, co rozwinięty talent artystyczny.

Czynniki ograniczające zakres dynamiczny

Dolna granica zakresu dynamicznego jest ustalana przez wewnętrzny poziom szumu fotoczujnika. Nawet nieoświetlona matryca generuje tło sygnał elektryczny zwany ciemnym hałasem. Zakłócenia występują również, gdy ładunek jest przesyłany do przetwornika analogowo-cyfrowego, a sam ADC wprowadza pewien błąd do zdigitalizowanego sygnału - tzw. szum próbkowania.

Jeśli zrobisz zdjęcie w całkowitej ciemności lub z założoną pokrywką obiektywu, aparat zarejestruje tylko ten nic nie znaczący szum. Jeśli do czujnika dotrze minimalna ilość światła, fotodiody zaczną się akumulować ładunek elektryczny. Wielkość ładunku, a tym samym natężenie sygnału użytecznego, będzie proporcjonalna do liczby przechwyconych fotonów. Aby na obrazie pojawiły się jakiekolwiek znaczące szczegóły, konieczne jest, aby poziom sygnału użytecznego przekraczał poziom szumu tła.

Zatem dolna granica zakresu dynamicznego lub innymi słowy próg czułości czujnika może być formalnie zdefiniowany jako poziom sygnału wyjściowego, przy którym stosunek sygnału do szumu jest większy niż jeden.

Górna granica zakresu dynamicznego jest określona przez pojemność pojedynczej fotodiody. Jeśli podczas naświetlania jakaś fotodioda akumuluje dla siebie ładunek elektryczny o maksymalnej wartości, wówczas piksel obrazu odpowiadający przeciążonej fotodiodzie okaże się całkowicie biały, a dalsze naświetlanie w żaden sposób nie wpłynie na jego jasność. Zjawisko to nazywa się obcinaniem. Im wyższa przeciążalność fotodiody, tym więcej sygnału jest ona w stanie oddać na wyjściu zanim osiągnie nasycenie.

Dla większej przejrzystości przejdźmy do krzywej charakterystycznej, która jest wykresem zależności sygnału wyjściowego od ekspozycji. Oś pozioma to logarytm binarny promieniowania odbieranego przez czujnik, a oś pionowa to logarytm binarny wielkości sygnału elektrycznego generowanego przez czujnik w odpowiedzi na to napromieniowanie. Mój rysunek jest w dużej mierze arbitralny i służy wyłącznie celom ilustracyjnym. Krzywa charakterystyczna prawdziwego fotosensora ma nieco bardziej złożony kształt, a poziom szumu rzadko jest tak wysoki.

Na wykresie wyraźnie widoczne są dwa krytyczne punkty zwrotne: w pierwszym poziom sygnału użytecznego przekracza próg szumów, a w drugim fotodiody osiągają nasycenie. Wartości ekspozycji pomiędzy tymi dwoma punktami stanowią zakres dynamiczny. W tym abstrakcyjnym przykładzie jest to, jak łatwo zauważyć, 5 EV, czyli aparat jest w stanie przetrawić pięć podwojeń ekspozycji, co odpowiada 32-krotnej (2 5 = 32) różnicy jasności.

Strefy ekspozycji składające się na zakres dynamiczny nie są równoważne. Górne strefy mają wyższy stosunek sygnału do szumu, dzięki czemu wyglądają czyściej i bardziej szczegółowo niż dolne. W efekcie górna granica zakresu dynamiki jest bardzo realna i zauważalna – przy najmniejszym prześwietleniu przycinanie odcina światło, podczas gdy dolna granica jest niepozornie zatopiona w szumie, a przejście do czerni nie jest tak ostre jak do bieli.

Liniowa zależność sygnału od naświetlenia, a także ostre plateau to unikalne cechy procesu fotografii cyfrowej. Dla porównania spójrz na warunkową krzywą charakterystyczną tradycyjnego filmu fotograficznego.

Kształt krzywej, a zwłaszcza kąt nachylenia, silnie zależy od rodzaju kliszy i sposobu jej wywoływania, ale główna, rzucająca się w oczy różnica między kliszą a cyfrową pozostaje niezmieniona – nieliniowy charakter zależności gęstości optycznej filmu od wartości ekspozycji.

Dolna granica szerokości geograficznej negatywu jest określona przez gęstość welonu, a górna granica jest określona przez maksymalną osiągalną gęstość optyczną fotowarstwy; w przypadku filmów odwracalnych jest odwrotnie. Zarówno w cieniach, jak i światłach obserwuje się płynne krzywe krzywej charakterystycznej, wskazujące na spadek kontrastu przy zbliżaniu się do granic zakresu dynamicznego, ponieważ nachylenie krzywej jest proporcjonalne do kontrastu obrazu. W ten sposób obszary ekspozycji leżące pośrodku wykresu mają maksymalny kontrast, podczas gdy kontrast jest zmniejszony w światłach i cieniach. W praktyce różnica między kliszą a matrycą cyfrową jest szczególnie widoczna w prześwietleniach: gdzie na obrazie cyfrowym światła są przepalane przez obcinanie, na kliszy nadal widoczne są detale, choć o niskim kontraście, a przejście do czysta biel wygląda gładko i naturalnie.

W sensytometrii używa się nawet dwóch niezależnych terminów: faktycznie szerokość geograficzna, ograniczone przez względnie liniowy odcinek krzywej charakterystycznej, oraz użyteczna szerokość geograficzna, który oprócz odcinka liniowego zawiera również podstawę i ramię wykresu.

Warto zauważyć, że podczas przetwarzania zdjęć cyfrowych z reguły stosuje się do nich mniej lub bardziej wyraźną krzywą w kształcie litery S, zwiększając kontrast w półcieniach kosztem zmniejszenia go w cieniach i światłach, co nadaje obrazowi cyfrowemu bardziej naturalny i przyjemny dla oka wygląd.

Głębokość bitowa

W przeciwieństwie do matrycy aparatu cyfrowego, ludzkie widzenie charakteryzuje, powiedzmy, logarytmiczny obraz świata. Kolejne podwojenia ilości światła odbieramy jako równe zmiany jasności. Liczby świetlne można nawet porównać z oktawami muzycznymi, ponieważ dwukrotne zmiany częstotliwości dźwięku są odbierane przez ucho jako pojedynczy interwał muzyczny. Inne narządy zmysłów działają na tej samej zasadzie. Nieliniowość percepcji znacznie poszerza zakres ludzkiej wrażliwości na bodźce o różnym natężeniu.

Przy konwersji pliku RAW (nie ma to znaczenia – za pomocą aparatu lub w konwerterze RAW) zawierającego dane liniowe, tzw. krzywa gamma, która ma na celu nieliniowe zwiększenie jasności obrazu cyfrowego, dostosowując go do cech ludzkiego wzroku.

W przypadku konwersji liniowej obraz jest zbyt ciemny.

Po korekcji gamma jasność powraca do normy.

Krzywa gamma niejako rozciąga ciemne tony i kompresuje jasne tony, dzięki czemu rozkład gradacji jest bardziej jednolity. Rezultatem jest naturalnie wyglądający obraz, ale szumy i artefakty próbkowania w cieniach nieuchronnie stają się bardziej zauważalne, co jest tylko pogarszane przez niewielką liczbę poziomów jasności w niższych strefach.

Rozkład liniowy gradacji jasności.
Rozkład równomierny po zastosowaniu krzywej gamma.

ISO i zakres dynamiczny

Pomimo tego, że fotografia cyfrowa posługuje się tym samym pojęciem światłoczułości materiału fotograficznego, co w fotografii filmowej, należy rozumieć, że dzieje się tak wyłącznie z powodu tradycji, ponieważ podejścia do zmiany światłoczułości w fotografii cyfrowej i filmowej różnią się zasadniczo.

Zwiększenie czułości ISO w tradycyjnej fotografii oznacza przejście z jednego filmu na inny z grubszym ziarnem, tj. następuje obiektywna zmiana właściwości samego materiału fotograficznego. W aparacie cyfrowym światłoczułość czujnika jest ściśle określona przez jego fizyczne właściwości i nie można jej dosłownie zmienić. Przy zwiększaniu ISO aparat nie zmienia rzeczywistej czułości czujnika, a jedynie wzmacnia sygnał elektryczny generowany przez czujnik w odpowiedzi na napromieniowanie i odpowiednio dostosowuje algorytm digitalizacji tego sygnału.

Ważną konsekwencją tego jest zmniejszenie efektywnego zakresu dynamicznego proporcjonalnie do wzrostu ISO, ponieważ wraz z sygnałem użytecznym wzrastają również szumy. Jeżeli przy ISO 100 zdigitalizowany jest cały zakres wartości sygnału – od zera do punktu nasycenia, to przy ISO 200 przyjmuje się maksymalnie połowę pojemności fotodiod. Z każdym podwojeniem czułości ISO górny przystanek zakresu dynamicznego wydaje się odcinany, a pozostałe stopnie są podciągane na swoje miejsce. Dlatego stosowanie ultrawysokich wartości ISO jest pozbawione praktycznego znaczenia. Z takim samym sukcesem można rozjaśnić zdjęcie w konwerterze RAW i uzyskać porównywalny poziom szumów. Różnica między zwiększeniem ISO a sztucznym rozjaśnieniem obrazu polega na tym, że przy zwiększeniu ISO sygnał jest wzmacniany przed wejściem do ADC, co oznacza, że ​​szum kwantyzacji nie jest wzmacniany, w przeciwieństwie do szumu własnego matrycy, podczas gdy w przetworniku RAW podlegają one wzmocnieniu, w tym błędom ADC. Dodatkowo zmniejszenie zakresu próbkowania oznacza dokładniejsze próbkowanie pozostałych wartości sygnału wejściowego.

Nawiasem mówiąc, obniżenie ISO poniżej wartości bazowej (np. do ISO 50) dostępne na niektórych urządzeniach wcale nie rozszerza zakresu dynamicznego, a jedynie osłabia sygnał o połowę, co jest równoznaczne z przyciemnieniem obrazu w RAW-ie przetwornik. Funkcję tę można nawet uznać za szkodliwą, ponieważ użycie poniżej minimalnej wartości ISO prowokuje aparat do zwiększania ekspozycji, co przy niezmienionym progu nasycenia matrycy zwiększa ryzyko przycięcia jasnych obszarów.

Prawdziwa wartość zakresu dynamicznego

Istnieje wiele programów, takich jak (DxO Analyzer, Imatest, RawDigger itp.), które pozwalają zmierzyć zakres dynamiczny aparatu cyfrowego w domu. W zasadzie nie jest to konieczne, ponieważ dane dla większości aparatów można swobodnie znaleźć w Internecie, na przykład na DxOMark.com.

Czy powinniśmy wierzyć wynikom takich testów? Całkiem. Z jedynym zastrzeżeniem, że wszystkie te testy określają skuteczny lub, że tak powiem, techniczny zakres dynamiki, tj. związek między poziomem nasycenia a poziomem szumu matrycy. Dla fotografa pierwszorzędne znaczenie ma użyteczny zakres dynamiczny, tj. liczba stref ekspozycji, które naprawdę pozwalają uchwycić przydatne informacje.

Jak pamiętasz, próg zakresu dynamicznego jest ustalany przez poziom szumu fotosensora. Problem polega na tym, że w praktyce dolne strefy, które technicznie są już zawarte w zakresie dynamicznym, nadal zawierają zbyt dużo szumu, aby mogły być użytecznie wykorzystane. Tutaj wiele zależy od indywidualnego wstrętu – każdy sam ustala akceptowalny poziom hałasu.

Moja subiektywna opinia jest taka, że ​​szczegóły w cieniach zaczynają wyglądać mniej lub bardziej przyzwoicie przy stosunku sygnału do szumu wynoszącym co najmniej osiem. Na tej podstawie określam dla siebie użyteczny zakres dynamiki jako techniczny zakres dynamiki minus około trzech przystanków.

Na przykład, jeśli lustrzanka ma dynamikę 13 EV, co jak na dzisiejsze standardy jest bardzo dobre, według wiarygodnych testów, to jej użyteczny zakres dynamiki wyniesie około 10 EV, co w sumie też jest całkiem niezłe. Mowa oczywiście o fotografowaniu w RAW, z minimalnym ISO i maksymalną głębią bitową. Podczas fotografowania w formacie JPEG zakres dynamiczny jest w dużym stopniu zależny od ustawień kontrastu, ale średnio należy odrzucić kolejne dwa do trzech przystanków.

Dla porównania: kolorowe klisze odwracalne mają użyteczną szerokość geograficzną 5-6 kroków; czarno-białe negatywy dają 9-10 stopni przy standardowe procedury manifestacje i pieczęcie oraz przy pewnych manipulacjach - do 16-18 kroków.

Podsumowując powyższe, spróbujmy sformułować kilka proste zasady, które pomogą Ci w pełni wykorzystać czujnik aparatu:

  • Zakres dynamiczny aparatu cyfrowego jest w pełni dostępny tylko podczas fotografowania w formacie RAW.
  • Zakres dynamiczny zmniejsza się wraz ze wzrostem czułości ISO, więc unikaj wysokich czułości ISO, chyba że jest to absolutnie konieczne.
  • Używanie wyższych głębi bitowych dla plików RAW nie zwiększa prawdziwego zakresu dynamicznego, ale poprawia separację tonalną w cieniach kosztem jeszcze poziomy jasności.
  • Ekspozycja na prawo. Górne strefy ekspozycji zawsze zawierają maksimum przydatnych informacji przy minimalnym hałasie i powinny być wykorzystywane jak najefektywniej. Jednocześnie nie zapominaj o niebezpieczeństwie przycinania - piksele, które osiągnęły nasycenie, są absolutnie bezużyteczne.

A co najważniejsze, nie przejmuj się zbytnio zakresem dynamicznym aparatu. Z zakresem dynamicznym wszystko w porządku. Dużo ważniejsza jest umiejętność widzenia światła i odpowiedniego zarządzania ekspozycją. Dobry fotograf nie będzie narzekał na brak swobody fotograficznej, ale będzie starał się poczekać na wygodniejsze oświetlenie, albo zmienić kąt, czy użyć lampy błyskowej, jednym słowem będzie działać zgodnie z okolicznościami. Powiem więcej: niektóre sceny zyskują tylko na tym, że nie mieszczą się w zakresie dynamicznym aparatu. Często niepotrzebne bogactwo szczegółów wystarczy ukryć w pół-abstrakcyjnej czarnej sylwetce, co sprawia, że ​​zdjęcie jest jednocześnie zwięzłe i bogatsze.

Wysoki kontrast nie zawsze jest zły – wystarczy umieć z nim pracować. Naucz się wykorzystywać zarówno słabe, jak i mocne strony sprzętu, a zdziwisz się, jak bardzo rozwinie się Twoja kreatywność.

Dziękuję za uwagę!

Wasilij A.

Post Scriptum

Jeśli artykuł okazał się dla Ciebie przydatny i pouczający, możesz uprzejmie wesprzeć projekt, przyczyniając się do jego rozwoju. Jeśli nie podobał Ci się artykuł, ale masz przemyślenia, jak go ulepszyć, Twoja krytyka zostanie przyjęta z nie mniejszą wdzięcznością.

Nie zapominaj, że ten artykuł jest objęty prawami autorskimi. Przedruk i cytowanie są dozwolone pod warunkiem istnienia prawidłowego linku do oryginalnego źródła, a użytego tekstu nie wolno w żaden sposób zniekształcać ani modyfikować.

Kompresja dynamiczna(Kompresja dynamiki, DRC) - zawężenie (lub rozszerzenie w przypadku ekspandera) zakresu dynamiki fonogramu. Zakres dynamiczny, to różnica między najcichszym a najgłośniejszym dźwiękiem. Czasami najcichszy dźwięk na fonogramie będzie nieco głośniejszy niż poziom hałasu, a czasami nieco cichszy niż najgłośniejszy. Urządzenia sprzętowe i programy wykonujące kompresję dynamiczną nazywane są kompresorami, wyróżniając wśród nich cztery główne grupy: same kompresory, limitery, ekspandery i bramki.

Kompresor lampowy analogowy DBX 566

Kompresja w dół i w górę

dolna kompresja(Kompresja w dół) zmniejsza głośność dźwięku, gdy przekracza określony próg, pozostawiając cichsze dźwięki bez zmian. Ekstremalna wersja kompresji to ogranicznik. Kompresja w górę(kompresja w górę), wręcz przeciwnie, zwiększa głośność dźwięku, jeśli jest on poniżej wartości progowej, nie wpływając na więcej głośne dzwięki. Jednocześnie oba rodzaje kompresji zawężają zakres dynamiczny sygnału audio.

dolna kompresja

Kompresja w górę

Ekspander i bramka

Jeśli kompresor zmniejsza zakres dynamiki, ekspander go zwiększa. Gdy poziom sygnału przekroczy poziom progowy, ekspander zwiększa go jeszcze bardziej, zwiększając w ten sposób różnicę między dźwiękami głośnymi i cichymi. Takie urządzenia są często używane podczas nagrywania zestawu perkusyjnego, aby oddzielić dźwięki jednego bębna od drugiego.

Nazywa się rodzaj ekspandera, który nie jest używany do wzmacniania głośnych, ale do wyciszania cichych dźwięków, które nie przekraczają poziomu progowego (na przykład szum tła). bramka szumów. W takim urządzeniu, gdy tylko poziom dźwięku spadnie poniżej progu, sygnał przestaje mijać. Zazwyczaj bramka służy do tłumienia szumów w przerwach. W niektórych modelach możesz upewnić się, że dźwięk nie zatrzymuje się nagle po osiągnięciu poziomu progowego, ale stopniowo zanika. W takim przypadku szybkość zaniku jest ustawiana przez kontrolkę Decay.

Brama, podobnie jak inne rodzaje sprężarek, może być zależny od częstotliwości(tj. traktować określone pasma częstotliwości inaczej) i może działać w łańcuch boczny(patrz poniżej).

Zasada działania sprężarki

Sygnał wchodzący do kompresora jest dzielony na dwie kopie. Jedna kopia jest wysyłana do wzmacniacza, w którym wzmocnienie jest kontrolowane przez sygnał zewnętrzny, druga kopia tworzy ten sygnał. Wchodzi do urządzenia zwanego łańcuchem bocznym, w którym mierzony jest sygnał i na podstawie tych danych tworzona jest obwiednia, która opisuje zmianę jego objętości.
Tak układa się większość nowoczesnych sprężarek, jest to tzw. typ feed-forward. W starszych urządzeniach (typu sprzężenia zwrotnego) poziom sygnału mierzony jest za wzmacniaczem.

Istnieją różne analogowe technologie kontrolowanego wzmocnienia (wzmocnienie o zmiennym wzmocnieniu), każda ma swoje zalety i wady: lampowa, optyczna z wykorzystaniem fotorezystorów i tranzystorów. Podczas pracy z dźwiękiem cyfrowym (w edytor dźwięku lub DAW) mogą używać własnych algorytmów matematycznych lub emulować pracę technologii analogowych.

Główne parametry sprężarek

Próg

Kompresor obniża poziom sygnału audio, jeśli jego amplituda przekracza określoną wartość progową (próg). Zazwyczaj określa się go w decybelach, przy niższym progu (np. -60 dB), co oznacza, że ​​zostanie przetworzonych więcej dźwięku niż wyższy próg (np. -5 dB).

Stosunek

Wielkość redukcji poziomu jest określana przez parametr ratio: stosunek 4:1 oznacza, że ​​jeśli poziom wejściowy jest o 4 dB powyżej progu, poziom wyjściowy będzie o 1 dB powyżej progu.
Na przykład:
Próg = -10dB
Sygnał wejściowy = -6 dB (4 dB powyżej progu)
Sygnał wyjściowy = -9 dB (1 dB powyżej progu)

Należy pamiętać, że tłumienie poziomu sygnału trwa jeszcze przez pewien czas po jego spadku poniżej wartości progowej, a ten czas jest określany wartością parametru uwolnienie.

Kompresja o maksymalnym stosunku ∞:1 nazywana jest ograniczaniem. Oznacza to, że każdy sygnał powyżej poziomu progowego jest tłumiony do poziomu progowego (z wyjątkiem krótkiego okresu po nagłym wzroście głośności wejściowej). Zobacz „Limiter” poniżej, aby uzyskać szczegółowe informacje.

Przykłady różnych wartości współczynnika

Atak i uwolnienie

Kompresor zapewnia pewną kontrolę nad tym, jak szybko reaguje na zmianę dynamiki sygnału. Parametr Attack określa czas potrzebny kompresorowi na zmniejszenie wzmocnienia do poziomu określonego przez parametr Ratio. Zwolnienie określa czas potrzebny sprężarce na zwiększenie wzmocnienia lub powrót do stanu normalnego, jeśli poziom wejściowy spadnie poniżej progu.

Fazy ​​ataku i uwolnienia

Parametry te wskazują czas (zwykle w milisekundach) potrzebny do zmiany wzmocnienia o określoną liczbę decybeli, zwykle 10 dB. Na przykład w tym przypadku, jeśli Attack jest ustawiony na 1ms, zajmie 1ms, aby zmniejszyć wzmocnienie o 10dB, a 2ms o 20dB.

W wielu kompresorach parametry Attack i Release można regulować, ale w niektórych są one wstępnie ustawione i nie można ich regulować. Czasami określa się je jako „automatyczne” lub „zależne od programu”, tj. zmienić w zależności od sygnału wejściowego.

Kolano

Inna opcja kompresora: twarde/miękkie kolano. Decyduje o tym, czy rozpoczęcie stosowania kompresji będzie gwałtowne (twarde) czy stopniowe (miękkie). Miękkie kolano zmniejsza widoczność przejścia sygnału od suchego do skompresowanego, szczególnie przy wysokich współczynnikach i nagłym wzroście głośności.

Kompresja twardego kolana i miękkiego kolana

Szczyt i RMS

Kompresor może reagować na wartości szczytowe (krótkotrwałe maksymalne) lub na średni poziom sygnału wejściowego. Stosowanie wartości szczytowych może prowadzić do dużych wahań stopnia kompresji, a nawet zniekształceń. Dlatego sprężarki stosują funkcję uśredniania (zwykle RMS) sygnału wejściowego przy porównywaniu go z wartością progową. Daje to bardziej komfortową kompresję, która jest bliższa ludzkiej percepcji głośności.

RMS to parametr, który odzwierciedla średnią głośność fonogramu. Z matematycznego punktu widzenia RMS (Root Mean Square) jest średnią kwadratową wartością amplitudy pewnej liczby próbek:

łączenie stereo

Kompresor w trybie łączenia stereo stosuje to samo wzmocnienie do obu kanałów stereo. Pozwala to uniknąć przesunięcia panoramy stereo, które może wynikać z indywidualnego przetwarzania lewego i prawego kanału. Takie przesunięcie występuje, gdy na przykład jakiś głośny element zostanie przesunięty poza środek.

przyrost makijażu

Gdy sprężarka zmniejsza się poziom ogólny sygnału zwykle dodaje się możliwość stałego wzmocnienia na wyjściu, co pozwala uzyskać optymalny poziom.

Patrz przed siebie

Funkcja antycypowania ma na celu rozwiązanie problemów związanych zarówno ze zbyt dużymi, jak i zbyt małymi wartościami Attack i Release. Zbyt długi czas ataku nie pozwala na skuteczne przechwytywanie transjentów, a zbyt krótki czas ataku może nie być wygodny dla słuchacza. Podczas korzystania z funkcji wyprzedzenia główny sygnał jest opóźniony w stosunku do sygnału kontrolnego, co pozwala na rozpoczęcie kompresji z wyprzedzeniem, nawet zanim sygnał osiągnie wartość progową.
Jedyną wadą tej metody jest opóźnienie czasowe sygnału, co w niektórych przypadkach jest niepożądane.

Korzystanie z kompresji dynamicznej

Kompresja jest stosowana wszędzie, nie tylko w fonogramach muzycznych, ale także wszędzie tam, gdzie konieczne jest zwiększenie ogólnej głośności bez zwiększania poziomów szczytowych, gdzie używany jest niedrogi sprzęt do odtwarzania dźwięku lub ograniczony kanał transmisji (systemy nagłośnienia i łączności, radio amatorskie itp. .) .

Kompresja jest stosowana podczas odtwarzania muzyki w tle (w sklepach, restauracjach itp.), gdzie jakiekolwiek zauważalne zmiany głośności są niepożądane.

Jednak najważniejszym zastosowaniem kompresji dynamicznej jest produkcja i nadawanie muzyki. Kompresja służy do nadania dźwiękowi „grubości” i „drive”, aby lepiej dopasować instrumenty do siebie, a zwłaszcza podczas przetwarzania wokali.

Wokal w muzyce rockowej i popowej jest zwykle kompresowany, aby wyróżnić się z akompaniamentu i dodać wyrazistości. Specjalny rodzaj kompresora, dostrojony tylko do określonych częstotliwości - de-esser, służy do tłumienia syczących fonemów.

W partiach instrumentalnych kompresja jest również stosowana do efektów, które nie są bezpośrednio związane z głośnością, na przykład szybko zanikające dźwięki perkusji mogą stać się dłuższe.

Elektroniczna muzyka taneczna (EDM) często wykorzystuje side-chaining (patrz poniżej) - na przykład linia basu może być napędzana przez kopnięcie lub podobne, aby zapobiec konfliktowi bas/bęben i stworzyć dynamiczną pulsację.

Kompresja jest szeroko stosowana w transmisji (radio, telewizja, Internet) w celu zwiększenia postrzeganej głośności przy jednoczesnym zmniejszeniu zakresu dynamicznego oryginalnego dźwięku (zwykle płyty CD). W większości krajów obowiązują ograniczenia prawne dotyczące chwilowej maksymalnej głośności, jaką można nadawać. Zwykle ograniczenia te są realizowane przez stałe sprężarki sprzętowe w obwodzie napowietrznym. Dodatkowo zwiększenie odczuwanej głośności poprawia „jakość” dźwięku z punktu widzenia większości słuchaczy.

Zobacz też Wojna na głośność.

Sekwencyjne zwiększanie głośności tego samego utworu, zremasterowanego na CD od 1983 do 2000 roku.

łańcuch boczny

Innym powszechnym przełącznikiem sprężarki jest „łańcuch boczny”. W tym trybie dźwięk jest kompresowany nie w zależności od własnego poziomu, ale w zależności od poziomu sygnału dochodzącego do złącza, które zwykle nazywane jest łańcuchem bocznym.

Jest kilka zastosowań tego. Na przykład wokalista sepleni, a wszystkie litery „s” wyróżniają się z ogólnego obrazu. Przepuszczasz jego głos przez kompresor, a ten sam dźwięk jest podawany do gniazda łańcucha bocznego, ale przechodzi przez korektor. Na korektorze usuwasz wszystkie częstotliwości z wyjątkiem tych używanych przez wokalistę podczas wymawiania litery „c”. Zwykle około 5 kHz, ale może wynosić od 3 kHz do 8 kHz. Jeśli następnie przełączysz kompresor w tryb łańcucha bocznego, kompresja głosu nastąpi w tych momentach, w których wymawiana jest litera „s”. W ten sposób uzyskano urządzenie znane jako „de-esser” (de-esser). Ten sposób pracy nazywa się zależnym od częstotliwości.

Innym zastosowaniem tej funkcji jest „kaczka”. Na przykład w stacji radiowej muzyka przechodzi przez kompresor, a słowa DJ-a przechodzą przez łańcuch boczny. Gdy DJ zacznie rozmawiać, głośność muzyki zostanie automatycznie zmniejszona. Efekt ten można z powodzeniem zastosować również w nagraniach, np. w celu zmniejszenia głośności partii klawiszy podczas śpiewania.

ograniczenie muru ceglanego

Kompresor i limiter działają w bardzo podobny sposób, można powiedzieć, że limiter jest kompresorem o wysokim Ratio (od 10:1) i zazwyczaj krótkim czasie ataku.

Istnieje koncepcja ograniczania muru ceglanego - ograniczania z bardzo wysokim współczynnikiem (od 20:1 wzwyż) i bardzo szybkim atakiem. Idealnie, nie pozwala w ogóle na przekroczenie progu sygnału. Efekt będzie nieprzyjemny dla ucha, ale zapobiegnie uszkodzeniu sprzętu odtwarzającego dźwięk lub przekroczeniu przepustowości kanału. Wielu producentów integruje w swoich urządzeniach limitery właśnie w tym celu.

Maszynka do strzyżenia kontra Limiter, miękkie i twarde strzyżenie

, Odtwarzacze multimedialne

Nagrania, zwłaszcza starsze, które zostały nagrane i nagrane przed 1982 r., były znacznie rzadziej miksowane w celu zwiększenia głośności. Odtwarzają naturalną muzykę z naturalnym zakresem dynamiki, który jest zachowywany na nagraniu i tracony w większości standardowych lub wysokiej rozdzielczości formatów cyfrowych.

Oczywiście są tu wyjątki – posłuchaj niedawno wydanej płyty Steven Wilson z MA Recordings czy Reference Recordings, a usłyszysz, jak dobry może być dźwięk cyfrowy. Ale to rzadkość, większość współczesnych nagrań dźwiękowych jest głośna i skompresowana.

Kompresja muzyki jest ostatnio bardzo krytykowana, ale mogę się założyć, że prawie wszystkie Twoje ulubione nagrania są kompresowane. Niektóre mniej, inne więcej, ale wciąż skompresowane. Kompresja zakresu dynamiki to kozioł ofiarny, którego obwinia się za złe muzyczne dźwięki, ale mocno skompresowana muzyka nie jest niczym nowym: słuchaj albumów Motown z lat 60-tych. To samo można powiedzieć o klasykach Led Zeppelin czy młodszych albumach Wilco i Radiohead. Kompresja zakresu dynamiki zmniejsza naturalny stosunek między najgłośniejszym i najgłośniejszym cichy dźwięk na nagraniu, więc szept może być tak głośny jak krzyk. Ciężko znaleźć muzykę pop z ostatnich 50 lat, która nie została skompresowana.

Niedawno odbyłem miłą pogawędkę z założycielem i redaktorem magazynu Tape Op, Larrym Crane, o dobrych, złych i „złych” aspektach kompresji. Larry Crane współpracował z takimi zespołami i artystami jak Stefan Marcus, Cat Power, Sleater-Kinney, Jenny Lewis, M. Ward, The Go-Betweens, Jason Little, Eliot Smith, Quasi i Richmond Fontaine. Prowadzi również studio nagrań Jackpot! w Portland w stanie Oregon, gdzie mieszkali The Breeders, The Decemberists, Eddie Vedder, Pavement, R.E.M., She & Him i wiele, wiele innych.

Jako przykład zaskakująco sztywnych, ale wciąż świetnych piosenek, przytaczam „They Want My Soul” Spoona, wydane w 2014 roku. Crane śmieje się i mówi, że słucha tego w samochodzie, bo tam brzmi świetnie. Co prowadzi nas do kolejnej odpowiedzi na pytanie, dlaczego muzyka jest kompresowana: ponieważ kompresja i dodatkowa „klarowność” ułatwiają słyszenie w hałaśliwych miejscach.

Larry Crane w pracy. Zdjęcie autorstwa Jasona Quigley

Kiedy ludzie mówią, że podoba im się dźwięk nagrania audio, uważam, że podoba im się muzyka, tak jakby dźwięk i muzyka były nierozłącznymi pojęciami. Ale dla siebie rozróżniam te pojęcia. Z punktu widzenia melomana dźwięk może być szorstki i surowy, ale dla większości słuchaczy nie będzie to miało znaczenia.

Wiele osób szybko zarzuca inżynierom masteringu nadużywanie kompresji, ale kompresja jest stosowana bezpośrednio podczas nagrywania, podczas miksowania, a dopiero potem podczas masteringu. Jeśli nie byłeś osobiście obecny na każdym z tych etapów, nie będziesz w stanie powiedzieć, jak brzmiały instrumenty i wokale na samym początku procesu.

Crane płonął: „Jeśli muzyk chce celowo sprawić, by dźwięk był szalony i zniekształcony, jak na płytach Guided by Voices, to nie ma w tym nic złego – pragnienie zawsze przeważa nad jakością dźwięku”. Głos wykonawcy jest prawie zawsze skompresowany, to samo dzieje się z basem, perkusją, gitarami i syntezatorami. Dzięki kompresji głośność wokali jest utrzymywana na poziomie odpowiedni poziom przez całą piosenkę lub nieco odstaje od reszty dźwięków.

Prawidłowo wykonana kompresja może sprawić, że bębny będą brzmiały żywsze lub celowo dziwne. Aby muzyka brzmiała świetnie, musisz być w stanie użyć do tego niezbędnych narzędzi. Dlatego potrzeba lat, aby dowiedzieć się, jak korzystać z kompresji i nie przesadzać. Jeśli inżynier miksu zbyt mocno skompresuje partię gitarową, inżynier masteringu nie będzie już w stanie w pełni przywrócić brakujących częstotliwości.

Gdyby muzycy chcieli, abyś słuchał muzyki, która nie przeszła jeszcze etapów miksowania i masteringu, to wypuszczaliby ją na sklepowe półki prosto ze studia. Crane mówi, że ludzie, którzy tworzą, montują, miksują i masterują nagrania muzyczne, nie są po to, by przeszkadzać muzykom – pomagają wykonawcom od samego początku, czyli od ponad stu lat.

Ci ludzie są częścią procesu twórczego, w wyniku którego powstają niesamowite dzieła sztuki. Crane dodaje: „Nie chcesz wersji „Dark Side of the Moon”, która nie została zmiksowana i zmasterowana”. Pink Floyd wydali piosenkę tak, jak chcieli ją usłyszeć.

Druga część cyklu poświęcona jest funkcjom optymalizacji zakresu dynamicznego obrazów. W nim wyjaśnimy, dlaczego takie rozwiązania są potrzebne, rozważymy różne opcje ich wdrożenia, a także ich zalety i wady.

Obejmij ogrom!

W idealnym przypadku kamera powinna uchwycić obraz otaczającego świata tak, jak jest on postrzegany przez człowieka. Jednak z uwagi na to, że mechanizmy „widzenia” aparatu i ludzkiego oka są znacząco różne, istnieje szereg ograniczeń, które nie pozwalają na spełnienie tego warunku.

Jednym z problemów, z jakimi borykali się wcześniej użytkownicy kamer filmowych, a teraz posiadacze cyfrowych aparatów fotograficznych, jest brak możliwości odpowiedniego ujęcia scen z dużymi różnicami światła bez użycia specjalnych urządzeń i/lub specjalnych technik filmowania. Cechy ludzkiego aparatu wzrokowego pozwalają równie dobrze dostrzec szczegóły scen o wysokim kontraście, zarówno w obszarach jasno oświetlonych, jak i ciemnych. Niestety czujnik aparatu nie zawsze jest w stanie uchwycić obraz tak, jak go widzimy.

Im większa różnica jasności na sfotografowanej scenie, tym większe prawdopodobieństwo utraty szczegółów w światłach i/lub cieniach. W efekcie zamiast błękitnego nieba z bujnymi chmurami na zdjęciu uzyskuje się jedynie białawą plamkę, a obiekty znajdujące się w cieniu zamieniają się w niewyraźne ciemne sylwetki lub wręcz zlewają się z otoczeniem.

Fotografia klasyczna posługuje się tym pojęciem szerokość geograficzna(szczegóły na pasku bocznym). Teoretyczna szerokość geograficzna aparaty cyfrowe zależy od pojemności przetwornika analogowo-cyfrowego (ADC). Na przykład przy zastosowaniu 8-bitowego ADC, biorąc pod uwagę błąd kwantyzacji, teoretycznie osiągalna wartość szerokości fotograficznej wyniesie 7 EV, dla 12-bitowego ADC - 11 EV itd. Jednak w rzeczywistych urządzeniach zakres dynamiczny obrazów jest w to samo maksymalne teoretyczne ze względu na wpływ różnych rodzajów hałasu i innych czynników.

Duża różnica w poziomach jasności jest poważna
problem fotografii. W tym przypadku możliwości aparatu
nie wystarczyło, aby odpowiednio przekazać najwięcej
jasne obszary sceny, w wyniku czego zamiast niebieskiego obszaru
niebo (oznaczone kreską) okazało się białą „łatką”

Maksymalna wartość jasności, jaką może wykryć czujnik światłoczuły, zależy od poziomu nasycenia jego komórek. Minimalna wartość zależy od kilku czynników, w tym ilości szumu termicznego matrycy, szumu transferu ładunku i błędu ADC.

Warto również zauważyć, że szerokość geograficzna fotograficzna tego samego aparatu cyfrowego może się różnić w zależności od wartości czułości ustawionej w ustawieniach. Maksymalny zakres dynamiki można osiągnąć ustawiając tzw. czułość podstawową (odpowiadającą minimalnej możliwej wartości liczbowej). Wraz ze wzrostem wartości tego parametru zakres dynamiczny maleje ze względu na wzrost poziomu hałasu.

Szerokość fotograficzna nowoczesnych modeli aparatów cyfrowych wyposażonych w duże matryce i 14- lub 16-bitowe przetworniki ADC wynosi od 9 do 11 EV, czyli znacznie więcej w porównaniu z tymi samymi charakterystykami kolorowych negatywów 35 mm (średnio 4 do 5 EV ). W ten sposób nawet stosunkowo niedrogie aparaty cyfrowe mają wystarczającą swobodę fotograficzną, aby odpowiednio uchwycić większość typowych amatorskich scen fotograficznych.

Jest jednak problem innego rodzaju. Wiąże się to z ograniczeniami nałożonymi przez istniejące standardy rejestracji obrazów cyfrowych. Używając 8-bitowego formatu JPEG na kanał koloru (który stał się de facto standardem zapisu obrazów cyfrowych w przemysł komputerowy i technologii cyfrowej), nawet teoretycznie nie da się zapisać zdjęcia o szerokości geograficznej większej niż 8 EV.

Załóżmy, że przetwornik ADC aparatu pozwala uzyskać obraz o głębi bitowej 12 lub 14 bitów, zawierający rozróżnialne szczegóły zarówno w światłach, jak i cieniach. Jeśli jednak szerokość fotograficzna tego obrazu przekracza 8 EV, to w procesie konwersji do standardowego formatu 8-bitowego bez żadnych dodatkowych czynności (czyli po prostu odrzucając „dodatkowe” bity), część informacji rejestrowanych przez czujnik światłoczuły zostanie utracony.

Zakres dynamiczny i szerokość geograficzna

W uproszczeniu zakres dynamiczny definiuje się jako stosunek maksymalnej wartości jasności obrazu do jego minimalnej wartości. W fotografii klasycznej tradycyjnie używa się terminu szerokość geograficzna, co w rzeczywistości oznacza to samo.

Szerokość zakresu dynamicznego można wyrazić jako stosunek (na przykład 1000:1, 2500:1 itd.), ale najczęściej używana jest skala logarytmiczna. W tym przypadku oblicza się wartość logarytmu dziesiętnego stosunku jasności maksymalnej do jej wartości minimalnej, a po liczbie następuje duża litera D (z angielskiego gęstość? - gęstość), rzadziej? - skrót OD (od angielskiej gęstości optycznej? - gęstość optyczna). Na przykład, jeśli stosunek maksymalnej wartości jasności do minimalnej wartości dowolnego urządzenia wynosi 1000:1, to zakres dynamiczny wyniesie 3,0 D:

Do pomiaru szerokości geograficznej tradycyjnie stosuje się tzw. jednostki ekspozycji, oznaczane skrótem EV (od angielskich wartości ekspozycji; profesjonaliści często nazywają je „stopami” lub „krokami”). W tych jednostkach wartość kompensacji ekspozycji jest zwykle ustawiana w ustawieniach aparatu. Zwiększenie wartości szerokości geograficznej o 1 EV jest równoznaczne z podwojeniem różnicy między maksymalnym i minimalnym poziomem jasności. Tak więc skala EV jest również skalą logarytmiczną, ale w tym przypadku do obliczenia wartości liczbowych stosuje się logarytm o podstawie 2. Szerokość geograficzna fotograficzna wyniesie 8 EV:

Kompresja to rozsądny kompromis

Najskuteczniejszym sposobem zachowania pełnych informacji o obrazie przechwyconych przez czujnik światła aparatu jest rejestrowanie zdjęć w formacie RAW. Jednak ta funkcja nie jest dostępna we wszystkich aparatach i nie każdy fotograf-amator jest gotowy do żmudnej pracy nad selekcją ustawienia indywidualne dla każdego wykonanego zdjęcia.

Aby zmniejszyć możliwość utraty szczegółów w obrazach o wysokim kontraście konwertowanych wewnątrz aparatu do 8-bitowego JPEG, wprowadzono urządzenia wielu producentów (nie tylko kompaktowe, ale także lustrzanki). funkcje specjalne, umożliwiając kompresję zakresu dynamicznego zapisanych obrazów bez interwencji użytkownika. Zmniejszając ogólny kontrast i tracąc niewielką część informacji o oryginalnym obrazie, takie rozwiązania pozwalają zachować w 8-bitowym JPEGu szczegóły w światłach i cieniach zarejestrowane przez światłoczuły czujnik urządzenia, nawet jeśli zakres dynamiczny oryginalnego obrazu okazał się szerszy niż 8 EV.

Jednym z pionierów rozwoju tego kierunku była firma HP. Wprowadzony na rynek w 2003 roku aparat cyfrowy HP Photosmart 945 jako pierwszy na świecie wdrożył technologię HP Adaptive Lightling, która automatycznie kompensuje brak światła w ciemnych obszarach obrazu, a tym samym zachowuje szczegóły w cieniach bez ryzyka prześwietlenia (co jest bardzo ważne przy fotografowaniu scen o wysokim kontraście). Algorytm HP Adaptive Lightling opiera się na zasadach przedstawionych przez angielskiego naukowca Edwina Landa w teorii percepcji wzrokowej człowieka RETINEX.

Menu funkcji adaptacyjnego oświetlenia HP

Jak działa oświetlenie adaptacyjne? Po uzyskaniu 12-bitowego obrazu obrazu, wyodrębnia się z niego pomocniczy obraz monochromatyczny, który w rzeczywistości jest mapą świetlną. Podczas przetwarzania obrazu mapa ta jest używana jako maska, która pozwala dostosować stopień wpływu dość złożonego filtra cyfrowego na obraz. Zatem w obszarach odpowiadających najciemniejszym punktom mapy wpływ na obraz przyszłego obrazu jest minimalny i odwrotnie. Takie podejście pozwala pokazać szczegóły w cieniach poprzez selektywne rozjaśnianie tych obszarów i, odpowiednio, zmniejszenie ogólnego kontrastu wynikowego obrazu.

Należy zauważyć, że gdy funkcja Adaptive Lighting jest włączona, przechwycony obraz jest przetwarzany w sposób opisany powyżej, zanim ostateczny obraz zostanie zapisany do pliku. Wszystkie opisane operacje wykonywane są automatycznie, a użytkownik może wybrać tylko jeden z dwóch trybów Adaptive Lighting w menu kamery (niski lub wysoki poziom wpływ) lub wyłącz tę funkcję.

Ogólnie rzecz biorąc, wiele specyficznych funkcji współczesnych aparatów cyfrowych (w tym omówione w poprzednim artykule systemy rozpoznawania twarzy) to swego rodzaju produkty uboczne lub produkty konwersji projektów badawczych, które pierwotnie były realizowane dla klientów wojskowych. Jeśli chodzi o funkcje optymalizacji zakresu dynamiki obrazu, jednym z najbardziej znanych dostawców tego typu rozwiązań jest firma Apical. Algorytmy stworzone przez jej pracowników w szczególności leżą u podstaw działania funkcji SAT (Shadow Adjustment Technology - technologia korekcji cieni) zaimplementowanej w wielu cyfrowych aparatach Olympus. W skrócie działanie funkcji SAT można opisać następująco: na podstawie oryginalnego obrazu obrazu tworzona jest maska ​​odpowiadająca najciemniejszym obszarom, a następnie poziom ekspozycji jest automatycznie korygowany dla tych obszarów.

Sony nabyło również licencję na prawo do korzystania z opracowań Apical. Wiele modeli aparatów kompaktowych z serii Cyber-shot oraz lustrzanek serii alpha posiada funkcję tzw. optymalizacji zakresu dynamicznego (Dynamic Range Optimizer, DRO).

Zdjęcia wykonane przy wyłączonym urządzeniu HP Photosmart R927 (góra)
i aktywowane oświetlenie adaptacyjne

Korekcja obrazu po aktywacji DRO jest wykonywana podczas wstępnego przetwarzania obrazu (to znaczy przed zapisaniem gotowego pliku JPEG). W wersji podstawowej DRO posiada ustawienie dwustopniowe (w menu można wybrać standardowy lub rozszerzony tryb jego działania). Gdy wybrany jest tryb standardowy, na podstawie analizy obrazu ekspozycja jest korygowana o wartość ekspozycji, a następnie do obrazu jest stosowana krzywa tonalna w celu wyrównania ogólnego balansu. Tryb zaawansowany wykorzystuje bardziej złożony algorytm, który umożliwia wprowadzanie poprawek zarówno w cieniach, jak i światłach.

Deweloperzy Sony nieustannie pracują nad ulepszeniem algorytmu DRO. Na przykład w lustrzance a700, gdy włączony jest zaawansowany tryb DRO, można wybrać jedną z pięciu opcji korekcji. Dodatkowo istnieje możliwość zapisania na raz trzech wariantów jednego obrazu (rodzaj braketingu) z różnymi ustawieniami DRO.

Wiele aparatów cyfrowych firmy Nikon ma funkcję D-Lighting, która również opiera się na algorytmach Apical. Co prawda, w przeciwieństwie do opisanych powyżej rozwiązań, D-Lighting jest zaimplementowany jako filtr do przetwarzania wcześniej zapisanych obrazów za pomocą krzywej tonalnej, której kształt pozwala rozjaśnić cienie, pozostawiając resztę obrazu bez zmian. Ale ponieważ w tym przypadku przetwarzane są gotowe obrazy 8-bitowe (a nie oryginalny obraz klatki, który ma większą głębię bitową i odpowiednio szerszy zakres dynamiczny), możliwości D-Lighting są bardzo ograniczone. Użytkownik może uzyskać ten sam wynik, przetwarzając obraz w edytorze graficznym.

Porównując powiększone fragmenty wyraźnie widać, że ciemne obszary oryginalnego obrazu (po lewej)
gdy funkcja Adaptive Lighting jest włączona, stają się jaśniejsze

Istnieje również szereg rozwiązań opartych na innych zasadach. Tak więc w wielu kamerach z rodziny Lumix firmy Panasonic (w szczególności DMC-FX35, DMC-TZ4, DMC-TZ5, DMC-FS20, DMC-FZ18 itp.) funkcja rozpoznawania oświetlenia (Intelligent Exposure) jest część integralna Inteligentne systemy automatycznego sterowania fotografowaniem. Funkcja inteligentnej ekspozycji opiera się na automatycznej analizie obrazu klatki i korekcji ciemnych obszarów obrazu w celu uniknięcia utraty szczegółów w cieniach, a także (w razie potrzeby) kompresji zakresu dynamicznego scen o wysokim kontraście.

W niektórych przypadkach działanie funkcji optymalizacji zakresu dynamicznego zapewnia nie tylko pewne operacje przetwarzania oryginalnego obrazu obrazu, ale także korektę ustawień fotografowania. Na przykład w nowych modelach aparatów cyfrowych Fujifilm (w szczególności w FinePix S100FS) zaimplementowana jest funkcja rozszerzania zakresu dynamicznego (Wide Dynamic Range, WDR), co według twórców pozwala zwiększyć szerokość geograficzną o jeden lub dwa kroki (w zakresie ustawień - 200 i 400%).

Gdy funkcja WDR jest włączona, aparat wykonuje zdjęcia z kompensacją ekspozycji -1 lub -2 EV (w zależności od wybranego ustawienia). W ten sposób obraz kadru jest niedoświetlony - jest to konieczne, aby zachować maksymalną informację o szczegółach w prześwietleniach. Następnie uzyskany obraz jest przetwarzany za pomocą krzywej tonalnej, co pozwala wyrównać ogólny balans i dostosować poziom czerni. Obraz jest następnie konwertowany do formatu 8-bitowego i zapisywany jako plik JPEG.

Kompresja zakresu dynamicznego pozwala zachować więcej szczegółów
w światłach i cieniach, ale nieuniknioną konsekwencją takiego uderzenia
to zmniejszenie ogólnego kontrastu. Na dolnym obrazie
tekstura chmur jest jednak znacznie lepiej dopracowana
ze względu na mniejszy kontrast ten wariant obrazu
wygląda mniej naturalnie

Podobna funkcja o nazwie Dynamic Range Enlargement jest zaimplementowana w wielu kompaktowych aparatach Pentax i lustrzankach jednoobiektywowych (Optio S12, K200D itp.). Jak podaje producent, zastosowanie funkcji Dynamic Range Enlargement pozwala zwiększyć szerokość fotograficzną zdjęć o 1 EV bez utraty szczegółów w światłach i cieniach.

Podobna funkcja o nazwie Priorytet tonu podświetlenia (HTP) jest zaimplementowana w wielu modelach lustrzanek jednoobiektywowych firmy Canon (EOS 40D, EOS 450D itp.). Zgodnie z instrukcją obsługi, aktywacja HTP pozwala uzyskać lepszą szczegółowość podświetleń (dokładniej w zakresie poziomów od 0 do 18% szarości).

Wniosek

Podsumujmy. Wbudowana kompresja zakresu dynamiki pozwala na konwersję oryginalnego obrazu z dużym zakresem dynamiki do 8-bitowego przy minimalnych uszkodzeniach plik jpeg. W przypadku braku zapisywania klatek w formacie RAW, tryb kompresji zakresu dynamicznego pozwala fotografowi w pełni wykorzystać potencjał aparatu podczas fotografowania scen o wysokim kontraście.

Pamiętajmy oczywiście, że kompresja dynamiki to nie cudowne lekarstwo, a raczej kompromis. Zachowanie szczegółów w światłach i/lub cieniach wiąże się ze zwiększonym szumem w ciemnych obszarach obrazu, zmniejszonym kontrastem i pewnym zgrubieniem płynnych przejść tonalnych.

Jak każda funkcja automatyczna, algorytm kompresji zakresu dynamiki nie jest w pełni uniwersalnym rozwiązaniem, które pozwala poprawić absolutnie każdy obraz. Dlatego warto aktywować go tylko w tych przypadkach, gdy jest to naprawdę potrzebne. Na przykład, aby sfotografować sylwetkę z dobrze zaprojektowanym tłem, funkcja kompresji zakresu dynamicznego musi być wyłączona - in Inaczej efektywna fabuła zostanie beznadziejnie zepsuta.

Kończąc rozważanie tego tematu, należy zauważyć, że wykorzystanie funkcji kompresji zakresu dynamicznego nie pozwala na „wyciągnięcie” szczegółów z wynikowego obrazu, które nie zostały przechwycone przez czujnik aparatu. Aby uzyskać satysfakcjonujący efekt podczas fotografowania scen o wysokim kontraście, konieczne jest zastosowanie dodatkowych urządzeń (np. filtrów gradientowych do fotografowania krajobrazów) lub specjalnych technik (takich jak wykonanie kilku ujęć z bracketingiem ekspozycji, a następnie połączenie ich w jeden obraz za pomocą Tone Mapping technologia).

Następny artykuł skupi się na funkcji zdjęć seryjnych.

Ciąg dalszy nastąpi

Podobał Ci się artykuł? Podziel się z przyjaciółmi!
Czy ten artykuł był pomocny?
tak
Nie
Dziekuję za odpowiedź!
Coś poszło nie tak i Twój głos nie został policzony.
Dziękuję Ci. Twoja wiadomość została wysłana
Znalazłeś błąd w tekście?
Wybierz, kliknij Ctrl+Enter a my to naprawimy!