Komprejsa obrazu - kod Huffmana

Rejestracja:ponad 11 lat
Ostatnio:prawie 9 lat
Postów:5

0

Witam

Mam zadanie, polegające na napisaniu programu kompresującego bitmapę z wykorzystaniem algorytmu Huffmana (oraz dekompresującego). Bitmapa jest 8-bitowa (8 bitów na piksel, paleta kolorów lub odcienie szarości).
Stworzyłem ogólny algorytm. Bardzo proszę o sprawdzenie toku rozumowania i wskazanie błędów :)

Kodowanie:

Tworzę w programie tablicę, składającą się z 256 elementów.
Z nagłówka pliku BMP odczytuję wysokość i szerokość obrazu
Przechodzę do tablicy pikseli i odczytuje ją po jednym bajcie.
Inkrementuję w mojej tablicy indeks, odpowiadający odczytanemu bajtowi.
Gdy dochodzę do końca pliku to w tablicy mam zliczone wsytąpienia poszczególnych kolorów.
Dane z tablicy "przekazuję" do algorytmu Huffmana i dla każdego indeksu (koloru) otrzymuję jego kod.
Tworzę nowy plik (skompresowany) i umieszczam w jego nagłówku wysokość i szerokość obrazu.
Tworzę nową paletę barw - składowe pobieram z "oryginalnej" palety, jednak zamiast indeksów daję kod.
"Przepisuję" tablicę pikselów z oryginalnego obrazu, uwzględniając kody znajdujące się w nowej (skompresowanej) palecie barw.

Pozdrawiam

MateuszS 2014-01-08 00:52

Wydaje mi sie ze jest ok (o ile dobrze wszystko zrozumialem). Napisz Huffmana optymalnie i powinno ladnie dzialac. Sam mialem podobny projekt wiec moge pomoc

bartop

2014-01-08 14:02

bartop2014-01-08 14:02

Rejestracja:ponad 11 lat
Ostatnio:ponad 6 lat
Postów:36

1

Moim zdaniem w znacznej większości twój tok rozumowania jest poprawny. Nie jestem tylko pewien, po co pobierać wymiary obrazu. Jeśli nie chcesz wyświetlać skompresowanego pliku jako obrazu (chyba, że chcesz) to imo nie bardzo ma to sens.
Pozdrawiam

micha_l

2014-02-03 22:28

micha_l2014-02-03 22:28

Rejestracja:ponad 11 lat
Ostatnio:prawie 9 lat
Postów:5

0

Witam ponownie :)

Dziękuję za odpowiedzi.
Okazało się, że kompresowana ma być bitmapa 4-bitowa (a nie jak pisałem na początku 8-bitowa). Jest jednak pewien problem - pliki źródłowe, które mają być poddane kompresji nie zawierają palety barw, lecz każdy piksel opisywany jest za pomocą trzech bajtów (składowe kolejno B, G, R). Trochę to dziwne, bo choć obrazek jest 4-bitowy to zapisany jest jak 24-bitowy. W związku z tym w skompresowanym pliku będę musiał sam stworzyć paletę barw - i tu pojawia się problem :) Nie do końca wiem w jaki sposób to uczynić
Moim pierwszym pomysłem było stworzenie tablicy czterowymiarowej (np. int[16][4]) i dla każdego indeksu (od 0 do 15) zapisywać ilość wystąpień danego koloru (np. tab[0][0] - składowa B, tab[0][1] - składowa G, tab[0][2] - składowa R, tab[0][3] - ilość wystąpień). Nie wiem w jaki sposób można byłoby to jeszcze zrealizować?
Jeśli chodzi o samo tworzenie tablicy kolorów to trzeba chyba odczytywać po trzy bajty, następnie sprawdzać czy taka kombinacja znajduje się już w tablicy, jeśli tak to należy ją inkrementować, a jeśli nie to dopisać?

Mam nadzieję, że udało mi się wyjaśnić w miarę zrozumiale o co mi chodzi. Będę bardzo wdzięczny za wszelkie wskazówki.

Pozdrawiam

bartop 2014-02-03 22:33

Mówisz o tworzeniu palety w skompresowanym pliku, prawda?

micha_l 2014-02-03 22:41

Tak, przy dekompresji będę musiał zapisać w formacie bez palety (3 bajty na piksel)

bartop 2014-02-03 22:50

To powiedz mi jeszcze, czy chcesz wyświetlać ten skompresowany plik jako obraz, czy to ma być plik w stylu .rar albo zip, który służy tylko do zmniejszenia objętości obrazu?

micha_l 2014-02-03 22:51

Wyświetlanie nie jest konieczne. Ważnie jest tylko to, aby była możliwość dekompresji do pliku bmp :)

bartop

2014-02-03 22:59

bartop2014-02-03 22:59

Rejestracja:ponad 11 lat
Ostatnio:ponad 6 lat
Postów:36

1

Mając te informacje powiem tak. Nie musisz zbierać palety barw ani wymiarów obrazu. Po prostu odczytuj plik bajt po bajcie i zapisuj w tablicy ilość wystąpień poszczególnych bajtów i zakoduj pojedyncze bajty Huffmanem

micha_l

2014-02-03 23:06

micha_l2014-02-03 23:06

Rejestracja:ponad 11 lat
Ostatnio:prawie 9 lat
Postów:5

0

Ale mając paletę barw kompresja powinna być skuteczniejsza (bo kodujemy tylko 16 wartości, a nie 48).

bartop 2014-02-03 23:38

Nie jestem w tej kwestii specem, ale wydaje mi się, że im większy potencjalny słownik, tym lepiej Huffman koduje (pod warunkiem, że prawdopodobieństwo wystąpień nie jest nadmiernie zróżnicowane)

micha_l 2014-02-03 23:48

W sumie masz racje :) Mój błąd. Ale paleta, niestety, jest konieczna (takie wymagania projektu)

Azarien 2014-02-05 09:41

"prawdopodobieństwo wystąpień nie jest nadmiernie zróżnicowane" - chyba "nie jest nadmiernie równomierne"? :-) bo przy równym p-stwie wszystkich znaków kompresja jest niemożliwa.

bartop 2014-02-05 11:13

To prawda, ale też kiedy prawdopodobieństwo wystąpienia pewnego symbolu jest bliskie 1 albo po prostu duże to Huffman jest nieefektywyny (a przynajmniej nie tak efektywny, gdy prawdopodobieństwo jest bardziej "wypośrodkowane").

micha_l

2014-02-05 21:42

micha_l2014-02-05 21:42

Rejestracja:ponad 11 lat
Ostatnio:prawie 9 lat
Postów:5

0

Pojawił się kolejny problem :)
Plik źródłowy zdefiniowałem jako fstream wejscie; Dane pobieram z niego bajt po bajcie, zapisując je do zmiennej typu unsigned char (wejscie >> zmienna). Niestety, gdy w pliku znajduje się bajt o wartości 0x20 to jest pomijany i odczytywany jest kolejny bajt (jest to znak spacji z ASCII). Nie wiem jak sobie z tym poradzić

_13th_Dragon

2014-02-05 21:48

_13th_Dragon2014-02-05 21:48

Rejestracja:ponad 19 lat
Ostatnio:około 9 godzin

2

Kopiuj

fstream wejscie("plik",ios::in|ios::binary);
int znak;
while((znak=wejscie.get())!=EOF) ...

several

2014-02-05 21:54

several2014-02-05 21:54

Rejestracja:prawie 16 lat
Ostatnio:7 minut

2

micha_l napisał(a):

Plik źródłowy zdefiniowałem jako fstream wejscie; Dane pobieram z niego bajt po bajcie, zapisując je do zmiennej typu unsigned char (wejscie >> zmienna)

Jeśli chcesz czytać binarnie to użyj funkcji read() z flagą ios::binary.

edytowany 1x, ostatnio: several 2014-02-05 21:55

micha_l

2014-02-05 21:58

micha_l2014-02-05 21:58

Rejestracja:ponad 11 lat
Ostatnio:prawie 9 lat
Postów:5

0

Dziękuję :)
Dopisanie ios::binary i używanie funkcji get(), zamiast operatora ">>" pomogło

Komprejsa obrazu - kod Huffmana

micha_l

bartop

micha_l

bartop

micha_l

micha_l

_13th_Dragon

several

micha_l napisał(a):

micha_l

DevOps Engineer - migracja serwerów (Kubernetes,Docker,RoR)

Programista Systemów Automatyki - PCS7

PHP + Codeigniter 4 programista, aplikacja do fakturowania

Praca dla programistów

Forum dyskusyjne

Sprawy administracyjne

O nas

Skontaktuj się z nami