JPEG画像にさらにハフマン符号化をかけると・・・?

このQ&Aのポイント
  • JPEG画像にさらにハフマン符号化をかけると、ほとんど圧縮できないのか?
  • 卒業研究の一環で、JPEG画像におけるハフマン符号化の圧縮率について考察しています。
  • 研究の結果、フルカラー画像もグレースケール画像もほとんど圧縮できないが、単純な線画のみ2割程度まで圧縮が可能であることが分かりました。
回答を見る
  • ベストアンサー

JPEG画像にさらにハフマン符号化をかけると・・・?

現在卒業研究の一環で「なぜJPEG画像にハフマン符号化をかけてもほとんど圧縮できないのか?」というテーマについて考えています。 研究の過程でハフマン符号化プログラムを組み、様々な種類のJPEG画像を圧縮し、圧縮率を検証しました。その結果、フルカラー画像もグレースケール画像もほとんど圧縮できませんでしたが、単純な線画(白地に黒い線を数本引いただけのもの)の画像のみ元の2割程度まで圧縮できました。 最初はやはりJPEG画像には元からハフマン符号化がかかっているから圧縮率が悪いのかな、とも思ったのですが、『単純な線画の画像のみ元の2割程度まで圧縮できている』ので、単に「元からハフマン符号化がかかっているから」では説明がつかないように思えます。 おおまかで構いませんので、これの原因について皆様のご意見をお聞かせください。よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • kazusone
  • ベストアンサー率54% (33/61)
回答No.2

JPEG画像のフォーマットは既にご存知かと思いますが、8*8ピクセルのブロックに区切って、ブロックごとに圧縮します。 自然画像ですと、隣接ブロックで同じデータになりがたいため、再圧縮の効果が薄いのでしょう。単純画像であれば、全て白のブロックが連続する可能性があるので、再圧縮の余地があったと推測できます。 余計なお世話かと思いますが、学部の卒論としてこのテーマはいかがなものでしょう? 採用試験などの面接で聞いたら失笑が漏れかねないテーマだと思います。まだ、着手したばかりの時期だと思いますので、指導教官とテーマを再検討なさることをお勧めします。

yuzu_j
質問者

お礼

なるほど!そういうことでしたか~。 >学部の卒論としてこのテーマはいかがなものでしょう? あ、ちょっと説明が足りませんでしたね。 ぼくの研究テーマは「ハフマン符号化を用いたWEBページの高速表示」です。圧縮プログラムを使ってHTMLファイルのサイズを減少させ、伝送を高速化させるシステムを構築する、というものです。 その過程でハフマン符号化プログラムを作り、WEBページ上でよく使われるBMP画像とJPEG画像をサンプルとして圧縮して圧縮率を検証したわけですが、JPEG画像のみ極端に圧縮率が悪かったので、レポートに書く考察の項目の一つとして、ここで質問させていただいたようなことについて考えていたわけです。 確かに卒研のテーマそのものがこれだったらあんまりですね(^^;; ご意見どうもです。 ご回答ありがとうございました!

その他の回答 (1)

  • tsukachan
  • ベストアンサー率42% (202/470)
回答No.1

ハフマン符号化されたデータはハフマン符号化で効果が期待できる統計的な出現率の偏りが既に減少しているからではないでしょうか?

yuzu_j
質問者

お礼

様々な種類のJPEG画像を圧縮したのですが、例外的に単純な線画の画像のみ元の2割程度まで圧縮できているので、それだけでは説明がつかないのでは、と考えています。 ご回答ありがとうございました。

関連するQ&A

  • ハフマン符号によるエントロピー符号化?

    現在、JPEG画像圧縮について調べていまして、 1 非可逆圧縮では、まず離散コサイン変換をして、画像の空間領域を周波数領域に変換 2 次に1によって変換した周波数領域をアナログデータと見たて、デジタル化する量子化を行い情報量を削る。 3 最後にハフマン符号によるエントロピー符号化で圧縮  とwikipediaで調べて2までは理解できたのですが、3のハフマン符号によるエントロピー符号化というのがよくわかりません。 どなたか詳しい方、わかりやすく教えていただけないでしょうか?  回答よろしくおねがいいたします。

  • ハフマン符号化について

    ハフマン符号化についてですが、圧縮のためであるので、 ハフマン符号化を行いなさいといわれた場合において、 木構造の1と0の取り方はどんなものでも良いのでしょうか? 生起確率が A:0.12 B:0.12 C:0.28 D:0.48 であった場合、 添付画像の青い文字のように符号化を行い、 A:000 B:001 C:01 D:1 としても、赤い文字のように符号化を行い、 A:111 B:110 C:10 D:0 としても、どちらでもハフマン符号化としては正解なのでしょうか? また、0と1を階層ごとにランダムにとっても問題ないのでしょうか?

  • jpeg画像をより小さく圧縮するために

    現在卒業研究で「画像圧縮によるホームページの高速表示」というテーマを研究しています。これは (1)自PCにサーバソフトをインストール (2)HTMLファイル内に含まれる画像ファイルを圧縮するプログラムをそれに組み込む (3)圧縮処理したHTMLファイルに解凍プログラムを添付、送信 (4)受信側でHTMLファイル内の画像を解凍、ページを表示 というのが大まかな流れです。 そこで、jpegファイルの圧縮に有効なプログラムをハフマン符号化をベースにCで作っているのですが、現在のjpegの規格に使われているハフマン符号化アルゴリズムよりもさらに圧縮率の高いプログラムを作らなければなりません。ちなみに差分値化処理は試しましたがあまり効果はありませんでした。 おおまかなご説明で構いませんので、何か有効な方法があればなにとぞご教授ください。よろしくお願いします。

  • ハフマン符号のプログラム

     以下の問題に回答できる方,いらっしゃいましたらソースファイルと実行結果を送ってください。  ファァイル(記号列)を読み込んで,ハフマン符号によりファイルを圧縮するプログラム(C言語)を作成する(プログラムは,圧縮を行うものと,解凍を行うものの2つ作る)。また,いくつか適当なファイルに対して,圧縮を行い圧縮率を測定する。 (1)圧縮プログラムについて  圧縮のステップ  (a)入力ファイルを読み込み各記号の出現頻度をカウントする。  (b)得られた出現頻度を使って各符号のハフマン符号を生成する。  (c)各符号の出現頻度を出力ファイルに書き出す。  (d)もう一度入力ファイルを読み込みながら各符号をハフマン符号で置き換え    て出力ファイルに出力する。圧縮ファイルの形式は次のようになる。   0x00の  0x01の … 0xffの 先頭文字の 2文字目の … 終端文字の   出現頻度 出現頻度 出現頻度 符号語   符号語    符号語    (c)で書きこむ部分      (d)で書きこむ部分 (2)解凍プログラムについて  解凍のステップ  (a)各符号の出現頻度を圧縮ファイルから読み込む。  (b)得られた出現頻度を使って各符号のハフマン符号を生成する。  (c)圧縮ファイルの符号語を読み込みながら各符号のハフマン符号と比較しも    し一致したらその記号を解凍ファイルに出力する。  (d)(c)をファイルの終わりもしくは出現頻度をすべて足し合わせた記号数分処   理するまで繰り返す。  関数について  関数get_bit  ファイルから1bit読み込んで戻り値として返す。  (ファイルポインタはグローバル変数で用意する)  関数put_bit  引数として0,または1を渡すと1bitずつファイルに書き込む。  (ファイルポインタはグローバル変数で用意する)

  • ブロックハフマン符号化プログラムの作成

    現在学校の研究で「ブロック(n次拡大情報源)ハフマン符号化」プログラムをC言語で作成しています。 これは、通常のハフマン符号化でデータ1個ごとに出現頻度を調べてそれぞれにハフマン符号を割り当てるところを、ファイル中で隣り合うデータ2個(あるいは3個、4個、・・・n個)を一かたまりと見なし、それぞれの出現頻度を調べてハフマン符号を割り当てる、というものです。 通常のハフマン符号化は以前作成したことがあるのですが、これをどのようにして上記のようなプログラムに改変すればいいのかわかりません。 ちなみに、データのバッファリングは以下のようにし、 #define BUFFER_SIZE 102400 unsigned char buffer[BUFFER_SIZE]; (中略) int i,c; i = 0; while(i < BUFFER_SIZE && (c = fgetc(fp_i)) != EOF) { buffer[i] = c; i++; } 各データの出現頻度は以下のようにして調べています。 #define N 256 (中略) int hist[N * 2]; for(i = 0;i < (N * 2);i++) hist[i] = 0; for(i = 0;i < size;i++) hist[data[i]]++; ※data[i]は前述のbuffer[i]、sizeは前述のi(圧縮対象データのファイルサイズ)です。 やはり、バッファリングに使う配列をもう少しサイズの大きい型で宣言するとこから始めるべきでしょうか? ご教授お願いします。

  • ハフマン符号の圧縮率について

    こんにちは。現在、情報処理技術者試験の勉強をして いるのですが、ハフマン符号の圧縮率を問う問題でつ まずいています。 問題は、 同じ文字が、4文字以上続いた場合、(文字)*(文字 数)の3バイトで表す。Aが15文字連続ならA*15の3 バイトです。(厳密には15(2桁)が1バイトで表せな いと思いますが、この問題ではそうなっています。)  その前提で、「同じ文字がn個(1<=n<=15)続く確 率を表1のとおり仮定した場合の圧縮率は何パーセン トか。小数点第一位を四捨五入して答えよ。」(1文字 は1バイトとする) 表1 n   確率 1 0.6   2 0.03 3 0.03 4 0.03 5 0.03 6 0.03 7 0.03 8 0.03 9 0.03 10 0.03 11 0.03 12 0.025 13 0.025 14 0.025 15 0.025 問題は以上です。 私は、1000回事象が起きたと仮定して、 0.6は600回、0.03は30回、0.025は25回 として考えました。 まず、圧縮しない場合、 1*600=600byte(以下b) 2*30=60b 3*30=90b 4*30=120b 5*30=150b 6*30=180b 7*30=210b 8*30=240b 9*30=270b 10*30=300b 11*30=330b 12*25=300b 13*25=325b 14*25=350b 15*25=375b 合計 3800b 次に、圧縮した場合、n=3までは、 1*600=600byte(以下b) 2*30=60b 3*30=90b 合計、750b 4以上は3バイトに圧縮なので、 3b*30=90 これが、4~11まで同じ確率なので、 合計 3b*30*8=720b 12~15は25回なので、 合計 3b*25*4=300b 圧縮した場合の 合計、750+720+300=1770b 圧縮率 1770/3800=47% 解答は、79% でした。字数制限で、詳細を記入できな いのですが、なぜ食い違うのか分かりません。 大変な長文ですみません。よろしくお願いします。

  • JPEG画像の圧縮率について

    JPEG画像の圧縮について質問いたします。 画像処理ソフト(Fireworks)のJPEG形式による書き出しでは,品質(圧縮率?)を選べます(Photoshopも同様だった気がします)。この際,最高品質(100)を指定すると,画像の劣化はないのでしょうか。 JPEGは保存のたびに画質が劣化する読んだことがありますが,画像処理ソフトで品質を最高で書き出しや保存すると,画像処理した以外の部分の品質は,元のJPEG画像のままなのでしょうか。 よろしくお願いします。

  • jpeg2000の可逆圧縮の圧縮率

    jpeg2000の可逆圧縮のときの圧縮率がどの程度なのかを知りたいです。 画像によっても違ってくると思うのですが、大まかにどの程度というのが分かればよいのでどなたか分かる方教えてください。 (ホームページを探しても圧縮率を調整できるとか、jpegより30~50%圧縮率を改善とか書いてありますけど、これって多分非可逆圧縮のときの話ですよね。もし違っていたらごめんなさい。)

  • Jpegに代わる画像形式はありませんか?

     Jpegでも、Gifのような、特許問題が起こっているそうなので、代わりになる 画像形式を探しているのですが、それらしい形式をみつけられなかったので、 書き込ませていただきました。  HPにも使用出来、Jpeg並に圧縮率の高い画像形式はないでしょうか?  もしご存知の方がいらしたら、よろしくお願いします。

  • JPEGでの画像の保存について

    デジタルカメラを最近購入し、いろいろ試しているのですが、パソコンに取り込んだ画像を、名前を付けて保存でJPEGで、圧縮なしにして保存すると、元の画像サイズより大きくなるような気がします。これはなぜでしょうか? それと、デジカメの画像を劣化をしないように何度も保存を繰り返す為にはやはりTIFFで保存していくのがいいのでしょうか?JPEGの圧縮なしでの保存の繰り返しは、画像が劣化しますか? あまり詳しくありませんので、わかりやすく説明していただけたら助かります。よろしくお願いします。