【IT基礎】圧縮(可逆・非可逆)の違い|「布団圧縮」と「みじん切り」で覚える

「メールでファイルを送りたいけど、容量が大きすぎて送れない!」
そんな時、ファイルを「ZIP(ジップ)」形式に圧縮したことがあると思います。

また、デジカメの写真は「JPEG(ジェイペグ)」という形式で保存されますが、これも実は圧縮ファイルの一種です。
この2つ、同じ「小さくする技術」ですが、決定的な違いがあります。

この記事では、「可逆圧縮(かぎゃくあっしゅく)」「非可逆圧縮(ひかぎゃくあっしゅく)」の違いを、生活用品に例えて解説します。

1. 可逆圧縮 = 「布団圧縮袋」

まずは、ZIPファイルなどに使われる「可逆圧縮」です。
読んで字のごとく、「逆が可能=元に戻せる」という意味です。

イメージ:布団圧縮袋

冬用の分厚い布団を、掃除機で空気を抜いてペチャンコにします。
これなら押し入れ(ハードディスク)にも入りますし、宅配便(メール)で送るのも楽ですよね。

重要なのは、「袋を開ければ、完全に元のふかふかの布団に戻る」という点です。
綿が減ったり、布が切れたりすることはありません。

使われる場面

Excel、Word、プログラムのコードなど、「1文字でも変わったら壊れてしまうデータ」に使われます。
Excelの数字が勝手に変わったら大問題ですよね。だから、必ず元通りになる「可逆圧縮(ZIPなど)」を使うのです。

2. 非可逆圧縮 = 「野菜のみじん切り」

次は、JPEG画像やMP3音声に使われる「非可逆圧縮」です。
こちらは「元には戻せない」圧縮方法です。

イメージ:野菜のみじん切り(または濃縮還元ジュース)

野菜をみじん切りにすれば、体積は小さくなります。
しかし、「もう元の野菜の形には戻りません」

画像や音声データでこれを行うとき、コンピュータは大胆なことをします。
「どうせ人間には聞こえない音だからカットしよう」
「ここの色は似てるから、全部同じ色ってことにしよう」
このように、情報を間引いて(捨てて)サイズを小さくしているのです。

使われる場面

写真、動画、音楽など、「多少劣化しても人間には気づかれないデータ」に使われます。
JPEG画像は、実は元の写真より少し汚くなっているのですが、人間の目では気づかないレベルに調整されているのです。

3. JPEGとPNG、どっちを使うべき?

ブログや資料作成で、画像の保存形式に迷ったことはありませんか?
これも圧縮の仕組みを知っていれば正しく選べます。

形式 圧縮タイプ 得意な画像
JPEG
(.jpg)
非可逆
(捨てちゃう)
写真、グラデーション
色数が多くてもファイルサイズが小さくなる。
PNG
(.png)
可逆
(元に戻せる)
ロゴ、イラスト、スクショ
色がくっきりしてきれい。背景を透明にできる。

「スマホで撮った写真」はJPEG、「Excelの表をスクショしたもの」はPNGがおすすめです。
スクショをJPEGで保存すると、文字の周りがモヤモヤっと汚くなる(ノイズが入る)のは、非可逆圧縮でデータが捨てられた跡なのです。

4. 試験に出る!「ランレングス法」

ITパスポート試験では、圧縮の仕組みを問う計算問題が出ることがあります。
一番簡単な「ランレングス法」だけ覚えておきましょう。

データの中に、同じ文字が連続していたら「文字+個数」に置き換える方法です。

例題:以下のデータを圧縮せよ

元のデータ:AAAAABBBBBCCCC (14文字)

圧縮後:A5B5C4 (6文字)

「Aが5個、Bが5個、Cが4個」と記録することで、データ量が半分以下になりました!

これがFAX(ファックス)などで使われている圧縮の基本原理です。
真っ白な紙を送るとき、「白白白…」と送るより「白が1000個」と送ったほうが速いですよね。

5. 豆知識:アーカイブと圧縮の違い

最後に、よく混同される「アーカイブ」についても触れておきます。
Linuxなどを触ると「tar(ター)」という形式を見かけますが、これは厳密には圧縮ではありません。

  • アーカイブ(書庫化)
    バラバラのファイルを1つにまとめるだけ(サイズは小さくならない)。
  • 圧縮
    データの中身を整理して、サイズを小さくする。

Windowsの「ZIP」は、実は「アーカイブ(まとめる)」と「圧縮(小さくする)」を同時にやってくれている便利な形式なのです。

まとめ

  • 可逆圧縮(ZIP, PNG):布団圧縮袋。元通りに戻せる。書類向き。
  • 非可逆圧縮(JPEG, MP3):みじん切り。元に戻せない。写真・音楽向き。
  • ランレングス法:「AAAAA」を「A5」にする基本テクニック。

「このファイルを保存して」と言われたら、「これはみじん切りにしていいデータ(写真)かな? それとも布団圧縮じゃないとダメなデータ(Excel)かな?」と考えてみてください。
適切な保存形式が自然と選べるようになりますよ。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です