二値化処理とは？画像を白黒に変換する基本技術をわかりやすく解説

二値化処理とは？画像を白黒の2値に変換する仕組みや種類（大津法・適応的二値化）、OCRとの関係、PythonやOpenCVでの実装方法までわかりやすく解説します。書類軽量化や画像解析に役立つ基礎知識を網羅。

二値化処理とは、画像を「白」と「黒」の2つの値だけで表現する画像処理技術です。
カラー画像やグレースケール画像を、一定の基準（しきい値）で判定し、白か黒に変換します。

主に以下の用途で使われます。

文字認識（OCR）
書類スキャンの最適化
画像解析・物体検出
印刷データの軽量化
AI学習用データの前処理

特にWebや画像最適化分野では、データ容量削減やノイズ除去の目的で使われます。

今すぐ試す方はこちら▼
画像を二値化できる無料サイト｜白黒変換をブラウザで簡単に

二値化処理の仕組み

基本的な流れはとてもシンプルです。

画像をグレースケールに変換
「しきい値（threshold）」を設定
しきい値より明るければ白、暗ければ黒に変換

このように数値で単純に分けるのが固定しきい値二値化です。

二値化処理の主な種類

① 固定しきい値二値化

最もシンプルな方法。
全体に対して1つのしきい値を設定します。

メリット：

処理が高速
実装が簡単

デメリット：

明るさにムラがある画像には弱い

② 大津の二値化（Otsu法）

Otsu Nobuyukiが提案した自動しきい値決定アルゴリズム。

ヒストグラムを分析し、最適なしきい値を自動で決定します。

メリット：

自動で最適化
書類スキャンに強い

デメリット：

複雑な背景には弱い場合あり

③ 適応的二値化（Adaptive Threshold）

画像の局所領域ごとにしきい値を変えます。

メリット：

影や照明ムラに強い
実用性が高い

デメリット：

処理がやや重い

二値化処理の活用例

1. OCR（文字認識）

OCRエンジンで有名な
Tesseract では、前処理として二値化が使われています。

文字と背景を明確に分離することで、認識精度が向上します。

2. OpenCVによる実装

画像処理ライブラリ
OpenCV では、以下のように簡単に実装できます。

import cv2

img = cv2.imread('image.jpg', 0)
_, thresh = cv2.threshold(img, 128, 255, cv2.THRESH_BINARY)

3. 書類・PDF軽量化

白黒化することでファイルサイズが大幅に削減されます。
スキャン書類の保存や、Web掲載時の高速表示に有効です。

二値化処理のメリット・デメリット

メリット

ファイルサイズ削減
ノイズ除去
処理が高速
OCR精度向上

デメリット

情報量が減る
写真用途には不向き
しきい値設定が難しい場合あり

二値化とグレースケールの違い

項目	グレースケール	二値化
色数	256階調	2値のみ
データ量	中程度	非常に軽い
用途	写真処理	文字・図面処理

まとめ

二値化処理は、画像処理の中でも非常に基礎的かつ重要な技術です。

✔ OCR精度向上
✔ 書類軽量化
✔ ノイズ除去
✔ AI前処理

このように二値化処理は、精度向上・軽量化・ノイズ削減・学習効率改善といった多方面にメリットをもたらします。
シンプルな技術でありながら、実務やWeb運営、AI開発の現場で幅広く活用されている重要な基盤技術と言えるでしょう。

試しに使ってみる▼

画像を黒と白の2色に変換する二値化ツール。しきい値を調整して文字・図形をくっきり抽出できます。

画像2値化ツール

画像を黒と白の2色に変換する二値化ツール。しきい値を調整して文字・図形をくっきり抽出できます。

二値化処理とは？画像を白黒に変換する基本技術をわかりやすく解説

二値化処理の仕組み

二値化処理の主な種類

① 固定しきい値二値化

② 大津の二値化（Otsu法）

③ 適応的二値化（Adaptive Threshold）

二値化処理の活用例

1. OCR（文字認識）

2. OpenCVによる実装

3. 書類・PDF軽量化

二値化処理のメリット・デメリット

メリット

デメリット

二値化とグレースケールの違い

まとめ

関連ツール

画像2値化ツール

おすすめ記事

大津の二値化とは？仕組み・計算原理・活用例をわかりやすく解説

二値化画像とは？仕組み・活用例・おすすめツールまで解説

二値化処理とは？画像を白黒に変換する基本技術をわかりやすく解説