ベストアンサー
コンピュータビジョンの既存のアルゴリズムの多くは、基礎となる表現としてピクセルグリッドを使用しています。たとえば、マルコフ確率場などの画像の確率モデルは、この通常のグリッドで定義されることがよくあります。または、顔検出は通常、保存されているテンプレートを画像内のすべての固定サイズ(たとえば、50×50)ウィンドウに一致させることによって行われます。
ただし、ピクセルグリッドは視覚シーンの自然な表現ではありません。それはむしろデジタル画像処理の「アーティファクト」です。低レベルのグループ化プロセスから取得した知覚的に意味のあるエンティティを操作する方が自然で、おそらくより効率的です。たとえば、正規化カットアルゴリズムを適用して、画像をたとえば500セグメント(スーパーピクセルと呼びます)に分割できます。
このようなスーパーピクセルマップには、多くの望ましい特性があります。
- 計算効率が高い:画像の複雑さを数十万から減らします。ピクセルの数はわずか数百スーパーピクセルになります。
- これは表象的に効率的です:ユニット間のペアワイズ制約ですが、上の隣接ピクセルに対してのみです。ピクセルグリッドで、スーパーピクセル間のはるかに長距離の相互作用をモデル化できるようになりました。
- スーパーピクセルは知覚的に意味があります:各スーパーピクセルは知覚的に一貫しています単位、つまりスーパーピクセル内のすべてのピクセルは、たとえば色やテクスチャが均一である可能性が高いです。
- これはほぼ完全です。スーパーピクセルは、オーバーセグメンテーションの結果であり、ほとんどの構造画像の解像度は保存されています。ピクセルグリッドからスーパーピクセルマップへの移行による損失はほとんどありません。
回答
親愛なる友人、
スーパーピクセル-(コンピュータグラフィックス)ポリゴン デジタル 画像の一部。通常のピクセル。均一 色でレンダリングされます a>と明るさ。
ありがとうございます