최상의 답변
컴퓨터 비전의 기존 알고리즘은 픽셀 그리드를 기본 표현으로 사용합니다. 예를 들어, Markov 랜덤 필드와 같은 이미지의 확률 적 모델은 종종이 정규 그리드에 정의됩니다. 또는 얼굴 감지는 일반적으로 저장된 템플릿을 이미지의 모든 고정 크기 (예 : 50×50) 창과 일치시켜 수행됩니다.
그러나 픽셀 그리드는 아니라 시각적 장면을 자연스럽게 표현합니다. 이것은 오히려 디지털 이미징 프로세스의 “아티팩트”입니다. 낮은 수준의 그룹화 프로세스에서 얻은 지각 적으로 의미있는 엔터티로 작업하는 것이 더 자연스럽고 아마도 더 효율적일 것입니다. 예를 들어 Normalized Cuts 알고리즘을 적용하여 이미지를 500 개의 세그먼트 ( 슈퍼 픽셀 이라고 함)로 분할 할 수 있습니다.
이러한 슈퍼 픽셀지도에는 원하는 속성이 많이 있습니다.
- 계산 효율성 : 수십만 개에서 이미지의 복잡성을 줄입니다. 픽셀 수를 수백 개에 불과합니다.
- 또한 대표적으로 효율적입니다 : 단위 간의 쌍별 제약 조건이지만 픽셀 그리드는 이제 슈퍼 픽셀 간의 훨씬 더 긴 범위의 상호 작용을 모델링 할 수 있습니다.
- 슈퍼 픽셀은 지각 적으로 의미가 있습니다 : 각 슈퍼 픽셀은 지각 적으로 일관성이 있습니다. 즉, 슈퍼 픽셀의 모든 픽셀은 색상과 질감이 균일 할 가능성이 가장 높습니다.
- 거의 완성 : 수퍼 픽셀은 과다 분할의 결과이며 대부분의 구조 이미지의 해상도가 보존됩니다. 픽셀 그리드에서 슈퍼 픽셀지도로 이동할 때 손실이 거의 없습니다.
자세한 내용은 슈퍼 픽셀, 경험적 연구 및 응용 프로그램을 참조하십시오.
답변
친애하는 친구,