An improved visual attention model uses a robust adaptive segmentation
algorithm to divide a current frame of a video sequence into a plurality
of regions based upon both color and luminance, with each region being
processed in parallel by a plurality of spatial feature algorithms
including color and skin to produce respective spatial importance maps.
The current frame and a previous frame are also processed to produce
motion vectors for each block of the current frame, the motion vectors
being compensated for camera motion, and the compensated motion vectors
being converted to produce a temporal importance map. The spatial and
temporal importance maps are combined using weighting based upon eye
movement studies.
Un modèle visuel amélioré d'une attention emploie un algorithme adaptatif robuste de segmentation pour diviser une armature courante d'un ordre visuel en pluralité de régions basées sur la couleur et la luminance, avec chaque région étant traitée en parallèle par une pluralité d'algorithmes spatiaux de dispositif comprenant la couleur et la peau pour produire les cartes spatiales respectives d'importance. L'armature courante et une armature précédente sont également traitées pour produire des vecteurs de mouvement pour chaque bloc de l'armature courante, les vecteurs de mouvement étant mouvement compensé d'appareil-photo, et les vecteurs compensés de mouvement étant convertis pour produire une carte temporelle d'importance. Les cartes spatiales et temporelles d'importance sont combinées en utilisant peser basé sur des études de mouvement d'oeil.