Gérer les risques
Aujourd'hui et demain

Risques industriels et environnementaux

Nouvelles caméras intelligentes

La course aux spécifications continue pour les caméras IP...

Après les sorties directes en Mpeg4 ou H264, le PoE, les capteurs à très large dynamique ou les capteurs (multi)mégapixels, les caméras intégrant une analyse intelligente d’image à la source arrivent sur le marché, répondant aux besoins de détection d’évènement toujours plus précoce et au plus près des images.

Les bases historiques

Comme les nouvelles technologies d’analyse d’image, le video sensor est d’abord apparu sur des électroniques externes avant d’être intégré dans les caméras. Il s’agit d’un système de détection de mouvement relativement simple au regard des technologies actuelles, qui détectent une quantité de pixels changés d’une image à la suivante.
Aujourd’hui, la plupart des caméras numériques de vidéosurveillance sont équipées du video sensor ou de systèmes de détection de mouvement un peu plus sophistiqués. D’une fiabilité fortement dépendante des réglages des paramètres de sensibilité et de calendrier horaire à ajuster chaque mois pour des conditions optimales de luminosité, la détection de mouvement devient surtout intéressante quand l’utilisateur peut sélectionner une ou plusieurs zones. Le récent succès de la vidéo numérique sur IP, des caméras IP et des serveurs IP pour caméras analogiques, a eu comme parallèle le développement des traitements numériques externes avec analyse intelligente d’image, réalisés sur des informatiques déportées.

Les avancées technologiques récentes

Les progrès techniques et la miniaturisation aidant, il n’aura fallu que peu de temps pour que certains fabricants arrivent à intégrer ce type d’intelligence à l’intérieur même des caméras ou des serveurs de réseau. Chez certains fabricants, les algorithmes embarqués dans les caméras sont souvent d’un excellent niveau, comparables à ce qui existait il n’y a pas si longtemps sur informatique externe. Et leur usage est même souvent plus performant, l’analyse d’image étant réalisée en sortie du capteur d’image, sans recours à un transport de données ni à des étapes de compression-décompression, coûteuses en temps, sinon en qualité.
De plus, l’analyse intégrée aux caméras est réalisée sur des DSP (Digital Signal Processor) intrinsèquement plus aptes à ce genre de tâche que les processeurs Risc (de type X86 Pentium) présents dans les stations de travail. Même si ils réalisent à peu près la même quantité d’opérations par seconde – de 2 à 5 GOps pour les plus puissants coeurs de type Intel avec instructions SSE ou Texas Instruments C64 –, les DSP réalisent des opérations plus complexes en un seul cycle. Et ils ne sont utilisés que pour la caméra les hébergeant, alors que la puissance des stations de travail est généralement partagée pour plusieurs voies.
Un DSP comme le Texas Instrument DaVinci, dans ses plus versions les plus évoluées, intègre, en plus du coeur C64, un processeur Risc ARM, un processeur vectoriel SIMD (Single Instruction/Multiple Data), ainsi qu’une quantité importante de mémoire cache. Les DSP sont utilisés conjointement à des Asics (Application Specific Integrated Circuit), circuits produits à grande échelle pour des tâches bien précises, et/ou à des processeurs FPGA (Field Programmable Gate Array) intégrant des unités de calcul pas très rapides unitairement, mais pouvant être associées en très grand nombre pour des opérations lourdes. On le voit, la vitesse de traitement des nombreux pixels des images résulte plus du nombre et de la complexité des opérations réalisées par cycle.

Les possibilités d’analyse intégrée

Aujourd’hui, toutes les analyses intelligentes d’image courantes sont réalisables dans les caméras, des détections et suivis complexes de mouvement et de comportement aux détections d’objets manquants ou abandonnés, en passant par la reconnaissance de plaques minéralogiques, le comptage de foule et de flux, le masquage automatique en temps réel de visage, la détection d’intrusion, la détection de graffiti ou de détritus, la détection d’obstruction de champ, etc. L’utilisation conjuguée de multiples algorithmes permet de définir des règles de détection et des scénarios de réaction.
Face à la complexité des programmations, une tendance est au partenariat entre les spécialistes logiciels de l’analyse intelligente d’image et les fabricants de caméras, afin de porter le savoir-faire et les algorithmes des premiers dans les caméras. ObjectVideo, par exemple, a signé des accords de partenariat avec de nombreux constructeurs et éditeurs pour sa suite OnBoard compatible avec des DSP de Texas Instruments, ce qui assure à ceux-ci un bon niveau de détection, mais tend aussi à limiter les différenciations possibles entre eux. En France, KaoLab a engagé un partenariat avec NexVision pour l’intelligence embarquée de la NexDome.

Les limites

L’analyse intelligente est aujourd’hui reconnue comme suffisamment performante pour la reconnaissance de plaques minéralogiques, le tracking, la détection de mouvement, d’objet abandonné ou subtilisé, et le comptage d’individus. La qualité des algorithmes est primordiale si on ne veut pas tomber dans des scénarios à 80% seulement d’efficacité, avec leurs lots de faux positifs et faux négatifs qui feront en général que les utilisateurs auront tendance à déconsidérer ou désactiver ces fonctionnalités.
Les limites tiennent par ailleurs à la seule intelligence brute des algorithmes parfois utilisés, et au manque d’utilisation d’une expérience qui reste encore à programmer. Par exemple, une caméra très intelligente pourra détecter un individu en pantalon, mais sera bien incapable de discriminer un jean d’un pantalon de costume ou d’un treillis. Et une main imitant un revolver au-dessus d’une foule pourra être détectée avec la même efficacité qu’un revolver levé à bout de bras.
Cela dit, l’état actuel de l’art permet déjà aujourd’hui une aide précieuse dans bien des circonstances. Surtout les caméras intelligentes peuvent détecter des évènements parfois imperceptibles à l’oeil humain, de par leur taille à l’écran ou leur rapidité, sur des images affichées ou non.
Une plaque minéralogique peut être aujourd’hui reconnue sans faille à plus de 200 km/h. Et des individus rampants à la vitesse de 1 mètre en un quart d’heure ont été détectés par les algorithmes de IO image.

Les avantages par rapport aux autres techniques de détection

Principalement, l’analyse d’image est effectuée au plus près du capteur d’image, sans dégradation du signal ni temps de latence, pour plus de rapidité, d’efficacité et de fiabilité, et les images ou informations peuvent n’être transmises que sur évènement, préservant ainsi la bande passante du réseau et les ressources du système.
Une caméra intelligente permet de créer une clôture invisible sans coût ni dégradation esthétique. Elle peut couvrir d’emblée une vaste zone de détection plutôt qu’un périmètre, et fournit instantanément une levée de doute. Et l’usage de connexions sans fil permet de réduire les coûts d’infrastructure. Des réponses automatiques pré-paramétrées peuvent être des solutions immédiates dissuadant l’intrus de continuer. L’analyse intelligente intégrée aux caméras permet de gérer plus de caméras par opérateur. Loin de remplacer les opérateurs, elle facilite leur travail et en augmente l’efficacité. Et c’est ce qui est le plus apprécié par le marché.

Des fonctionnalités au choix selon les besoins

Selon Laurent Scetbon, Responsable Grands Comptes de Aasset Security, « nous ne sommes qu’au début de l’ère des caméras intelligentes. L’analyse du signal nécessite sa numérisation. Les sensors ont d’abord été externes, puis ont été miniaturisés pour être placés dans la caméra, au plus près de l’image. Pour nous, il n’y a pas de mouvement de la caméra IP vers l’intelligence, mais de l’intelligence vers les caméras IP. Bientôt, les logiciels sur PC ne prendront en charge que le stockage, certains retraitements et recherches d’images, ainsi que des fonctions de supervision. Désormais ce sont les caméras qui sont la source d’information – et non seulement d’image, information qui est récupérée par les PC pour visualisation et gestion. A terme, les caméras intègreront de façon hardware sur les DSP un énorme potentiel de traitement, et les fonctionnalités logicielles nécessaires dans le contexte de leur utilisation seront téléchargées ou débloquées via l’achat d’une clé logicielle. Les caméras seront personnalisées selon les besoins. A noter qu’aujourd’hui, une caméra IP intelligente peut être une caméra qui voit bien, comme notre ioicam wdc100dn qui bénéficie d’un capteur d’origine Pixim à très large dynamique. En extérieur, dans des conditions parfois défavorables, il est nécessaire pour être efficace d’analyser un signal le plus pur possible, le plus proche possible du capteur. Les caméras ioicam analysent l’intégralité des lignes vidéo du signal, en 4CIF, en utilisant un DSP de Texas Instruments muni d’une bonne mémoire cache. Cela est nécessaire pour ne manquer aucun évènement et déceler, dès son commencement, un changement parfois presque imperceptible. »

L’importance des flux de données dans les caméras

Vincent Carrier, Directeur Technique de Nexvision, nous indique avoir « choisi un partenariat avec KaoLab pour l’intégration des algorithmes d’analyse d’image, comme en particulier une détection de mouvement vraiment exploitable sans faux positif. Travailler sur les 5 Mpixels de la NexDome réclame beaucoup de puissance, et Nexvision a fourni un outil pour travailler sur les images. Les métadonnées sont utilisées de façon intensive, KaoLab ayant une grande expérience des travaux sur les statistiques.
Les développements actuels vont bien au-delà de la simple détection de mouvement, et utilisent des échanges de paramètres entre la caméra et le serveur de stockage. Sur les PC, il fallait amener les images compressées, puis les décompresser avant de travailler dessus, d’où une double conversion. Aujourd’hui, avec les DSP intégrés dans les caméras, on peut travailler directement sur les données brutes d’acquisition, et plus tôt, d’où une bien meilleure efficacité. Nous utilisons dans chaque caméra un DSP Da Vinci de Texas Instruments, dans sa version la plus complète, qui comprend un coeur C64 à 600 MHz, un processeur ARM et un SIMD, pour une très grande puissance de calcul. Un corollaire très important doit être un transport très rapide des flux de données à l’intérieur de la caméra, et il y a pour cela d’énormes différences d’un processeur à l’autre. Texas Instruments en particulier réalise de très bonnes matrices de commutation de données dans ses DSP, et le choix du Da Vinci s’est imposé pour la NexDome. »

Des matériels prévus pour l’analyse intelligente

Patrick Tennevin, directeur Marketing de Axis Communications France, nous communique que « les caméras intelligentes vont prendre de plus en plus d’importance dans la gamme. C’est un secteur qui va se développer. Son intégration dans la caméra permet de concentrer l’analyse de l’image au point de saisie, de façon d’une part à réagir plus vite, et d’autre part à éviter l’encombrement du réseau si on choisit de n’envoyer les images que sur alarme. La capacité d’analyse est ainsi supérieure, mais il faut être vigilant sur le paramétrage. Sur le plan des applications embarquées, Axis continue de privilégier sa vocation de constructeur et de fournir des produits ouverts. Les applications embarquées sont fournies par des sociétés extérieures de service ou de développement, dans le cadre de notre programme de partenariat. Nous nous concentrons sur l’intégration des éléments physiques capables d’accueillir cette intelligence, comme la mémoire et les DSP Texas Instrument qui fonctionnent de concert avec nos processeurs de gestion vidéo Artpec. La plus grande rapidité d’analyse est permise. Notre serveur Axis 242S IV est ainsi prévu pour les traitements intelligents, et peut intégrer des modules logiciels à télécharger, comme par exemple le comptage de personnes. A noter que nos caméras sont équipées de capteurs à balayage progressif de façon à éviter les effets d’escalier et de flou que l’on obtient sur les images en mouvement lors des superpositions de trames, quand on utilise des capteurs à balayage entrelacé. »

Pour en savoir plus

Cet article est extrait du Magazine APS – numéro 158 de février 2007.
Pour plus d’information sur nos publications, contactez Juliette Bonk .

Commentez

Participez à la discussion