Gérer les risques
Aujourd'hui et demain

Sûreté et sécurité

La vidéoprotection se cherche un écosystème mieux organisé

Face aux attentats qui viennent de se dérouler à Bruxelles, les systèmes de vidéoprotection démontrent qu'ils sont encore loin d'être opérationnels pour prévenir le risque en temps réel. En revanche, ils accélèrent considérablement l'élucidation des enquêtes. Panorama des forces et faiblesses du secteur.

Le sang des victimes des attentats de Bruxelles est encore frais que fusent les questions de nos concitoyens et de nos responsables politiques. Selon l’Association nationale de la vidéoprotection, AN2V, près de 1,5 million de caméras de surveillance sont installées en France. Avec ce taux élevé d’équipements, la vidéoprotection sera-t-elle capable de mettre en œuvre des algorithmes de reconnaissance des visages, d’interprétation des expressions qui trahissent l’intention de commettre un attentat, un vol ou une agression avant que l’acte ne se produise ? Une jour, peut-être. Mais, aujourd’hui, on en est loin. La faute n’est pas forcément du côté des fournisseurs d’équipements et de logiciels. Pour y parvenir, peut-être faudrait-il lever certains freins culturels et organisationnels.
En effet, même si les logiciels embarqués ou les logiciels d’analyse implémentés dans les serveurs vidéo font des progrès remarquables, « nous ne serons jamais dans une société sécurisée à 100% », estime Elisabeth Sellos-Cartel, adjointe au délégué aux coopérations de sécurité chargée de la vidéoprotection au ministère de l’Intérieur. Pour l’heure, les utilisations les plus avancées se cantonnent à l’élucidation des affaires. Certainement pas à la prévention du passage à l’acte. Pourtant, saluons au passage la Police fédérale belge qui, quelques heures à peine après les explosions suicide de l’aéroport de Bruxelles-Zaventem, a été capable de diffuser, grâce à la vidéosurveillance, une image sur laquelle figurent trois des auteurs présumés des attentats commis le matin même à l’aéroport de Bruxelles-Zaventem. Dont un des deux kamikazes, Ibrahim El Bakraoui (son frère, Khalid, s’étant fait sauter dans le métro de Bruxelles) a été identifié.

Amalgame inopportun. « La vidéoprotection est un outil incontournable de la sécurité. Plus aucun magistrat ne se pose la question de savoir si les images enregistrées sont utiles ou non pour élucider des affaires », reprend Elisabeth Sellos-Cartel qui sait de quoi elle parle. En effet, les demandes de subventions, allant jusqu’à 40%, adressées par les collectivités territoriales passent par ses mains. « Les choix sont très sélectifs. D’ailleurs 560 projets n’ont pu être financés en 2015. Cette année, l’enveloppe devrait être de 18 millions d’euros », poursuit l’experte du ministère de l’Intérieur.
« Attentats ou actes malveillants… On voit souvent cette erreur : vouloir utiliser les mêmes outils pour l’avant (dissuader), le pendant (protéger entre le passage à l’acte malveillant et la sortie de l’acte) et l’après (élucider), constate Franck Pavero, officier télécoms, défense et guerre électronique, conseiller de défense et de sécurité pour la lutte contre la cybercriminalité et le cyberterrorisme. Or, même dans les Organismes d’intérêt vital (OIV), on amalgame trop souvent ces différents systèmes pour essayer de les contraindre à effectuer une seule mission commune. C’est un vrai problème. » Autre frein : pour atteindre l’efficacité maximale, il faudrait investir dans les trois systèmes mais cela obligerait à exploser les budgets ! Pour s’en faire une idée, l’AN2V estime qu’une caméra HD de 2 Mpix coûte, en moyenne, 3.000 euros, une caméra de 8 Mpix, 5.000 euros et une caméra de 29 Mpix, 8.000 euros. « Soit l’OIV a les moyens d’investir dans les trois systèmes de vidéosurveillance, soit il ne les a pas. Auquel cas, il lui faut faire un choix. En général, ce choix n’est jamais fait », déplore Franck Pavero.

Caméras PTZ contre fixes HD. « Une caméra ne peut convenir à la fois pour l’avant, le pendant et l’après. Dans l’élucidation, il arrive trop fréquemment qu’on ne dispose pas de la bonne image, au bon endroit ni au bon moment car la caméra PTZ ne regardait pas là où il fallait. Ou alors les conditions d’éclairage et de distance n’étaient pas satisfaisantes. Il conviendrait de passer des caméras PTZ à des caméras fixes haute définition [au moins 1 ou 2 Mpix] qui permettent ensuite de mieux traiter les images avec des procédés analytiques sur des serveurs, enchaîne Franck Pavero qui plaide pour une vidéo-dissuasion se basant sur la détection, les algorithmes de reconnaissance d’image et des systèmes de communication pour tenter de convaincre le délinquant de ne pas passer à l’acte. En fonction des sites, les menaces diffèrent mais les problématiques restent les mêmes. Qui plus est, les systèmes de vidéoprotection ne sont généralement pas organisés pour réagir à une situation dangereuse. Ne serait-ce que pour porter secours à des victimes. »

Frein culturels et organisationnels. On en est loin. Et Elisabeth Sellos-Cartel de citer deux exemples dans des parkings. Dans le premier, une personne est tombée après avoir glissé sur une flaque d’eau. Elle a eu beaucoup de mal à se relever. Dans le second exemple, des malfaiteurs ont braqué des voitures. Dans ces deux cas, les agents de sécurité, qui disposaient de murs d’écrans vidéo, n’ont rien fait pour intervenir. « Clairement, ils ne sont pas formés pour porter secours aux victimes, souligne Elisabeth Sellos-Cartel. Pis, l’organisation de sécurité n’est pas prévue pour cela. Je crois en la vidéoprotection mais il faut réfléchir à l’organisation humaine qui doit l’accompagner. »
« Il y a un réel manque dans la mission de l’agent de sécurité », estime Jean-François Sulzer, responsable des projets amont chez Thales Communications & Security SA qui soulève d’autres freins culturels : « Les OIV sont plus sensibilisés à la lutte contre l’incendie et au risque industriel qu’à la menace terroriste. Or il y a des solutions assez simples à mettre en œuvre pour limiter ce risque : des badges munis de puces électroniques de géolocalisation pour bloquer un suspect à la sortie de l’établissement, des surveillance de zones, combiner surveillance individuelle et lecture des plaques d’immatriculation des véhicules, tracking vidéo des individus… » A cet égard, le Conseil des industries de sécurité et de confiance (CICS) travaillerait à des solutions abordables pour les entreprises.

La caméra dôme WV-SFV781L
divise les prix de revient par deux,
selon le constructeur. © Panasonic
La caméra dôme WV-SFV781L
divise les prix de revient par deux,
selon le constructeur. © Panasonic

Tracking de bout en bout : l’avance russe. A côté de cela, que peuvent offrir, concrètement, les systèmes d’analyse en vidéoprotection ? « Ce qui fonctionne avec le plus grand succès, c’est la détection d’intrusion dans les zones où il ne devrait y avoir personne. Ensuite, je citerai la reconnaissance faciale, expose Jean-François Sulzer. Quant à la détection par apprentissage [Notamment grâce aux technologies des réseaux de neurones, NDLR], son efficacité n’est toujours pas opérationnelle. Il en va de même pour les systèmes de tracking. En effet, ceux-ci ne parviennent pas à fonctionner de bout en bout. » Ce que réfute quelque peu Franck Pavero : « Le tracking de bout en bout fonctionne… en Russie ! Les opérateurs de vidéoprotection sont capables de passer d’une plate-forme à l’autre sur 8 systèmes différents. On peut ainsi suivre une personne de l’aéroport jusqu’à son hôtel dans un petite ville. » Et d’ajouter : « Les Russes ont été capables de développer un système de tracking à la fois interopérable et multi plate-forme qui intègre une solution de messagerie. En France, on a dépassé le stade du simple prototype mais on est encore loin de la solution industrielle car on manque de normes. »

Des installations négligées. Côté détection d’intrusion, de réels progrès ont été enregistrés en 10 ans : la performance technique, la fiabilité des systèmes, la réduction drastique du taux de fausses d’alarmes… « Mais c’est surtout au niveau de la mise en œuvre que les progrès sont notables, en termes de facilité d’utilisation et d’accessibilité pour utilisateurs. De plus, les systèmes font preuve d’une grande souplesse. Il est aujourd’hui possible de les implémenter aussi bien dans des serveurs et des boxes que dans des caméras ou des clouds », précise Jean-Baptiste Ducatez, président de Foxstream, un éditeur français de logiciels d’analyse vidéo.
« L’analyse vidéo n’est pas une baguette magique. Et les logiciels sont développés en utilisant des caméras qui se trouvent dans des conditions d’utilisation parfaites que la réalité des installations vient contredire. Les algorithmes sont conçus par des têtes et utilisés par d’autres », soulève Fréderic Cupillard, responsable avant-vente de Digital Barriers en France qui aide les organisations à maîtriser l’installation et la configuration des équipements de vidéosurveillance et à éliminer les problèmes techniques qui y sont liés. « Les outils de la vidéoprotection intelligente existent. Mais leur installation ne suit pas forcément. On rencontre trop souvent des problèmes de latence, de flux d’images… », pointe Xavier Féry, directeur du développement chez Komanche (Groupe Contrôle Sécurité Défense) qui vient de passer un accord de partenariat dans lequel Spie devient son installateur.

Une norme pour les méta-données. Lorsque les organisations auront mis l’accent sur la qualité de leurs installations de vidéoprotection, il restera à massifier le traitement analytique des flux d’images. Dans un premier temps, l’enjeu n’est pas de faire tourner d’énormes calculateurs qui vont rechercher un homme corpulent portant un short rouge ou un scooter noir Vmax dans un océan d’images réparti dans des centaines de PC de surveillance ou dans les milliers d’enregistreurs disséminées dans les entreprises, administrations et boutiques. Ni même de rapatrier des Péta-octets de vidéos dans un cloud centralisé au risque d’encombrer les réseaux Internet. Plus simplement, il faut commencer par mettre en œuvre la norme ISO 22311:2012 qui, à des fins de sécurité sociétale, spécifie un format commun pour les données qui peuvent être extraites des systèmes de collecte de vidéosurveillance. Qu’il s’agisse de matériels isolés ou de systèmes de grande envergure, au travers de supports d’information amovibles ou par l’intermédiaire d’un réseau, de sorte que les utilisateurs finaux puissent accéder aux données numériques de vidéosurveillance en vue d’effectuer les traitements requis.
Bien sûr, la force de cette norme sera de rendre interopérables les systèmes d’analyse et d’extraction des métadonnées. A cet égard, les industriels de l’Open Network Video Interface Forum (ONVIF) se sont engagés à intégrer ISO 22311 à leurs équipements. Parmi les membres de l’ONVIF, citons, entre autres, Assa Abloy, Axis Communications, Bosch, Canon, Flir, HIK Vision, Honeywell, Panasonic, Samsung Techwin, Siemens, Sony… « Autre intérêt : il ne sera pas nécessaire de centraliser des énormes masses de données vidéo. Il suffira d’interroger les stockeurs d’images afin d’extraire les seules séquences utiles qui peuvent ne durer que quelques secondes, explique Dominique Legrand, président de l’AN2V. A condition que l’enregistreur soit, au minimum, connecté. En ce cas, on fait remonter, seules les méta-données (l’homme corpulent en short rouge) avant de télécharger le flux d’images pertinent. »

Vers un cloud de la vidéoprotection ? Il reste du pain sur la planche. Tout d’abord, ce sont les prochaines génération d’équipements de vidéoprotection qui vont intégrer la normalisation de la description des méta-données destinée à encoder les images. Les millions de caméras, d’enregistreurs et de serveurs actuels en sont dépourvus. « A cet égard, il faudrait créer un service cloud qui encoderait les images en mutualisant les besoins, une sorte de moteur de recherche, un Google de la vidéoprotection, plaide Dominique Legrand. Pour cela il faudrait mettre en place une sorte de  »cloud souverain ». » Sur le principe, le président de l’AN2V a raison. En revanche, les acteurs sont-ils prêts ? Pas sûr. Par ailleurs, on se souvient aussi des centaines millions d’euros partis en fumée sur la question, justement, du cloud souverain en France.
Autre problématique, et non des moindres, la sémantique descriptive de la norme est à peine balbutiante : date, horaire, géolocalisation… Mais comment modéliser la description d’un béret basque, un scooter, un sac à main de luxe, un sac de course ? Nul ne le sait aujourd’hui. C’est dire l’ampleur de ce chantier préalable à l’intelligence artificielle qui permettra d’accélérer l’élucidation des enquêtes et peut-être, de développer la prévention du crime, du terrorisme et de la délinquance. « En revanche, la reconnaissance faciale se prête déjà très bien à la mutualisation des traitements car elle se base sur des métriques physiques objectifs : l’écartement entre les sourcils, la taille du front, des lèvres, des yeux, etc, poursuit Dominique Legrand. On ne va pas mettre le nom d’une personne sur ces critères de description mais on pourrait rechercher  »2 F, 5B, 336X » comme on recherche une plaque minéralogique. » Comme à son habitude, l’AN2V pose les bonnes questions.

Erick Haehnsen

Le modèle FI9900P
embarque une trentaine
de LED. © Foscam
Le modèle FI9900P
embarque une trentaine
de LED. © Foscam

Commentez

Participez à la discussion