Solutions numériques et architecture informatique
Étape
Le choix d’un matériel et d’un logiciel appropriés est essentiel pour garantir le bon fonctionnement du système. Cette section décrit les outils informatiques qui ont été développés ainsi que les facteurs qui ont motivé les décisions relatives aux systèmes d’information COMSA/SIS-COVE au Mozambique. Nous décrivons comment les identifiants uniques ont été générés et les autres décisions clés qui ont été prises. Compte tenu de l’évolution rapide des solutions numériques et des innovations dans ce domaine, il est toujours nécessaire d’examiner attentivement l’état de l’art avant de choisir une architecture numérique et informatique appropriée. Les futurs lecteurs constateront peut-être que les outils sélectionnés pour COMSA/SIS-COVE en 2018 ne constituent plus la meilleure option.
Directives générales
Avec l’amélioration rapide des technologies numériques pour la collecte, l’analyse et la diffusion des données, un SMSS doit intégrer des technologies de pointe afin de garantir une collecte et un transfert rapides des données, un accès et un suivi en temps réel, ainsi que l’analyse et la publication. Cela nécessitera la participation dès le départ de techniciens et d’ingénieurs informatiques. Le choix du matériel et des logiciels doit être guidé par le contexte, les capacités disponibles et les objectifs généraux du SMSS.
Afin de fournir des exemples concrets de ce à quoi ressemble un tel système, nous décrivons le système COMSA/SIS-COVE et les choix de divers équipements. En général, le système technologique COMSA/SIS-COVE s’articule autour de deux composantes principales :
Un ensemble de matériel et de logiciels pour la collecte, le transfert et le stockage des données, relié à un tableau de bord web pour la surveillance des données
Un portail web d’analyse des données relié au tableau de bord et un site web public.
Les facteurs critiques dans la prise de décision relative au matériel et aux logiciels sont les suivants : > > - Répondre aux exigences de base dans ces domaines : systèmes hors ligne, capture de données longitudinales et affichage multilingue, facilité d’utilisation par le personnel communautaire, exigences générales en matière d’accessibilité, d’adaptabilité, d’évolutivité et de sécurité. > > - Coût > > - Fiabilité et maturité > > - Adéquation avec les compétences et l’expérience des membres de l’équipe >
Tableau 5 : Matériel informatique pour le projet COMSA/SIS-COVE au début de la collecte des données. (2017-2019)
| Niveau du projet | Type | Quantité | Remplacement | Spécifications d’origine (année d’achat initiale) | Utilisation |
|---|---|---|---|---|---|
| Central | Serveur : Ordinateur virtuel Windows 1 | (aucun) plan de mise à jour de la plateforme tous les 3 à 5 ans | SSD de 500 Go, 12 Go de RAM, 8 cœurs virtuels CPU (2018) | Plateforme de collecte de données et tableau de bord opérationnel | |
| Central | Serveur : Ordinateur virtuel Linux | 1 | (aucun) plan de mise à jour de la plateforme tous les 3 à 5 ans | SSD de 320 Go, 16 Go de RAM (2018) | Portail d’analyse |
| Central | Ordinateurs portables | 7 | 33 % par an | Ordinateur portable HP Elitebook 820G4 (2018) | Postes de travail pour les membres de l’équipe |
| Central | Imprimantes | 2 | 20 % par an | HP LaserJet Pro M402dn (2018) | |
| Provincial | Ordinateurs de bureau | 13 | 33 % par an | HP ProDesk 400 G4 (2018) | Postes de travail pour les membres de l’équipe |
| Provincial | Écrans | 13 | 33 % par an | HP V214a 20,7 pouces (2018) | Postes de travail pour les membres de l’équipe |
| Provincial | Imprimantes | 11 | 20 % par an | HP LaserJet Pro M402dn (2018) | |
| Provincial | Tablettes | 90 | 33 % par an | HUAWEI MediaPad T3 7 pouces (2018) | Ordinateurs portables pour le superviseur provincial et l’enquêteur VASA |
| Groupe | Téléphones | 800 | 50 % par an | Tecno W1 (2017) Téléphones à écran tactile 4 pouces | Collecte de données Communication avec l’équipe provinciale |
| Groupe | Chargeur solaire 200 | 33 % par an Chargeur solaire (2019) | Batterie externe portable 10 000 mAh | Alimentation électrique pour les téléphones en milieu rural |
Tableau 6 : Logiciels pour le projet COMSA/SIS-COVE
| Projet Niveau | Nom | Utilisation | Type | Licence |
|---|---|---|---|---|
| Central | Windows Server 2012 | Plateforme de collecte de données et tableau de bord opérationnel | Système d’exploitation | Propriétaire |
| Central | Base de données MySQL | Plateforme de collecte de données et tableau de bord opérationnel | Système de gestion de bases de données relationnelles | Open Source |
| Central | Microsoft Internet Information Server (IIS) (intégré à Windows Server 2012) | Tableau de bord opérationnel | Serveur Web | Propriétaire |
| Central | Apache Tomcat | Plateforme de collecte de données | Serveur Web | Open Source |
| Central | ODK Aggregate | Plateforme de collecte de données | Plateforme de collecte de données | Open Source |
| Central | Outils de développement : Visual Studio. Bibliothèques de référence (C#.net, Entity Framework, ClosedXML, API Google Maps) | Tableau de bord opérationnel | ||
| Développement de bases de données et de sites web | Environnement de développement | Open Source et propriétaire | ||
| Central | Serveur Ubuntu Linux (Ubuntu 16.04 LTS) | Portail d’analyse | Système d’exploitation | Open Source |
| Central | MongoDB | Portail d’analyse | Stockage de données (non relationnel) | Open Source |
| Central | Apache Tomcat | Portail d’analyse | Serveur web Open Source | |
| Central | Docker, Typescript pour Node.js, Go, Typescript pour React | Portail d’analyse | Accès aux données et codage du site web | Open Source |
| Central | R Studio et Stata | Portail d’analyse | Programmation analytique | Propriétaire |
| Provincial | Windows 10/11 Windows Office | Postes de travail | Système d’exploitation et outils de productivité | Propriétaire |
| Provincial & Cluster | ODK Collect | Tablettes de l’équipe de terrain | Plateforme de collecte de données | Open Source |
| Provincial & Cluster | Geopaparrazi/Qfield | Tablettes de l’équipe de terrain | Cartographie | Open Source |
| Provincial & Cluster | TeamViewer | Tablettes de l’équipe de terrain | Communication à distance | Open Source |
Solutions numériques au niveau central
L’équipe centrale chargée des données est chargée de planifier, de mettre en œuvre et de superviser tous les besoins du système en matière de gestion des données en fonction des facteurs décisionnels énumérés ci-dessus. Par exemple, un serveur cloud peut offrir une plus grande fiabilité et un meilleur accès à distance qu’une machine hébergée localement.
Pour le projet SIS-COVE au Mozambique, la collecte et la gestion des données ont utilisé un serveur Windows hébergé sur une plateforme cloud. Ce serveur Windows unique hébergeait un serveur web Tomcat pour le site « ODK Aggregate » , un serveur de services Internet (IIS) pour le site web « ASP.NET » personnalisé servant de tableau de bord opérationnel et un serveur MySQL pour les besoins en matière de base de données.
Tableau de bord opérationnel
Un tableau de bord opérationnel basé sur le web a été créé pour afficher l’activité en temps réel et permettre au personnel central et provincial de gérer les activités de collecte de données. Le personnel provincial était limité à la gestion des données dans la province qui lui était assignée, tandis que le personnel central travaillait avec les données de l’ensemble du pays. Les membres de l’équipe peuvent voir les totaux cumulés de toutes les données collectées sur des périodes sélectionnées. Ils peuvent approfondir leur analyse pour voir les détails des formulaires individuels et générer des rapports à imprimer ou à partager en dehors du système.
Le site dispose d’une fonctionnalité spéciale permettant de suivre les décès des participants et d’affecter des enquêteurs chargés d’effectuer des autopsies verbales afin de recueillir des informations détaillées sur la cause du décès. Au cours du projet, une fonctionnalité de cartographie interactive a été développée et est devenue un outil plus important.
Portail d’analyse
Un serveur collaboratif de suivi et d’analyse (portail d’analyse ou simplement portail) a été créé pour héberger des ensembles de données et des codes analytiques, et pour permettre la collaboration en matière d’analyse des données au sein de l’équipe du projet. Le portail utilise un serveur cloud Linux et une plateforme web personnalisée comprenant les logiciels React, Docker, Linux, Stata et R. Le site du portail contient une copie des données de référence. Les modifications apportées aux données sur le portail n’ont aucune incidence sur les données agrégées ODK ou le tableau de bord opérationnel.
Le portail d’analyse dispose d’un pool de données comprenant deux types de données. Tout d’abord, il y a les données de collecte provenant de la plateforme « ODK Aggregate. ». Ces données sont automatiquement copiées chaque nuit du serveur de collecte de données vers le portail sous forme de fichiers texte. Ensuite, le portail dispose de données supplémentaires ou de référence qui peuvent être téléchargées manuellement.
Le portail d’analyse dispose d’une page dédiée à l’analyse où des scripts peuvent être exécutés de manière séquentielle et automatique sur les données. En général, les scripts de nettoyage, de fusion et de contrôle qualité sont programmés pour s’exécuter après la synchronisation quotidienne des données. Cela permet aux équipes qui surveillent les données de bénéficier de mises à jour quotidiennes et facilite la collaboration analytique en temps réel entre plusieurs continents.
Calendrier de développement
Lorsque l’on utilise du matériel basé sur le cloud, les serveurs peuvent être lancés et provisionnés en très peu de temps. La configuration et l’installation des logiciels peuvent généralement être effectuées en moins d’une journée. Les principales tâches de développement logiciel nécessitent plus de temps. Les trois principaux domaines de développement du projet COMSA/SIS-COVE étaient les suivants:
-
Création des formulaires électroniques
-
Développement du tableau de bord opérationnel
-
Développement du portail analytique.
Dans le cadre du projet COMSA/SIS-COVE, trois membres différents de l’équipe ont dirigé ces efforts.
Les versions initiales ont été créées à des fins de test et d’expérimentation. Les versions expérimentales et de test ont été améliorées pour le lancement de la phase I du projet dans cinq provinces, puis à nouveau améliorées pour le lancement de la phase II dans les six provinces restantes. Au cours des cinq dernières années, des mises à jour régulières et des fonctionnalités ont été ajoutées dans chaque domaine.
Tableau 8 : Étapes du développement de la technologie numérique de COMSA/SIS-COVE
| Phase du projet | Formulaires électroniques | Tableau de bord opérationnel | Portail analytique |
|---|---|---|---|
| Début : 6 mois avant la collecte des données | Première ébauche des formulaires principaux sur la base des formulaires papier. Structure des identifiants, noms des variables, validation, règles de saut. | Configuration du serveur et installation des logiciels. Modèle d’information et conception de la base de données. | Adaptation des logiciels personnalisés existants. Conception initiale des rapports et du flux de travail analytique. |
| Phase pilote : 2 mois avant la collecte des données | Tests de base sur le terrain : traductions, correction des bogues. | Intégration avec la base de données de collecte. Tests de gestion des données et en temps réel. Formation du personnel provincial. Demandes de fonctionnalités et corrections de bogues par le personnel. | Transfert manuel des données. Configuration détaillée des rapports. Extension et amélioration des scripts analytiques. |
| Début de la collecte de données – Phase I. | Version 1 des formulaires principaux. Ajout de formulaires supplémentaires pour la gestion du matériel et du personnel. | Nouvelles fonctionnalités : gestion longitudinale des décès. Rapports téléchargeables aux formats PDF et XLSX. | Synchronisation quotidienne automatisée des données. Élaboration d’un processus détaillé pour le nettoyage et la fusion des données. |
| Début de la collecte de données (Phase II) +6 mois | Version 2 des formulaires de base. Corrections de bogues, améliorations des fonctionnalités. | Corrections de bogues, améliorations des fonctionnalités. | Corrections de bogues, améliorations des fonctionnalités. |
| Mises à jour du système tous les six à huit mois | Nouvelles versions des formulaires. Corrections de bogues, améliorations des fonctionnalités. Formulaires d’évaluation semestriels. | Nouvelles fonctionnalités : suivi des évaluations, cartographie interactive, corrections de bogues. | Corrections de bogues. Améliorations des fonctionnalités. |
À l’origine, l’équipe centrale chargée des données avait pour mission de soutenir les collecteurs de données communautaires, mais dans la pratique, une grande partie de ce travail a été déléguée aux membres de l’équipe provinciale. Il n’était pas pratique pour les deux membres de l’équipe centrale chargée des données de rendre visite, de soutenir et de gérer les 700 travailleurs communautaires dans tout le pays. Les membres de l’équipe chargée des données ont joué un rôle central dans toutes les formations initiales des travailleurs communautaires dans chaque province. Après le démarrage, l’équipe chargée des données a évolué vers un rôle d’assistance aux équipes provinciales dans le soutien aux travailleurs communautaires.
Un site Web public a été créé afin de présenter le système, les visualisations de données, les outils et autres ressources, ainsi que pour partager les données collectées. Le site Web public a été mis en place sur un serveur WordPress et est géré par l’équipe chargée de l’étude.
Solutions numériques au niveau provincial
Les membres de l’équipe provinciale sont chargés de recruter, de former et de superviser les collecteurs de données, de contrôler la collecte de données au niveau communautaire, de mener les entretiens VASA et d’assurer la communication entre le niveau central et le niveau communautaire. Les équipes provinciales doivent avoir accès au serveur de collecte de données, au tableau de bord et au portail d’analyse pour contrôler et superviser la collecte de données. Le tableau de bord fournit également des outils pour planifier, gérer et collecter les entretiens VASA après chaque décès signalé dans la communauté.
Dans le cadre du projet COMSA/SIS-COVE, les superviseurs provinciaux et les enquêteurs VASA ont reçu des ordinateurs portables et des imprimantes partagés. Les ordinateurs portables étaient utilisés au bureau pour superviser la collecte des données et communiquer avec l’équipe centrale.
Chaque membre de l’équipe a reçu une tablette Android de 8 pouces avec une connexion de données mobiles. Ces tablettes ont servi de matériel informatique principal utilisé par les équipes provinciales.
Les appareils mobiles ont des exigences supplémentaires. Certaines d’entre elles sont liées à la facilité d’utilisation générale et d’autres aux exigences des applications de collecte de données, telles que :
-
la taille de l’écran de l’appareil
-
la capacité de la batterie
-
la durabilité
-
la mémoire vive (RAM)
-
le processeur (CPU)
-
la compatibilité du système mondial de communications mobiles (GSM)
-
le niveau du système d’exploitation Android - la disponibilité dans le pays
Les équipes provinciales ont utilisé le tableau de bord pour planifier et gérer les entretiens VASA pour chaque décès. Une fois les entretiens VASA attribués aux enquêteurs, le tableau de bord permettait de télécharger les calendriers au format Excel pour que les équipes puissent les utiliser et les imprimer. Sur le terrain, les tablettes étaient les principaux appareils utilisés par les enquêteurs pour les entretiens VASA. Dans les sites disposant d’une connexion Internet, elles permettaient d’accéder aux serveurs centraux pour surveiller la collecte des données CSA. En outre, les tablettes offraient d’importantes fonctions de gestion de l’étude. Elles pouvaient être utilisées comme point d’accès pour la connectivité à distance des données CSA dans les cas où le CSA ne disposait pas d’une connexion Internet. Les appareils servaient de canaux de communication pour le projet via e-mail, SMS, WhatsApp et appels téléphoniques. Ils étaient également utilisés pour faciliter la cartographie GPS des ménages et des limites des clusters.
Les principaux logiciels utilisés par les tablettes sont le logiciel client ODK (ODK Collect) et le navigateur Chrome pour se connecter au tableau de bord et au portail. En outre, les tablettes utilisaient des logiciels de type bureautique pour les documents et les feuilles de calcul, ainsi que Geopapparazi, Q-Field et Google Maps pour le travail GPS.
L’équipe provinciale est également chargée d’enregistrer les cartes SIM pour chaque utilisateur d’appareil, d’attribuer les appareils aux collecteurs de données communautaires, et de surveiller et de réapprovisionner l’accès cellulaire et Internet sur les appareils.
Besoins technologiques au niveau communautaire
Il est important de fournir aux collecteurs de données communautaires des équipements fiables, des formulaires logiques et bien conçus, ainsi que des systèmes secondaires pouvant servir de secours lorsque les infrastructures essentielles ne sont pas disponibles. Lors du choix des téléphones destinés aux collecteurs de données communautaires, il est important de trouver un équilibre entre le coût, les fonctionnalités disponibles, la fiabilité et la disponibilité. Dans le cadre du projet COMSA/SIS-COVE, les travailleurs communautaires ont été équipés de téléphones Android de 4 pouces.
Pendant le recensement des grappes, les téléphones ont été utilisés pour cartographier les ménages et les limites des grappes. Pendant la surveillance de routine, les téléphones ont été utilisés pour collecter des données sur les événements vitaux : grossesses, issues de grossesse et décès. Les CSA s’appuyaient sur l’application ODK Collect pour fournir des formulaires et soumettre des données au serveur central. Ils utilisaient également Geopapparazi et Google Maps comme outils GPS pour identifier les limites des clusters et marquer l’emplacement des ménages. Les téléphones portables permettaient également de communiquer avec l’équipe de supervision provinciale via WhatsApp, SMS et appels téléphoniques.
Lors du calcul du nombre d’appareils, il est important d’ajouter un pourcentage pour compenser les pertes et les dommages. Sur le terrain, en raison d’une utilisation intensive, les téléphones peuvent s’user rapidement, il faut donc prévoir un plan de remplacement cyclique. Bien que l’usure dépende de la qualité de l’appareil et des conditions environnementales, il faut s’attendre à remplacer les appareils tous les 2 à 3 ans . Une maintenance simple peut souvent être effectuée localement si le modèle est couramment utilisé (par exemple, pour la réparation d’écrans et le remplacement de batteries).
En cas de perte ou de vol d’une tablette (ou d’un téléphone), un rapport de police doit être exigé.
Le manque d’électricité et l’absence de connexion Internet constituent deux défis pour la collecte de données numériques dans les zones reculées. Lorsque le réseau électrique est indisponible ou instable, les appareils peuvent être rechargés à l’aide de panneaux solaires, de batteries externes ou même de batteries de voiture.
Conseil technique : Si une batterie est retirée d’un appareil pour être rechargée, la date de l’appareil sera réinitialisée. Après > la recharge, assurez-vous que l’appareil est réglé sur la date correcte.
Lorsque la connexion Internet n’est pas disponible localement, les travailleurs communautaires peuvent être invités à se rendre chaque semaine dans un lieu disposant d’une connexion, souvent à proximité d’une antenne-relais de téléphonie mobile ou dans un cybercafé. Des formulaires papier peuvent également être utilisés à la place des formulaires numériques lorsque les téléphones portables attribués ne sont pas disponibles en raison d’un dommage, d’une perte ou d’une panne d’électricité. Lorsque les appels téléphoniques et les SMS ne permettent pas de communiquer, une visite en personne doit être programmée. Cela peut nécessiter des frais de transport en bus, en moto/vélo ou en voiture. Il est recommandé de prévoir un budget à cet effet.
Déploiement des appareils numériques
Lors du déploiement, la configuration de nombreux téléphones portables et tablettes est une tâche importante. Le personnel informatique doit faire appel à des superviseurs et à des membres de l’équipe centrale pour aider à la mise en place et à la configuration initiales. Cela présente l’avantage supplémentaire de familiariser le personnel avec le fonctionnement de base et l’assistance technique des appareils et des logiciels. Cela comprend la connexion des appareils à des comptes Google, la sélection de la langue appropriée pour les appareils, ainsi que l’installation de diverses applications. Dans COMSA/SIS-COVE, les applications comprenaient ODK Collect pour la collecte de données, Geopaparazzi pour les services GPS et TeamViewer, qui permettait une assistance informatique à distance.
Conseil technique : > Les identifiants des appareils doivent être consignés dans la base de données afin de faciliter le suivi des appareils envoyés > dans les provinces, puis attribués aux enquêteurs et aux collecteurs de données. > Les logiciels de collecte de données enregistrent généralement l’identifiant de l’appareil. Cela offre un autre moyen de > suivre l’activité des téléphones et des collecteurs de données.
Identifiants uniques
Des identifiants uniques (ID) sont utilisés dans le système de collecte de données pour identifier de manière unique les collecteurs de données, les participants, les événements, les zones géographiques et les lignes des tableaux de données. Il s’agit de chaînes structurées de caractères alphanumériques. Les ID peuvent être formatés pour être lisibles par l’homme ou par la machine.
ID lisibles par l’homme
Lorsque les identifiants sont régulièrement utilisés par des personnes, ils doivent être optimisés pour une utilisation humaine (plutôt que pour un traitement informatique), ce qui signifie qu’ils :
Être courts et comporter un ensemble de caractères limité : cela permet de garantir qu’ils seront plus faciles et plus précis à lire, à mémoriser et à taper. Un ensemble de caractères limité réduira les erreurs dues à une mauvaise lecture des valeurs. Pour SIS-COVE, nous n’avons utilisé que des lettres majuscules et des chiffres. Ces caractères (I O Q U V W ) ont été supprimés afin d’éviter toute confusion avec des lettres ou des chiffres similaires. Par exemple, le « I » peut facilement être confondu avec le chiffre « 1 », etc.
Ont un format distinct : cela permet une identification visuelle rapide du type, par exemple en facilitant la distinction entre l’identifiant d’un collecteur de données et celui d’une zone de travail.
Intégrer les relations : certaines entités sont liées entre elles, comme les grappes au sein d’une province ou les membres d’une famille au sein d’un ménage. Il peut être utile d’intégrer ces relations dans l’identifiant. Par exemple, une province peut avoir un identifiant « 03 ». Pour une grappe au sein de cette province, nous pouvons choisir de créer un identifiant composé qui intègre l’identifiant de la province. La grappe « 079 » pourrait avoir un identifiant unique « AT03079 ».
En outre, en raison de leur nature critique, nous avons conçu les identifiants des collecteurs de données de manière à éviter les erreurs typographiques en y intégrant une somme de contrôle. Une somme de contrôle est une valeur numérique dérivée des données spécifiées. SISCOVE a utilisé une somme de contrôle similaire à un algorithme de Luhn. Les valeurs du code ASCII des caractères de l’identifiant, lorsqu’elles sont multipliées et divisées de manière systématique, produisent une valeur restante cohérente. Si la somme de contrôle ne correspond pas à cette valeur, cela signifie qu’il y a au moins une erreur dans les caractères de l’identifiant saisi.
L’un des défis majeurs de la surveillance communautaire consiste à attribuer et à gérer des identifiants aux ménages et aux individus qui permettent de suivre et de relier facilement les événements enregistrés aux ménages et aux individus. Le Mozambique a lancé ce système d’identifiants en attribuant des autocollants d’identification à chaque ménage lors du recensement de la population. Cependant, à long terme, de nombreux identifiants se perdent en raison des mouvements de population. SIS-COVE s’est principalement appuyé sur les noms des chefs de famille et sur certaines caractéristiques pour identifier les ménages dans chaque cluster.
Tableau 9 : Exemples d’identifiants uniques lisibles par l’homme COMSA/SIS-COVE
| Identificateurs | nom de variable | exemple | format |
|---|---|---|---|
| Province ID | prov_id | 03 | identifiant numérique à deux chiffres |
| ID de section de cluster | area_id | AT03079 | «AT»+prov_id+ numéro séquentiel à 3 chiffres |
| Collecteur de données | staff_id | 8458MF | Identifiant alphanumérique de 6 caractères (majuscules uniquement) |
| Mort | mort_id | 8458MF001 | staff_id + identifiant numérique à 3 chiffres |
| Ménage | ménage_id | 071 | identifiant numérique à trois chiffres |