Il y a quelques années, alors que je débutais en Python, ce projet de détection des mains et du visage m’a donné du fil à retordre !
En 2021, sans ChatGPT ni grande expérience en python, chaque bug était une énigme à résoudre. Mais c’est précisément ce qui m’a motivé : comprendre, expérimenter et finalement créer un système fonctionnel. Je suis tombé sur des vidéos youtube qui en parlaient. J’ai commencé à explorer.
Aujourd’hui, grâce à OpenCV, MediaPipe et cvzone, ce projet permet de détecter et suivre les articulations des mains en temps réel.
Tout a commencé avec mon envie d’explorer la vision par ordinateur. Détecter les mains ouvre des portes incroyables, comme le contrôle gestuel, la communication sans contact, et même des interactions pour les jeux vidéo.
Voici une vidéo du résultat sur ma chaine YouTube…
Avec quelques lignes de code, une webcam et des bibliothèques bien pensées, j’ai réussi à capturer, analyser et visualiser les mouvements des mains en direct !
C’est un projet idéal pour les débutants en IA avec du code simple et bien documenté, surtout avec des applications concrètes ( réalité augmentée, contrôle gestuel, analyse biométrique…).
Je vais vous montrer comment le tester chez vous.
Ce que tu vas construire
- Un programme qui détecte les visages en temps réel depuis ta webcam
- Un programme qui détecte les mains avec les 21 points clés (via MediaPipe)
- Un programme de détection de mouvement avec alertes visuelles
Tout ça avec moins de 50 lignes de code par programme. Aucune formation en machine learning requise; les modèles de détection sont déjà pré-entraînés et inclus dans les bibliothèques.
C’est quoi OpenCV ?
OpenCV (Open Computer Vision Library) est la bibliothèque de vision par ordinateur la plus utilisée au monde. Créée par Intel, open source, disponible en Python, C++, Java.
Elle permet de capturer un flux vidéo, traiter des images frame par frame, et appliquer des algorithmes de détection sur chaque image en temps réel.
La magie, c’est qu’elle inclut des classifieurs pré-entraînés ; des modèles qui ont déjà appris à reconnaître des visages, des yeux, des corps humains. Tu n’as pas à entraîner quoi que ce soit.
Prérequis
- Python 3.8+ installé : python.org
- Une webcam fonctionnelle (intégrée ou USB)
- VS Code ou PyCharm (gratuits tous les deux)
- Connaissances Python de base : variables, boucles, fonctions, c’est tout !
Installation en 3 étapes
1 – Clonez mon dépôt GitHub
J’ai récemment ajouté ce projet sur mon github, donc vous pouvez le récupérer via ce lien :
git clone https://github.com/mouslimdiallo/PoseDetection.git
Ensuite…
2 – Créez un environnement virtuel (recommandé)
python -m venv venv
source venv/bin/activate # Linux/Mac
venv\Scripts\activate # Windows
3 – Installez les dépendances
pip install opencv-python cvzone mediapipe
(Un requirements.txt est aussi disponible si besoin.)
Explication du code : Comment ça marche ?
Les lignes de code sont suivies de commentaire pour une meilleure élucidation.
import cv2
from cvzone.HandTrackingModule import HandDetector
# Initialisation
detector = HandDetector(detectionCon=0.8, maxHands=2)
cap = cv2.VideoCapture(0) # Accès à la webcam
while True:
success, img = cap.read()
hands, img = detector.findHands(img)
# Détection des mains
if hands:
for hand in hands:
lmList = hand['lmList'] # Points clés (21 par main)
bbox = hand['bbox'] # Zone de détection
handType = hand['type'] # Gauche ou droite
print(f"Main {handType} détectée !")
cv2.imshow("Hand Detection", img)
if cv2.waitKey(10) & 0xFF == ord('q'): # Quitter avec 'Q'
break
cap.release()
cv2.destroyAllWindows()
Fonctionnalités clés
Nous avons :
- La détection rapide via webcam (même sur un ordinateur moyen).
- L’affichage des landmarks (points articulaires).
- La prise en charge des deux mains.
(Essayez-le, c’est bluffant !)
Structure du projet
PoseDetection/ │── test.py # Script principal │── Pose2-Couverture.jpg # Visuel de démo │── requirements.txt # Dépendances Python │── README.md # Guide complet
Démonstration en image
Contribuez au projet !
Ce projet est open-source – vos idées sont les bienvenues !
– Forkez le dépôt
– Proposez des optimisations
– Créez de nouvelles fonctionnalités
*Lien GitHub : github.com/mouslimdiallo/PoseDetection
Projets pour aller plus loin
Ces 4 programmes sont des bases. Ce que tu peux construire dessus :
- Système de présence automatique : détecter les visages en entrée de salle et les enregistrer dans une base SQL
- Alarme intelligente : détecter un mouvement hors des heures ouvrées et envoyer une notification via n8n
- Contrôle par gestes : mapper les positions des doigts (via MediaPipe) à des actions dans une application
- Compteur de personnes : compter les visages détectés à l’entrée d’un espace
En Afrique, une technologie à portée de main
La vision par ordinateur a des applications très concrètes sur les marchés africains : contrôle d’accès dans les entreprises, surveillance de sites industriels, systèmes de présence dans les écoles, assistance médicale dans les zones à faible densité de professionnels de santé.
Et grâce à OpenCV et MediaPipe, gratuits, open source, fonctionnant sur un simple laptop, ces solutions sont accessibles à n’importe quel développeur sans budget d’infrastructure. C’est une opportunité réelle pour des entrepreneurs tech africains.
Bref
30 lignes de Python. Une webcam. Et ton ordinateur « voit ».
C’est ça la vision par ordinateur moderne, accessible, puissante, et ouverte à quiconque veut apprendre. La vraie difficulté n’est pas technique. C’est de savoir quoi faire avec cette capacité une fois qu’on l’a.
Si l’IA appliquée t’intéresse, je t’invite à lire mon guide sur l’IA pour transformer un business en 2026 ; les compétences Python que tu développes ici sont directement transférables.
Quel projet tu envisages de construire avec ta webcam et Python ? Détection de présence, alarme, gestes ? Dis-le en commentaire, je t’aide à démarrer.
Mamadou Mouslim Diallo, Ingénieur en informatique | gandalsmart.com


