Dans un premier temps un contexte expliquera la problématique actuelle des technicie ne snradiologie médicale, l'apport qu'une solution basée sur l'IA peut améliorer dans leur quotidien et le bénéfice pour les patients.
Une brève explication de la norme Dicom et de son utilisation dans le cadre du travail pratique ainsi que de son importance. Puis une description des étapes de traitements réalisés avant et après l'apprentissage.
## Problématique, apport de l'intelligence artificielle et Smartibex AI
The ROC curve plots TPR against FPR at various threshold settings.
A model with a ROC curve closer to the top-left corner indicates a better performance.
The area under the ROC curve (AUC-ROC) provides a single measure of overall model performance. An AUC-ROC of 1.0 indicates a perfect model, while 0.5 indicates a model with no discriminative power.
The PR curve plots Precision against Recall at various threshold settings.
A model with a PR curve closer to the top-right corner indicates better performance.
The area under the PR curve (AUC-PR) is also used to summarize the model performance. High AUC-PR values indicate better performance, especially in imbalanced datasets where the positive class is rare.
Key Points
ROC Curve:
Useful when the classes are balanced.
Focuses on the trade-off between TPR and FPR.
PR Curve:
More informative when dealing with imbalanced datasets.
Focuses on the trade-off between Precision and Recall.
By analyzing these curves, you can better understand the performance of your classification model and make informed decisions about threshold settings and model improvements.
Organisation et Structure des Fichiers
1. sample_metadata.py
Description: Ce fichier génère des métadonnées d'échantillons pour des images médicales et les enregistre dans un fichier CSV.
Contenu:
Génération de données aléatoires pour les colonnes telles que PatientID, StudyDate, Modality, etc.
Conversion des données en DataFrame avec pandas.
Enregistrement des données dans un fichier CSV nommé sample_metadata.csv.
2. main.py
Description: Ce fichier contient le code principal pour l'entraînement et l'évaluation des modèles de machine learning.
Contenu:
Chargement des métadonnées à partir du fichier CSV généré (sample_metadata.csv).
Prétraitement des données (conversion des dates, encodage one-hot, etc.).
Division des données en ensembles d'entraînement et de test.
Entraînement de modèles de machine learning (Random Forest, Gradient Boosting).
Évaluation des modèles avec des rapports de classification.
Tracé des courbes ROC et PR pour évaluer les performances des modèles.
Utilisation de TensorFlow pour entraîner un modèle de réseau de neurones et tracer les courbes ROC et PR.
Description: Ce fichier contient des métadonnées pour diverses images médicales.
Contenu:
Informations sur les images telles que PatientID, StudyDate, Modality, ImageType, etc.
Utilisé pour l'entraînement et l'évaluation des modèles de machine learning.
Structure des Fichiers
project/
│
├── sample_metadata.py # Génération de métadonnées d'échantillons
├── main.py # Code principal pour l'entraînement et l'évaluation des modèles
└── dataset/
└── datas/
└── manifest-1684964579420/
└── metadata.csv # Métadonnées des images médicales
Cette organisation permet de séparer clairement les différentes étapes du projet : génération des données, entraînement des modèles et stockage des métadonnées.