Dia 9/12
⚡ Problemen & Oplossingen
Van Uitdagingen naar Doorbraken
Hoe we de problemen systematisch hebben aangepakt
⚖️ Data Imbalance
Probleem
  • Ongelijke distributie: 113-176 samples per klasse (ratio 1.56)
  • Bias risico: Model favoriseert Velociraptor (176 samples)
  • Ondervertegenwoordiging: Stegosaurus benadeeld (113 samples)
Oplossing
  • Class weights: Automatische gewichten berekend: total_samples / (n_classes * count)
  • Keras implementatie: class_weight parameter in model.fit()
  • Resultaat: Ankylosaurus 100%, Stegosaurus 97.1% accuracy!
🚗 Data Cleaning - Auto Vervuiling
Probleem
  • Verkeerde labels: Auto afbeeldingen in Velociraptor klasse
  • Data vervuiling: car_*.jpg bestanden niet relevant
  • Training bias: Model leert auto's als Velociraptor
Data Cleaning
  • Identificatie: car_ prefix detectie in bestandsnamen
  • Verplaatsing: Auto bestanden naar aparte 'car' map
  • Clean dataset: Alleen echte dinosaurus afbeeldingen voor training
🦖 Velociraptor-T-Rex Verwarring
Challenge
  • Laagste accuracy: Velociraptor 75.6%, T-Rex 84.6%
  • Hoogste verwarring: 6x Velociraptor → T-Rex fouten
  • Visuele gelijkenis: Beide carnivoren met vergelijkbare anatomie
Aanpak & Acceptatie
  • Data augmentation: Extra variatie in poses, rotaties en zoom
  • Fine-tuning focus: Strategic layer unfreezing voor feature refinement
  • Realistisch resultaat: 75.6% acceptabel voor moeilijke carnivoor klasse
🚀 Impact van Oplossingen
📊
Perfect Balance
Class weights resulteerden in
Ankylosaurus 100% accuracy
Stegosaurus 97.1% (was kleinste klasse)
🔧
Clean Data Quality
Auto-vervuiling geëlimineerd
Systematische data cleaning
91.3% finale accuracy bereikt
🎯
Realistic Expectations
Velociraptor 75.6% vs T-Rex 84.6%
Carnivoor verwarring erkend
Overall 91.3% excellent result