Bereiten Sie Ihre Trainingsdaten vor
Bevor Sie mit dem Training eines Texterkennungsmodells beginnen, müssen Sie die "Ground Truth"-Daten vorbereiten, d. h. die Bilder und die entsprechenden genauen Transkriptionen, auf denen das Modell lernen soll. Öffentliche Modelle sind hier Ihr bester Freund.
Beginn der Ausbildung
Sobald Sie eine ausreichende Menge an Trainingsdaten haben (20-30 Seiten), können Sie Ihren ersten Trainingslauf durchführen. Transkribus verwendet Ihre Trainingsdaten, um die Schrift zu lernen und ein Modell zu entwickeln, das genau Ihr Material erkennen kann.
Verwenden und verfeinern
Sobald die erste Version Ihres Modells fertig ist, können Sie es sofort verwenden. In vielen Fällen ist diese erste Version bereits sehr gut. Sie können aber auch mehr Trainingsdaten produzieren, indem Sie mehr Material mit Ihrem neuen Modell erkennen und korrigieren.