Die Klassifizierung von Dokumenten mit geschriebener Sprache (unstrukturierter Text) erfordert einen großen manuellen Aufwand.
Die neuesten Fortschritte im Bereich des maschinellen Lernens und der Verarbeitung natürlicher Sprache ermöglichen eine sehr präzise und voll automatisierte Klassifizierung von Dokumenten basierend auf ihren Textinhalten.
Voraussetzung für solch eine Automatisierung sind die Trainingsdaten, die Beispiele für korrekt klassifizierte Dokumente enthalten. Damit wird eine Maschine befähigt, diese Historiendaten zu verwenden, um ein Dokument richtig zu klassifizieren.