Modul 7 DigiMan: Dokumentenverarbeitung und Datenextraktion
Modul 7 der Weiterbildung zum Digitalisierungsmanager umfasst 64 Unterrichtseinheiten (UE) in acht Tagen. Es ist das praxisnächste Modul für alle, die typische Verwaltungsprobleme lösen wollen: Rechnungen, Verträge, Formulare, Eingangspost. Du lernst, wie moderne Dokumentenverarbeitung funktioniert, vergleichst Plattformen wie Azure AI Document Intelligence und Google Document AI und baust eigene Extraktions-Workflows in n8n.
In deutschen Büros liegen Abermillionen Euro in manueller Rechnungs- und Dokumenten-Erfassung. Wer dieses Modul ernst nimmt, kann nach der Weiterbildung in jedem Unternehmen konkret zeigen, wo Automatisierung unmittelbar Geld spart. Deswegen sind die 64 UE kein Zufall.
Aufbau im Curriculum
Modul 7 läuft über acht Tage. Die Struktur geht vom Grundverständnis über Plattformen zur praktischen Integration.
| Tag | Schwerpunkt |
|---|---|
| 1 | OCR und IDP: Was ist der Unterschied |
| 2 | Azure AI Document Intelligence: Prebuilt Models |
| 3 | Azure Custom Models: Eigene Modelle trainieren |
| 4 | Google Document AI: Hands-on und Vergleich |
| 5 | Klassifikation und intelligentes Routing |
| 6 | IDP-Workflows mit n8n und Claude |
| 7 | Qualitätssicherung und Human-in-the-Loop |
| 8 | Praxisprojekt: Eigenes IDP-System |
Jeder Tag hat mehrere Hands-on-Blöcke. Insgesamt enthält Modul 7 sechzehn Praxisübungen. Der Praxisanteil ist hoch, weil Dokumentenverarbeitung ohne eigene Erprobung nicht wirklich verstanden werden kann.
OCR und IDP
Tag 1 legt das Grundverständnis. OCR (Optical Character Recognition) wandelt ein gescanntes Bild in lesbaren Text um. IDP (Intelligent Document Processing) geht einen Schritt weiter. Es versteht Struktur, Layout, semantische Zusammenhänge und Kontext eines Dokuments. Ein IDP-System erkennt nicht nur, dass auf einer Rechnung die Zahl “1.234,56” steht, sondern auch, dass es sich um den Rechnungsbetrag und nicht um die Rechnungsnummer handelt.
Die IDP-Pipeline besteht aus sechs Phasen: Eingang, Vorverarbeitung, Klassifikation, Extraktion, Validierung, Export. Du lernst jede Phase im Detail. Die Vorverarbeitung umfasst typisch fünf Schritte: Deskewing, Rauschentfernung, Binarisierung, Segmentierung, Normalisierung. Handwerk, das in der Praxis über Qualität entscheidet.
Eine Entscheidungsmatrix hilft dir, die passende OCR-Engine zu wählen. Für typische Rechnungen reicht eine Cloud-Prebuilt-Lösung. Für komplexe Formulare brauchst du ein Custom Model. Für geringe Volumina genügt oft ein kostenloses Open-Source-Werkzeug.
Azure AI Document Intelligence
Tag 2 und Tag 3 widmen sich Azure AI Document Intelligence, der Microsoft-Plattform für IDP. Du lernst die Drei-Schichten-Architektur: API-Layer, Modell-Layer, Tooling-Layer. Du startest mit Prebuilt Models, die Microsoft für typische Dokumenttypen fertig trainiert anbietet: Rechnungen, Ausweise, Quittungen, Verträge, Gesundheitsformulare.
Der Hands-on-Einstieg läuft über das Document Intelligence Studio. Du lädst ein Dokument hoch, Azure analysiert es, zeigt die erkannten Felder, und du prüfst die Genauigkeit. Das ist der Moment, in dem viele Teilnehmer zum ersten Mal sehen, wie weit die Technologie inzwischen ist. Eine typische deutsche Geschäftsrechnung wird mit hoher Genauigkeit strukturiert ausgelesen.
Tag 3 geht weiter und dreht sich um eigene Modelle. Du labelst Beispiel-Dokumente, startest das Training und evaluierst das Ergebnis. Auch das ist kein Programmier-Tag, sondern ein Klick-und-Markier-Tag. Wer saubere Trainingsdaten liefert, bekommt ein brauchbares Modell. Wer schlampig markiert, bekommt ein schlampiges Modell.
Das Azure-Preismodell wird transparent besprochen. Die Abrechnung erfolgt pro Seite, nicht pro Dokument. Wer tausend Rechnungen pro Monat verarbeitet, hat andere Kosten als wer zehn Verträge pro Jahr analysiert. Solche Zahlen zu kennen ist für jede ROI-Bewertung entscheidend.
Google Document AI
Tag 4 stellt Google Document AI vor. Die Architektur unterscheidet sich von Azure, die Grundideen sind ähnlich. Du vergleichst beide Plattformen hands-on an derselben Aufgabe (typisch ein Lieferschein oder eine Auftragsbestätigung). Der direkte Vergleich zeigt dir Stärken und Schwächen jeder Plattform. Am Nachmittag erarbeitet ihr in Kleingruppen eine Plattform-Empfehlung für ein gegebenes Szenario.
Der Kurs bewertet nicht “Azure besser als Google” oder umgekehrt. Beide haben unterschiedliche Schwerpunkte. Du lernst, für welchen Anwendungsfall welche Plattform passt.
Klassifikation und Routing
Tag 5 behandelt den Schritt, den viele Projekte unterschätzen. Bevor ein Dokument extrahiert wird, muss das System erkennen, was es überhaupt ist. Eine Rechnung wird anders verarbeitet als ein Vertrag. Ein Versandschein anders als eine Mahnung. Klassifikation bedeutet: Der eingehende Stapel wird automatisch sortiert, und jedes Dokument landet im richtigen Extraktions-Zweig.
Intelligentes Routing ist der nächste Schritt. Das erkannte Dokument wird automatisch an den richtigen Sachbearbeiter, ins richtige System oder in den richtigen Prozess geleitet. Ein Beispiel: Eingangsmails mit Rechnungsanhang landen in der Kreditoren-Warteschlange. Eingangsmails mit Vertragsentwurf landen beim Einkauf. Eingangsmails mit Reklamation landen im Service.
IDP mit n8n verbinden
Tag 6 ist der Integrations-Tag. Du baust einen n8n-Workflow, der eine Mail empfängt, das angehängte PDF an Azure schickt, das Ergebnis entgegennimmt, strukturiert in eine Datenbank schreibt und eine Benachrichtigung an den zuständigen Mitarbeiter sendet. Claude wird an sensiblen Stellen als Reasoning-Schicht eingebaut, etwa um unklare Extraktions-Ergebnisse zu interpretieren oder doppelte Rechnungen zu erkennen.
Das ist der Moment, in dem alle Module zusammenkommen. Prozessdenken aus Modul 1-3, n8n aus Modul 5, LLMs aus Modul 6, IDP aus Modul 7. Wer hier mitkommt, hat einen wesentlichen Teil des Berufsbilds praktisch erlebt.
Human-in-the-Loop
Tag 7 bringt die wichtigste Sicherheitsebene. Kein IDP-System ist perfekt. Wenn du Rechnungen automatisch verbuchst, musst du einen Pfad definieren für unsichere Fälle. Dieser Pfad heißt “Human-in-the-Loop”. Das System erkennt, wann es unsicher ist (typisch über einen Confidence-Score), hält den Prozess an und bittet einen Menschen um Entscheidung.
Du lernst, Schwellen sinnvoll zu setzen. Zu niedrige Schwellen führen zu vielen Fehlern. Zu hohe Schwellen führen zu vielen manuellen Nachprüfungen und der Nutzen schwindet. Die richtige Schwelle hängt vom Geschäftsrisiko ab.
In der Praxis erleben wir immer wieder, dass Firmen den Confidence-Schwellwert viel zu hoch setzen. Aus Angst vor Fehlern liegen dann 80 Prozent der Rechnungen in der manuellen Prüfung. Das war nicht der Sinn der Investition. Wer das Modell nicht sauber kalibriert, kauft sich am Ende nur teureres Excel.
Abschlussprojekt
Tag 8 ist ein Mini-Projekt. Du konzipierst und baust ein IDP-System für einen konkreten Anwendungsfall. Die Bandbreite reicht von Rechnungseingang über Bewerbungsmanagement bis zu Reklamationsbearbeitung. Am Nachmittag präsentierst du deine Lösung in einer 10-Minuten-Demo.
Einordnung ins Gesamtcurriculum
Modul 7 baut auf Modul 5 (Werkzeuge) und Modul 6 (LLMs) auf und bereitet Modul 8 (Chatbots) sowie das Abschlussprojekt in Modul 13 vor. Viele Teilnehmer wählen für ihr Abschlussprojekt ein Dokumenten-Thema, weil es nahe am Arbeitsalltag liegt und einen klaren Nutzen hat.
Einen Überblick über alle 13 Module gibt die Ratgeber-Pillar. Welches Modul am wichtigsten für die Praxis ist, beantwortet dieser Einordnungs-Artikel. Der nächste Schritt in der Werkzeugwelt ist Modul 8 zu Chatbots und KI-Agenten.
Die Bundesagentur für Arbeit beschreibt die Förderbedingungen für AZAV-Weiterbildungen im Detail. Eine Einordnung der Markt-Entwicklung von IDP bietet die Bitkom.
FAQ zu Modul 7
Muss ich für Modul 7 programmieren können?
Nein. Die Plattformen (Azure, Google) werden über Web-Oberflächen bedient. Die Integration läuft über visuelle n8n-Workflows. Wer Excel und Web-Formulare bedient, schafft Modul 7.
Was kostet IDP in der Praxis?
Die Cloud-Plattformen rechnen pro Seite ab. Prebuilt Models sind typisch im einstelligen Cent-Bereich pro Seite, Custom Models etwas teurer. Für ein mittleres Unternehmen mit zweitausend Rechnungen pro Monat liegen die Kosten im niedrigen dreistelligen Euro-Bereich. Genaue Preise ändern sich, der Kurs zeigt die aktuelle Einordnung zum Start-Datum.
Was ist der Unterschied zwischen einem Prebuilt Model und einem Custom Model?
Ein Prebuilt Model hat der Anbieter für einen Standard-Dokumenttyp fertig trainiert (zum Beispiel deutsche Rechnungen). Ein Custom Model trainierst du selbst für ein spezielles Dokument in deinem Unternehmen. Prebuilt ist schneller einsatzbereit, Custom ist genauer für Spezialfälle.
Wie sicher ist die Erkennung in der Praxis?
Für typische deutsche Geschäftsdokumente erreichen moderne IDP-Systeme hohe Genauigkeiten. Entscheidend ist die Kombination mit Human-in-the-Loop für unsichere Fälle. Kein System sollte ohne diese Sicherheitsebene produktiv gehen.
Kann ich Modul 7 mit Bildungsgutschein finanzieren?
Ja. Der gesamte DigiMan-Kurs ist nach § 81 SGB III über einen Bildungsgutschein förderbar. AZAV-zertifiziert über DEKRA. Ohne Förderung 9.662,40 Euro, mit Bildungsgutschein 0 Euro.
Über den Autor
Dr. Jens Aichinger ist Gründer von SkillSprinters, einem DEKRA-zertifizierten Bildungsträger nach AZAV. Er ist promovierter Naturwissenschaftler und arbeitet seit über zehn Jahren an der Schnittstelle von Bildung und Digitalisierung. Mehr zum Autor auf der Autoren-Seite.
Zuletzt geprüft am 14. April 2026 von Dr. Jens Aichinger. Kontakt und Terminbuchung über skill-sprinters.de/termin.
Vor der Buchung: die richtigen Fragen stellen
Bevor du dich für eine Weiterbildung entscheidest, prüfe bei jedem Anbieter, ob das Curriculum wirklich so tief geht, wie es im Marketing klingt. Unser kostenloses PDF “27 Fragen, die du jedem Anbieter stellen solltest” gibt dir eine Checkliste an die Hand, mit der du ein Beratungsgespräch strukturieren kannst.
Weiterlesen
BPMN-Symbole und Notation verstehen: Anschluss Modul 2
BPMN 2.0 mit den wichtigsten Symbolen: Events, Activities, Gateways, Pools und Lanes. Grundlagen passend zu Modul 2 des DigiMan-Kurses.
8 Min. Lesezeit
Chatbot-Konzepte ohne Programmierung verstehen (Modul 8)
Wie Chatbot-Architekturen funktionieren, ohne selbst zu programmieren: Intents, Entities, Dialogflüsse, Fallback, LLM-Bots. Anschluss an Modul 8.
8 Min. Lesezeit
Modul 1 DigiMan: Geschäftsprozesse und Organisation
Modul 1 der Weiterbildung zum Digitalisierungsmanager umfasst 32 UE an 4 Tagen. Was Prozess, Organisation und erste n8n-Schritte bedeuten.
8 Min. Lesezeit