Warum Preise für Datenannotation schwer zu finden sind
Wer online nach Preisen für Datenannotation sucht, findet meist vage Aussagen. Viele Anbieter veröffentlichen keine Tarife, sondern verweisen auf individuelle Angebote. Das wirkt frustrierend, ist aber nicht nur Verkaufstaktik. Annotation kann je nach Aufgabe, Datenqualität, Domäne, Volumen, Fachwissen und Qualitätsanforderung extrem unterschiedlich aufwendig sein.
Eine Bounding Box in einem sauberen Produktbild und eine Bounding Box in einem dichten medizinischen Scan sind formal derselbe Annotationstyp. Praktisch sind es völlig unterschiedliche Aufgaben. Eine einfache Textklassifikation kann Sekunden dauern. Eine Expertenbewertung für ein LLM, eine medizinische Segmentierung oder ein 3D-LiDAR-Frame kann Minuten bis Stunden benötigen.
Statt nach einer universellen Preisliste zu suchen, sollten Teams verstehen, welche Faktoren Kosten treiben und wie ein seriöses Angebot aufgebaut ist. Genau darum geht es in diesem Leitfaden.
Die drei wichtigsten Preismodelle
Preis pro Label oder Objekt
Beim Preis pro Label wird jede abgeschlossene Annotationseinheit berechnet: eine Bounding Box, ein klassifiziertes Dokument, ein transkribierter Abschnitt oder ein segmentiertes Objekt. Dieses Modell ist transparent, wenn die Aufgabe klar definiert und die Komplexität stabil ist.
Der Nachteil: Es kann einen Anreiz für Geschwindigkeit statt Qualität schaffen. Deshalb sollten Verträge pro Label immer klare Qualitätsmetriken, QA-Stichproben, Nacharbeitsregeln und Definitionen für schwierige Fälle enthalten.
Preis pro Stunde
Beim Stundenmodell wird die tatsächliche Arbeitszeit berechnet. Es eignet sich für komplexe oder variable Aufgaben: medizinische Annotation, technische Inspektion, Multi-Step-NLP, LLM-Evaluation, Videoannotation oder 3D-Daten. Der Vorteil ist Flexibilität. Der Nachteil ist geringere Planbarkeit, wenn Durchsatz und Scope nicht gemessen werden.
Bei stundenbasierten Angeboten sollten Sie nach vergleichbaren Durchsatzwerten fragen: Wie viele Bilder, Minuten Video, Dokumente oder Fälle wurden in ähnlichen Projekten pro Stunde bearbeitet? Nur der Stundensatz allein sagt wenig über den Endpreis aus.
Managed-Service-Preis
Managed-Service-Angebote bündeln Annotation, QA, Projektmanagement, Guideline-Erstellung, Tooling, Reporting und Export. Dieses Modell ist oft sinnvoll, wenn ein Kunde nicht nur Arbeitskraft, sondern einen vollständigen operativen Prozess benötigt. Es ist weniger granular, kann aber die tatsächlichen Gesamtkosten besser abbilden.
Was die Kosten von Datenannotation treibt
Aufgabentyp und Datenmodalität
Bildklassifikation ist meist günstiger als Objekterkennung. Bounding Boxes sind günstiger als Polygone. Semantische Segmentierung ist aufwendiger als Klassifikation. Videoannotation ist komplexer als Einzelbilder, weil Objekte über Zeit verfolgt werden müssen. 3D-Annotation und Sensorfusion sind nochmals anspruchsvoller.
Bei Textdaten kann eine einfache Kategorie schnell vergeben werden. Named Entity Recognition, Relation Extraction, juristische Dokumentanalyse oder LLM-Bewertungen benötigen dagegen mehr Kontext und Review.
Fachwissen
Generalistische Annotatoren können viele Aufgaben gut bearbeiten, wenn die Guidelines klar sind. Manche Projekte benötigen jedoch Domänenexpertise: Radiologen, Ärzte, Ingenieure, Juristen, Agronomen, Linguisten oder Sicherheitsexperten. Solche Profile kosten mehr und sind weniger leicht skalierbar. Gleichzeitig können sie für Ground Truth und Qualität unverzichtbar sein.
Qualitätsstufe
Ein günstiger Basistarif ohne echte QA ist nicht mit einem Angebot vergleichbar, das Schulung, Doppelannotation, Reviewer, Konsensregeln, Fehlerberichte und Nacharbeit beinhaltet. Die gewünschte Qualität muss im Preis sichtbar sein. Sonst erscheint ein Angebot günstig, wird aber später durch Rework teuer.
Sprache und Region
Mehrsprachige Projekte, regionale Varianten, Dialekte oder lokale Vorschriften erhöhen den Aufwand. Ein Content-Moderation-Projekt in mehreren Ländern benötigt andere Reviewer und Guidelines als ein rein englischer Datensatz. Dasselbe gilt für OCR, juristische Texte oder medizinische Dokumente.
Turnaround-Zeit
Kurze Fristen erhöhen Kosten, weil Teams schneller rekrutiert, geschult und koordiniert werden müssen. Sehr enge Deadlines führen oft zu mehr Parallelisierung und zusätzlicher QA. Ein realistisch geplanter Pilot reduziert diese Risiken.
Volumen und Laufzeit
Große, wiederkehrende Volumen können Stückkosten senken, weil Setup, Schulung und Tooling besser amortisiert werden. Kleine Einmalprojekte haben dagegen häufig einen Mindestaufwand: Kickoff, Guidelines, Tool-Setup, QA und Reporting fallen auch bei wenigen Hundert Beispielen an.
Relative Komplexität nach Annotationstyp
Als grobe Orientierung gilt: einfache Klassifikation ist am günstigsten, gefolgt von Bounding Boxes, Attributannotation und einfachen NLP-Labels. Polygone, Segmentierung, OCR auf schwierigen Dokumenten, Video-Tracking und LLM-Human-Evaluation liegen höher. Medizinische, juristische oder 3D-/Sensorfusionsprojekte gehören zu den teuersten Kategorien, weil sie Fachwissen und intensive QA benötigen.
Diese Reihenfolge ersetzt kein Angebot. Sie hilft aber, unrealistische Erwartungen zu vermeiden. Wenn zwei Anbieter für eine komplexe Segmentierungs- oder Expertenaufgabe Preise nennen, die eher zu einfacher Klassifikation passen, sollte man sehr genau nach QA, Profilen und Nacharbeit fragen.
Versteckte Kosten, die Angebote verteuern
Viele Budgets steigen nicht wegen der eigentlichen Annotation, sondern wegen unklarer Nebenleistungen. Dazu gehören Guideline-Erstellung, Tool-Lizenzen, Datenkonvertierung, Upload und Download, Projektmanagement, QA, Rework, Exportformate, Sicherheit, Expertenreview oder zusätzliche Runden nach Scope-Änderungen.
Ein gutes Angebot sollte klar sagen, was enthalten ist. Sind Korrekturen inklusive? Welche QA-Quote wird geprüft? Wer erstellt die Guidelines? Welche Formate werden geliefert? Wie werden unklare Fälle behandelt? Gibt es ein Mindestbudget oder Setup-Gebühren?
Inhouse vs. Outsourcing
Inhouse-Annotation gibt maximale Kontrolle, kann aber teurer sein, wenn Rekrutierung, Schulung, Management, Tooling und QA eingerechnet werden. Outsourcing reduziert den operativen Aufwand, erfordert aber klare Vorgaben, Datenschutzprüfung und gute Kommunikation. Für viele Teams ist ein hybrider Ansatz sinnvoll: interne Experten definieren Guidelines und prüfen schwierige Fälle, ein externer Anbieter skaliert die operative Annotation.
Wie Projektgröße die Kostenstruktur verändert
Bei kleinen Piloten dominieren Setup und Lernkurve. Bei mittleren Projekten entscheidet die Qualität der Guidelines über Effizienz. Bei großen Projekten werden Workforce-Management, QA-Automatisierung, Reporting und Durchsatzoptimierung entscheidend. Ein Preis pro Einheit kann daher sinken, wenn der Prozess stabil ist und Volumen planbar bleibt.
Wie Sie ein präzises Angebot erhalten
Ein guter Anbieter braucht mehr als die Anzahl der Bilder oder Dokumente. Für ein belastbares Angebot sollten Sie Beispieldaten, Zielmodell, Annotationstyp, Klassenliste, Qualitätsanforderung, gewünschte Formate, Frist, Datenschutzanforderungen und erwartetes Volumen bereitstellen. Noch besser ist ein kleiner Pilotbatch. Er zeigt realen Durchsatz, typische Grenzfälle und QA-Aufwand.
Achten Sie bei Angeboten auf die Gesamtstruktur, nicht nur auf den niedrigsten Satz. Fragen Sie nach: Welche Profile annotieren? Welche Reviewer prüfen? Wie wird Qualität gemessen? Wie wird Rework behandelt? Welche Daten werden gespeichert? Welche Tools werden genutzt? Welche Risiken sieht der Anbieter im Sample?
Häufige Fragen
Warum veröffentlichen viele Annotation-Anbieter keine Preise?
Weil die Kosten stark vom Projekt abhängen. Ein öffentlicher Standardpreis wäre entweder irreführend oder so breit, dass er kaum hilft. Seriöse Anbieter sollten aber erklären können, wie sie kalkulieren.
Ist günstige Datenannotation sinnvoll?
Günstig kann sinnvoll sein, wenn die Aufgabe einfach, gut definiert und gut kontrolliert ist. Bei komplexen Projekten kann ein zu niedriger Preis später zu Qualitätsproblemen, Rework und Modellfehlern führen.
Kann synthetische Datengenerierung Annotation ersetzen?
Synthetische Daten können helfen, seltene Fälle zu ergänzen. Sie ersetzen aber nicht automatisch echte, geprüfte und domänenspezifische Ground Truth. Oft brauchen auch synthetische Daten menschliche Evaluation.
Kann man Preise verhandeln?
Ja, vor allem über Scope, Volumen, QA-Level, Fristen und Wiederholbarkeit. Die bessere Frage ist jedoch, welche Preisstruktur die gewünschte Qualität zuverlässig liefert.
Ein Angebot für Ihr Projekt erhalten
DataVLab kalkuliert Annotation-Projekte auf Basis von Beispieldaten, Komplexität, Profilen, QA und Lieferformaten. Wenn Sie eine realistische Einschätzung für Bild-, Video-, Text-, Audio-, 3D- oder LLM-Annotation benötigen, kontaktieren Sie uns.









