🔧 Synthetic IT Ticket Generator — Custom Dataset
Entdecke die erweiterte Version dieses Datasets mit 50.000 Ticket-Einträgen! Perfekt zum Trainieren von Modellen zur Klassifizierung und Priorisierung von Support-Tickets. Dieses Dataset enthält verschiedene Dateien mit unterschiedlichen Ticket-Anzahlen, Sprachen und Queue-Konfigurationen.
Hol dir eine On-Prem Ticket Tagging AI
Brauchst du eine On-Premises AI zur automatischen Ticket-Klassifizierung? Schau dir Open Ticket AI an — unsere Lösung für automatisierte Ticket-Klassifizierung, die in deiner eigenen Infrastruktur läuft.
Erstelle dein eigenes Custom Dataset
Möchtest du ein Dataset, das auf deine spezifischen Queues, Prioritäten und Sprachanforderungen zugeschnitten ist? Nutze unseren Synthetic Data Generation Service, um maßgeschneiderte Ticket-Daten ohne personenbezogene Informationen (PII) zu erstellen.
👉 Definiere deine Queues, Prioritäten und Sprachpräferenzen 👉 Generiere realistische Ticket-Daten für deinen spezifischen Use Case 👉 Trainiere Modelle auf Daten, die deinen Geschäftsanforderungen entsprechen
Übersicht
Das Customer IT Support Ticket Dataset ist eine umfassende Sammlung synthetischer E-Mail-Tickets, die zur Optimierung des Kundensupports, für NLP-Forschung und Machine-Learning-Projekte entwickelt wurde. Das Dataset bietet gut klassifizierte Daten mit vollständigen Ticket-Lebenszyklus-Informationen, einschließlich Kunden-E-Mails, Agenten-Antworten, Prioritäten, Queues, Typen, Tags und Geschäftskontext.
Dataset-Struktur
Das Dataset bietet eine detaillierte Struktur mit Klassifizierungen nach:
- Abteilung/Queue: Wohin das Ticket weitergeleitet werden soll
- Typ: Die Art des Tickets (Incident, Request, Problem, Change)
- Priorität: Dringlichkeitsstufe (Low, Medium, Critical)
- Sprache: Mehrsprachiger Support (EN, DE, ES, FR, PT)
- Betreff & Body: Vollständiger E-Mail-Text von Kunden
- Agenten-Antwort: Professionelle Antworten von Helpdesk-Agenten
- Business Type: Kontext der Support-Organisation
- Tags: Zusätzliche Kategorisierung für detaillierte Analysen
Features und Attribute
| Feld | Beschreibung | Beispielwerte |
|---|---|---|
| 🔀 Queue | Gibt die Abteilung an, an die das E-Mail-Ticket weitergeleitet wird | Technical Support, Customer Service, Billing and Payments, Product Support, IT Support, Returns and Exchanges, Sales and Pre-Sales, Human Resources, Service Outages and Maintenance, General Inquiry |
| 🚦 Priority | Zeigt die Dringlichkeit und Wichtigkeit des Problems an | 🟢 Low, 🟠 Medium, 🔴 Critical |
| 🗣️ Language | Sprache, in der die E-Mail verfasst ist | EN, DE, ES, FR, PT |
| 📧 Subject | Betreffzeile der Kunden-E-Mail | Verschiedene Betreffzeilen von Kundenanfragen |
| 📝 Body | Vollständiger Textinhalt der Kunden-E-Mail | Detaillierte Kundenbeschreibungen |
| 💬 Answer | Antwort des Helpdesk-Agenten | Professionelle Agenten-Antworten mit Lösungen |
| 🏷️ Type | Ticket-Typ, wie vom Agenten ausgewählt | Incident, Request, Problem, Change |
| 🏢 Business Type | Der Geschäftstyp des Support-Helpdesks | Tech Online Store, IT Services, Software Development Company |
| 🏷️ Tags | Tags/Kategorien, die dem Ticket zugewiesen sind (10 Spalten) | Software Bug, Warranty Claim, Password Reset, etc. |
Queue (Abteilung)
Gibt die Abteilung an, in die das E-Mail-Ticket kategorisiert wird. Dies hilft bei der Weiterleitung des Tickets an das entsprechende Support-Team zur Lösung.
| Icon | Queue | Beschreibung |
|---|---|---|
| 💻 | Technical Support | Technische Probleme und Support-Anfragen |
| 🈂️ | Customer Service | Kundenanfragen und Service-Anfragen |
| 💰 | Billing and Payments | Abrechnungsprobleme und Zahlungsabwicklung |
| 🖥️ | Product Support | Support für produktbezogene Probleme |
| 🌐 | IT Support | Interne IT-Support- und Infrastrukturprobleme |
| 🔄 | Returns and Exchanges | Produktrückgaben und Umtausch |
| 📞 | Sales and Pre-Sales | Vertriebsanfragen und Pre-Sales-Fragen |
| 🧑💻 | Human Resources | Mitarbeiteranfragen und HR-bezogene Themen |
| ❌ | Service Outages and Maintenance | Dienstunterbrechungen und Wartung |
| 📮 | General Inquiry | Allgemeine Anfragen und Informationsanfragen |
Prioritätsstufen
Zeigt die Dringlichkeit und Wichtigkeit des Problems an. Hilft bei der Workflow-Verwaltung, indem Tickets priorisiert werden, die sofortige Aufmerksamkeit benötigen.
| Priorität | Stufe | Beschreibung | Beispiele |
|---|---|---|---|
| 🟢 | 1 (Low) | Nicht dringende Probleme, die keine sofortige Aufmerksamkeit erfordern | Allgemeine Anfragen, kleinere Unannehmlichkeiten, Routine-Updates, Feature-Requests |
| 🟠 | 2 (Medium) | Mäßig dringende Probleme, die eine zeitnahe Lösung benötigen, aber nicht kritisch sind | Performance-Probleme, intermittierende Fehler, detaillierte Benutzerfragen |
| 🔴 | 3 (Critical) | Dringende Probleme, die sofortige Aufmerksamkeit und schnelle Lösung erfordern | Systemausfälle, Sicherheitsverletzungen, Datenverlust, größere Fehlfunktionen |
Sprachunterstützung
Zeigt die Sprache an, in der die E-Mail verfasst ist. Nützlich für sprachspezifische NLP-Modelle und mehrsprachige Support-Analysen.
| Sprachcode | Sprache | Anwendungsfall |
|---|---|---|
| en | Englisch | Internationaler Support, Hauptsprache |
| de | Deutsch | DACH-Region Support |
| es | Spanisch | Spanischsprachige Märkte |
| fr | Französisch | Französischsprachige Märkte |
| pt | Portugiesisch | Portugiesischsprachige Märkte |
Ticket-Typen
Verschiedene Ticket-Typen, kategorisiert, um die Art der Anfragen oder Probleme zu verstehen.
| Icon | Typ | Beschreibung |
|---|---|---|
| ❗ | Incident | Unerwartetes Problem, das sofortige Aufmerksamkeit erfordert |
| 📝 | Request | Routinemäßige Anfrage oder Service-Request |
| ⚠️ | Problem | Zugrundeliegendes Problem, das mehrere Incidents verursacht |
| 🔄 | Change | Geplante Änderung oder Update |
Business Types
Der Geschäftstyp des Support-Helpdesks hilft, den Kontext des bereitgestellten Supports zu verstehen.
Beispiele sind:
- Tech Online Store
- IT Services
- Software Development Company
- SaaS Provider
- E-commerce Platform
- Enterprise IT Department
Tags und Kategorien
Tags/Kategorien, die dem Ticket zugewiesen sind, um häufige Probleme oder Themen weiter zu klassifizieren und zu identifizieren. Das Dataset enthält 10 Tag-Spalten für eine umfassende Kategorisierung.
Beispiel-Tags:
- Product Support
- Technical Support
- Sales Inquiry
- Software Bug
- Warranty Claim
- Password Reset
- Network Issue
- Account Management
- Feature Request
- Billing Question
Anwendungsfälle
| Aufgabe | Beschreibung |
|---|---|
| Textklassifizierung | Trainiere Machine-Learning-Modelle, um E-Mail-Inhalte genau in geeignete Abteilungen zu klassifizieren und so das Ticket-Routing und -Handling zu verbessern |
| Prioritätsvorhersage | Entwickle Algorithmen, um die Dringlichkeit von E-Mails vorherzusagen und sicherzustellen, dass kritische Probleme umgehend behandelt werden |
| Kundensupport-Analyse | Analysiere das Dataset, um Einblicke in häufige Kundenprobleme zu gewinnen, Support-Prozesse zu optimieren und die allgemeine Servicequalität zu verbessern |
| NLP-Modelltraining | Baue Natural Language Processing Modelle für Intent-Erkennung, Sentiment-Analyse und automatische Antwortgenerierung |
| Qualitätssicherung | Trainiere Modelle, um die Qualität und Konsistenz von Agenten-Antworten zu bewerten |
| Mehrsprachiger Support | Entwickle sprachspezifische Modelle oder teste mehrsprachige NLP-Ansätze |
| Agenten-Training | Nutze realistische Beispiele, um neue Support-Agenten in richtigen Antworttechniken zu schulen |
| Prozessoptimierung | Identifiziere Muster in der Ticket-Lösung, um Support-Workflows zu verbessern |
Dataset-Statistiken
- Gesamt-Tickets: 50.000+ Einträge über verschiedene Dateien hinweg
- Sprachen: 5 (EN, DE, ES, FR, PT)
- Queues: 10 verschiedene Abteilungen
- Prioritätsstufen: 3 (Low, Medium, Critical)
- Ticket-Typen: 4 (Incident, Request, Problem, Change)
- Business Types: Mehrere Geschäftskontexte
- Tags: Umfassende Kategorisierung mit 10 Tag-Spalten pro Ticket
Wichtige Links
Download und Zugriff
- Kaggle Dataset - Lade das vollständige Dataset herunter
- Open Ticket AI - On-Premises AI für automatische Ticket-Klassifizierung
- Synthetic Data Generator - Erstelle maßgeschneiderte Datasets nach deinen Bedürfnissen
Network Diagram Tags
Das Dataset enthält Netzwerkdiagramm-Darstellungen, die Beziehungen zwischen verschiedenen Ticket-Attributen zeigen, und hilft so, die Interaktion von Queues, Prioritäten und Typen innerhalb des Support-Ökosystems zu visualisieren.
Warum dieses Dataset verwenden?
✅ Synthetische Daten - Keine PII, völlig sicher für Training und Entwicklung ✅ Umfassend - Enthält den vollständigen Ticket-Lebenszyklus von der Kunden-E-Mail bis zur Agenten-Antwort ✅ Mehrsprachig - Unterstützung für 5 Sprachen ermöglicht internationale Anwendungen ✅ Realistisch - Generiert mit realistischen Geschäftsszenarien und Agenten-Antworten ✅ Flexibel - Mehrere Dateien mit verschiedenen Konfigurationen für verschiedene Anwendungsfälle ✅ Gut strukturiert - Sauberes, konsistentes Format, sofort einsatzbereit in ML-Pipelines
Erste Schritte
- Lade das Dataset von Kaggle herunter
- Wähle die Datei, die am besten zu deinen Bedürfnissen passt (Sprache, Größe, Queue-Konfiguration)
- Lade die Daten in dein bevorzugtes ML-Framework
- Beginne mit dem Training deiner Ticket-Klassifizierungsmodelle!
Für erweiterte Features wie benutzerdefinierte Queue-Definitionen, spezifische Business Types oder Integration in dein bestehendes Ticketing-System, schau dir Open Ticket AI an.
Unterstütze dieses Projekt
Deine Unterstützung durch ein Upvote auf Kaggle wäre sehr geschätzt! ❤️🙂 Danke, dass du hilfst, diese Ressource der Community zur Verfügung zu stellen.
Fazit
Das Customer IT Support Ticket Dataset ist eine unschätzbare Ressource für Unternehmen und Forscher, die datengetriebene Einblicke in den Kundensupport gewinnen möchten. Mit 50.000 Einträgen, mehrsprachigem Support, umfassender Tagging und realistischen Agenten-Antworten bietet dieses Dataset alles, was benötigt wird, um produktionsreife Ticket-Klassifizierungssysteme zu bauen.
Egal, ob du ML-Modelle trainierst, Support-Prozesse optimierst, NLP-Forschung betreibst oder automatisierte Support-Lösungen entwickelst — dieses Dataset bietet die Grundlage für deinen Erfolg.