Jobbeschreibung
Die DIN Solutions GmbH steht innerhalb der DIN-Gruppe für eine hohe technische Expertise und ist verantwortlich für die Entwicklung und den Betrieb von Software, Plattformen und Datenbanken. Unsere Aufgabe ist es, (Kunden-)Anforderungen in technische Lösungen zu übersetzen. Darüber hinaus entwickeln wir Lösungen für Normenanwender und Kooperationspartner der DIN-Gruppe.
Wir suchen ab sofort in Berlin - unbefristet -
Data Scientist (m/w/d) in den Bereichen NLP und LLM (Entwicklung/ Betrieb, Kompetenzaufbau und Support)
Wir suchen einen Data Scientist (m/w/d) in den Bereichen Natural Language Processing (NLP) und Large Language Models (LLM). In dieser Rolle unterstützt Du unser Team bei der Entwicklung und Anwendung von NLP- und LLM-Technologien zusammen mit weiteren erfahrenen Kolleg*innen. Du erhältst die Gelegenheit, in einem dynamischen und kreativen Umfeld der Normung und Normen-Anwendung zu arbeiten und Dich im Bereich der natürlichen Sprachverarbeitung zu verwirklichen.
- Entwicklung von KI-Assistenten für Normen-Anwender und innerbetriebliche Prozesse der DIN-Gruppe mithilfe von Large Language Models (LLMs) und Retrieval-Augmented Generation (RAG).
- Anwendung von Natural Language Processing (NLP) Methoden, Anpassung von Machine Learning Modellen und LLMs, um Wissen aus Normen-Daten automatisch zu extrahieren und zu strukturieren.
- Planung, Entwicklung, Betrieb und Optimierung von Infrastrukturen mit Hilfe von DevOps, LLMOps, und Cloud-Diensten, um die Bereitstellung und den Betrieb zukünftiger KI-Lösungen sicherzustellen.
- Arbeiten in interdisziplinären Teams, um Entwicklungen in bestehende und neue Produkte und Lösungen der DIN Media zu integrieren
- Entwicklung von Prototypen und Bewertung von Technologien, die als Grundlage für neue und innovative Produkte und Lösungen dienen
- Projektmanagement und Projektsupport für KI-Projekte mit externen Dienstleistern
- Mitarbeit in DIN- und KI-Netzwerken und die Unterstützung bei DIN-gruppenweitem Wissensaufbau im Bereich Künstliche Intelligenz
- Erfolgreich abgeschlossenes wissenschaftliches Hochschulstudium (Diplom, Master) in Informatik, Wirtschaftsinformatik, Computerlinguistik, Software Engineering, Data Engineering, Mathematik) oder vergleichbarer Fachrichtung
- Sehr gute Programmierkenntnisse in Python und Erfahrung mit ML-Frameworks (z.B. TensorFlow, PyTorch, spaCy, LangChain, LlamaIndex) und Data-Science-Toolsets (z.B. pandas, numpy, scikit-learn)
- Praktische Erfahrung mit Machine Learning, insbesondere mit neuronalen Netzwerken, Large Language Models (LLMs) und der Verarbeitung und Analyse großer Datenmengen
- Praktische Erfahrung mit Retrieval-Augmented Generation (RAG), Vektordatenbanken und/oder der Anpassung von Open Source LLMs auf domänenspezifischen Anwendungen
- Erfahrung mit DevOps-Praktiken (z. B. GitLab, Docker, CI/CD, Kubernetes) im Allgemeinen und MLOps/LLMOps im Speziellen, sowie mit Cloud Infrastrukturen (z.B. Azure AI, AKS)
- Kenntnisse in der Erstellung und Nutzung von Wissensgraphen sowie Erfahrung im Ontologie-Lernen sind wünschenswert
- Fundierte Erfahrung im Projektmanagement und Netzwerken
- Sehr gute Deutsch- und Englischkenntnisse
- 35 Std./Woche (Vollzeit)
- Maxi-Flex-Modell: Möglichkeit der Anhebung der Wochenarbeitszeit auf bis zu 42 Std./Woche
- Flexible Arbeitszeiten (Gleitzeitmodell mit Kernarbeitszeit 10:00 - 14:00 Uhr)
- Mobiles Arbeiten möglich
- 30 Tage Jahresurlaub sowie Betriebsferien zwischen Weihnachten und Neujahr
- Ein top modernisiertes Gebäude in zentraler Lage (Wittenbergplatz/Zoologischer Garten)
- Kostenfreie Nutzung des hauseigenen Physiozentrums, Zuschuss zum VBB-Firmenticket, JobRad, Sabbatical, Betriebsrestaurant mit bezuschusstem Essen, betriebliche Altersvorsorge etc.
- Umfassende und strukturierte Einarbeitung und Betreuung