Europas Antwort auf ChatGPT ist jetzt Open-Source


Das OpenGPT-X Forschungsprojekt hat ein innovatives multilinguales KI-Sprachmodell namens „Teuken-7B“ veröffentlicht, das auf Hugging Face frei zugänglich ist.
Das Modell basiert auf den 24 offiziellen EU-Sprachen und umfasst sieben Milliarden Parameter, wodurch es besonders für europäische Anwendungen geeignet ist. Im Gegensatz zu anderen Modellen wurde Teuken-7B von Grund auf multilingual trainiert und enthält 50 % nicht-englische Daten.
Ziel des vom Bundeswirtschaftsministerium geförderten Projekts ist es, eine Open-Source-Alternative zu internationalen KI-Lösungen zu bieten, bei der Transparenz und Datenschutz im Vordergrund stehen.
Technologische Besonderheiten und Vorteile
Teuken-7B zeichnet sich durch effizientes Modelltraining, optimierte Rechenleistung und einen speziell entwickelten Tokenizer aus, der bei europäischen Sprachen mit komplexer Grammatik deutliche Kostenvorteile bietet. Es übertrifft vergleichbare Open-Source-Modelle in mehreren Sprachbenchmarks.
Darüber hinaus ermöglicht es Unternehmen, ihre KI-Anwendungen anzupassen, ohne sensible Daten aus der Hand zu geben. Die Integration in das Gaia-X-Ökosystem gewährleistet die Einhaltung europäischer Datenschutz- und Sicherheitsstandards.
Zukunftsperspektiven und Verfügbarkeit
Das bis 2025 laufende Projekt bietet eine solide Basis für zukünftige Entwicklungen in der KI-Forschung. Teuken-7B kann kostenlos heruntergeladen und sowohl für Forschungszwecke als auch für kommerzielle Anwendungen genutzt werden.
Unternehmen haben die Möglichkeit, das Modell durch Demos und technischen Support zu testen. Das Konsortium hinter OpenGPT-X plant, auf diesen Ergebnissen aufzubauen, um langfristig die europäische Technologie- und Datensouveränität zu fördern.
Für technisches Feedback, Fragen und Fachdiskussionen steht der Fachcommunity der OpenGPT-X Discord Server zur Verfügung.
-->
Teuken-7B 🙄 Wenn das der Marketing Name ist, Könnt ihr es gleich einstampfen, egal wie gut die KI ist.