
Neue Open Source von Alibaba Kiborn it und Windows Blog
Ende April präsentierte der chinesische Lieferant Alibaba seine neue Open Source mit dem Namen QWEN3. Laut Alibaba ist AI ein neues KI -Beratungsmodell mit hybriden Lesen.
Alibaba präsentiert die neueste Generation der Open-Source-Reihe der englischen Quelle von QWEN3 und legt nach ihren Informationen neue Regeln in der KI-Entwicklung fest. Die neue Modellreihe besteht aus acht Slim -Modellen (0,6b, 1,7b, 14b, 14b und 32b) mit Modellen (30b 3b mit aktiven Parametern und 235b 22B -Parametern). Alle Varianten sind jetzt geöffnet und weltweit verfügbar.
Hybridlesung für flexiblere Denkprozesse
Mit QWEN3 präsentiert Alibaba erstmals Hybridmodellierungsmodelle. Diese können dynamisch “Denken” verändert werden, wie Mathematik, Programmierung und logische Konsequenzen und “gedankenloser Modus”, einfache Antworten und einfache Antworten.
Durch die API kann das Modell auch so kontrolliert werden, wie lange man nachdenkt – mit einem Kontextfenster von bis zu 38.000 Token. Laut Alibaba sollte das neue Modell QWEN3-235B-A22B-A22B im Vergleich zu anderen Modellen in ihrer Klasse niedrigere Infrastrukturkosten aufweisen.
Starke Leistung in Sprachen, Werkzeugen und Argumentation
Der QWEN3 -Datendatensatz wurde mit 36 Billionen Token im Vorgängermodell zweimal in QWEN2.5 erstellt. Laut Alibaba zeigen große Sprachmodelle (LLM) wichtige Fortschritte bei mehrsprachigen Fähigkeiten, Tools, Wiederholungen und menschlichen Interaktion. Bemerkenswert sind:
- Mehrsprachige Kompetenz: Modell unterstützt 119 Sprachen und Dialekte und bietet starke Ergebnisse für die Übersetzung und mehrsprachige Beratung.
- Agentenfähigkeiten: QWEN3 nennt den Modellkontext (MCP) und eine leistungsstarke Funktion, daher ist es eines der wichtigsten Open-Source-Modelle für agentenbasierte komplexe Anwendungen.
- Überlegungsleistung: In Bezug auf Mathematik, Programmierung und logische Konsequenzen übertrifft QWEN3 alle früheren Modelle in Serien: einschließlich Gedanken und QWEN2.5 QWQ im unformalen Modus.
- Bessere menschliche Interaktion: QWEN3 sorgt für natürliche kreative Texte, Multi-Dialogue-Gespräche, die die Benutzererfahrung erheblich verbessern, die die Benutzererfahrung erheblich verbessern.
Mit einer neuen Modellarchitektur, einer Reihe von Trainingsdaten und optimierten Lernmethoden sollte QWEN3 die besten Werte Aime25 (mathematisches Denken), LivecodeBech (Programmierkapazität), BFCL (Tool und Betrieb) erhalten.
Die Entwicklung des Hybrid-Lesemodells basiert auf einem vierstufigen Trainingsprozess: Erstens beginnt das Modell mit einem kalten Start, um komplexe Aufgaben in verständlichen Gedächtnisschritten (Kette der Zweie) zu verteilen. Das heißt, eine unangemessene Verstärkung ist auch die Fusion und die endgültige Abstimmung und Stimmung im Denken durch allgemeine Verstärkung.
Kostenlose Verfügbarkeit zur Förderung der Innovation
QWEN3 -Modelle sind jetzt frei, durch das Gesicht, Github und Modelscope Embrace. Interaktive Tests können in Chat.qwen.ai durchgeführt werden. Der API -Zugriff wird in Kürze über Alibabas Model Studio gegeben. Es bietet auch einen Super -Helfer, der in Qwen3 Alibabas Haus verwendet wird.
Seit ihrer Veröffentlichung hat die QWEN -Modellreihe mehr als 300 Millionen Mal heruntergeladen. Die Entwickler haben mehr als 100.000 Qwen geschaffen, als die Entwickler das Gesicht umarmen, was eine der am häufigsten verwendeten Reihe offener KI -Modelle auf der ganzen Welt bietet, die vom Hersteller geschrieben wurden. Alibaba Cloud (www.alibacloud.com) wurde 2009 gegründet und als Alibaba -Gruppeninformationszentrum betrieben.
technische Probleme auf
Pendidikan
Pendidikan
Download Anime
Berita Teknologi
Seputar Teknologi