Das QWEN -Team hat die Veröffentlichung von angekündigt QWEN3-CODER-480B Und Qwen3-coder-35b-Anweisungenmarkieren einen signifikanten Fortschritt in offenen Agentencode -Modellen. Diese neuen Modelle sollen die Codierungsfunktionen erheblich verbessern und ein robustes architektonisches Design und praktische Nutzung für Softwareentwicklungsaufgaben bieten.
QWEN3-CODER-480B ist das bisher größte offene Codemodell und zeigt die Leistung des Stand der Technik (SOTA) in verschiedenen Code-Benchmarks. Seine Fähigkeiten umfassen Code -Abschluss, Bearbeitung und Generation. Eine bemerkenswerte Leistung für QWEN3-CODER-480B ist die außergewöhnliche Leistung bei der Abschluss des Codes, insbesondere bei der Aufgabe der Füllmitte (Mitte), bei der ein Pass bei 1 Punktzahl von 42,0%erreicht wurde. Das umfangreiche Schulungsregime des Modells umfasste über 3 Billionen Tokens aus verschiedenen Datensätzen, was zu seiner verbesserten Fähigkeit beiträgt, effektiv Code zu verstehen und zu generieren. Diese riesigen Trainingsdaten und das schiere Größen der Modell positionieren es als sehr vielseitiges Tool für Entwickler, die ein breites Spektrum von Aufgaben von der Fertigstellung des grundlegenden Codes bis zur komplizierten Codeerzeugung abwickeln können.
Das Ergänzung des 480B-Modells ist ausdrücklich optimiert, dass QWEN3-CODER-35B als Codierungsagent hilfreich ist und Entwicklern mit komplexen Codierungsanforderungen unterstützt wird. Dieses Modell enthält erweiterte Funktionen, einschließlich eines 32K -Token -Kontextfensters. Es wurde mit speziellen Techniken ausgebildet, die den nahtlosen Einsatz externer Werkzeuge und Funktionsaufrufe erleichtern. Diese Funktionalität ermöglicht es Entwicklern, externe APIs direkt in ihre Codierungsumgebung aufzurufen, wodurch die Produktivität verbessert und Entwicklungsworkflows gestoppt werden. Das QWEN3-CODER-35B-Anweisungsmodell ist für Robustheit und Effizienz entwickelt, wodurch es für Agentenanwendungen, die komplexe Wechselwirkungen beinhalten, sehr geeignet ist.
Sowohl QWEN3-CODER-480B- als auch QWEN3-CODER-35B-Anweisungen sind auf führenden Plattformen wie dem Umarmen und Models und ModelsCope jetzt öffentlich zugänglich. In einem Schritt zur Förderung von Innovationen und Zusammenarbeit in der KI-gesteuerten Softwareentwicklungsgemeinschaft hat das QWEN-Team alle zugehörigen Code, Modellgewichte und umfassende Dokumentation Open-Sourcutiert. Dieser Open-Source-Ansatz soll Forschern und Entwicklern befähigen, diese Modelle zu nutzen, was zu ihrer weiteren Verbesserung und umfassenderen Einführung beiträgt.
Source: Neues 480B -Qwen -Modell erschüttert Open Source -Datensätze
