The US-Konzern meta does not have its own algorithm that can be used by 200 different languages and used in Schnitt. Das Werkzeug der Facebook-, Instagram- and Whatsapp-Mutter heißt NLLB-200 (für “No Language Left Behind” also etwa “Keine Sprache zurücklassen”) and was non as Open Source available. Provided several tools that weitere Sprachen hinzugefügt and inkluivere Techniken were built, erläutert Metas KI-Abteilung. Based on the algorithm, we managed to spread messages on Facebook, Instagram and Wikipedia.
Rückgriff auf bessere Training dates
Meta AI will not use the algorithm in any way to make humans work better, making it possible that “tomorrow the metaverses will be made”. Mit NLLB-200 has a man “bedeutenden Durchbruch” erzielt. Damit liesßen sich “hervorragende Übersetzungen” in en aus 200 verschiedenen Sprachen erstellen, darunterviele, die zuvor nicht ausreichend or even nicht von Übersetzungssoftware unterstützt seien – zum Beispiel Kikamba (with four Millionen Sprechende in Kenya and Millionen Sprechenia) in Südotasien). Die Verbesserung von im Mittel over 40 Prozent and teilweise over 70 Prozent hat Meta mit einem hauseigenen Benchmark on behalf of FLORES ermittelt, der vor een Jahr als Open Source veröffentlicht wurde en auf Übersetzungen von Muttersprachlern basiert.
Bereits im Februar hatte Meta öffentlich gemacht, dass dort an einem KI-gestütztem Echte zeitübersetzer gearbeitet wird, damals war aber noch von 100 Sprachen die Rede. Those double counts can happen in such a way that one of the possible Herausforderung gegesen, erklärt Meta AI. So if you make immensely large Mengen and Parallelcorpora known, um die Software zu trainieren, also Texte, die in meer Sprachen vorliegen. Der Rückgriff auf Data-Mining im internet liefere often nur lesswertige text quality, weswegen metauf professional Üebrsetzungen en Überprüfungen zurückgreift. Weiterhin es es schwierig, oneinzelnes Modell jeweils für Hunderte Sprache zu optimieren, ohne die allgemeine Leistung zu beeinträchtigen. Komplett überarbeitet word sei auch the Pipeline zur Bereinigung der Daten, mit der etwa “toxic Instop” herausgefiltert was sollen, heißt es noch.
A Auflistung der von NLLB-200 unterstützten Sprachen gibt es in onem Forschungspapier, das das Forschungsteam veröffentlicht hat. Or gekennzeichnet, ob die jeweiligen Sprachen von bisherigen Übersetzungsworkzeugen by Google beziehungsweise Microsoft unterstützt wird. Erstmals can NLLB-200 demnach aus and in Asturian (Northern Spain) and Schottisch-Gälisch übersetzen. Sprachen spoken as unterotherm in Deutschland became here Limburgs (Südniederfränkisch) und Schlesisch aufgeführt. A technical demonstration can be found on one of Meta AI’s own dedicated websites. Several Kinderbüchers can be auto-setzt, bislang aber nur Leeglich in one von 15 Sprachen. Die restlichen fast 200 sollen “bald” follow. Auf NLLB-200 based Technik can use meta AI in a self-selected work carried out by the Wikimedia Foundation of Editors and Editors of Wikipedia zur Verfügung Stellt.
(moh)