Google erweitert die Gemma-Familie von KI-Modellen
Google hat seine Gemma-Familie von KI-Modellen erweitert, indem das PaliGemma Vision-Language-Modell (VLM) eingeführt und Gemma 2, die nächste Generation von Gemma-Modellen auf Basis einer neuen Architektur, angekündigt wurde. Das Unternehmen hat auch den LLM Comparator als Open Source veröffentlicht, eine Ergänzung zu seinem Responsible Generative AI Toolkit.
Am 14. Mai kündigte Google die neuen Produkte an. PaliGemma wird als leistungsstarkes offenes VLM beschrieben, das von den Pali-3 Vision-Language-Modellen inspiriert ist und darauf abzielt, kleiner, schneller und stärker zu sein. PaliGemma ist für eine Vielzahl von Vision-Language-Aufgaben konzipiert, darunter Bild- und Videobeschreibungen, visuelle Fragestellungen, Textverständnis in Bildern, Objekterkennung und Objektsegmentierung.
Gemma 2, das in den kommenden Wochen offiziell eingeführt werden soll, verfügt über eine neue Architektur, die eine „bahnbrechende Leistung und Effizienz“ bietet. Mit 27 Milliarden Parametern bietet Gemma 2 eine Leistung vergleichbar mit Llama 3B bei weniger als der Hälfte der Größe. Ein effizientes Design reduziert die Bereitstellungskosten, wobei Gemma 2 auf weniger als der Hälfte der Rechenleistung vergleichbarer Modelle passt.
Google hat auch sein Responsible Generative AI Toolkit durch die Veröffentlichung des LLM Comparator als Open Source erweitert. Der LLM Comparator ist ein interaktives Datenvisualisierungstool, das Entwicklern dabei hilft, Modellbewertungen durchzuführen, indem es ihnen ermöglicht, Seitenbewertungen von Modellantworten zur Beurteilung von Qualität und Sicherheit durchzuführen.