Anzeige
Anzeige
News

Koala: Neue Bild-KI generiert deutlich schneller als die Konkurrenz

Koreanische Forscher haben eine neue generative KI vorgestellt, die Bilder in Rekordzeit erstellen können soll. Wer das selbst testen möchte, kann Koala gegen konkurrierende Modelle antreten lassen. Ganz reibungslos funktioniert das allerdings noch nicht.

2 Min.
Artikel merken
Anzeige
Anzeige

Koala ist schneller als der Rest. (Foto: Dall-E 3 / t3n)

Forscher des Electronics and Telecommunications Research Institute (ETRI) in Südkorea haben fünf neue KI-Modelle vorgestellt. Darunter sticht besonders die Bild-KI Koala hervor.

Anzeige
Anzeige

Koala kann Bilder basierend auf Textbeschreibungen erstellen, indem es generative KI mit visueller Intelligenz kombiniert. So generiert Koala Bilder in nur zwei Sekunden – was es deutlich schneller macht als ähnliche Modelle auf dem Markt.

Die KI gibt es in drei Varianten, die sich in der Anzahl ihrer Parameter unterscheiden: Es gibt Versionen mit 1,7 Milliarden, 1 Milliarde und 700 Millionen Parametern. Weniger Parameter führen in der Regel zu schnellerer Generierungszeit und geringerem Rechenaufwand.

Anzeige
Anzeige

Deutlich schneller als die Konkurrenz

Um die Geschwindigkeit des Koala-Modells mit 700 Millionen Parametern zu demonstrieren, haben die Forscher des ETRI gegenüber Tech Xplore ein Beispiel präsentiert. Für den Prompt „Astronaut, der unter dem Mond auf dem Mars ein Buch liest“ erstellte Koala ein Bild in nur 1,6 Sekunden.

Im Vergleich dazu benötigte Dall-E 2 von OpenAI 12,3 Sekunden und Dall-E 3 sogar 13,7 Sekunden, während Karlo von Kakao Brain mit 3,8 Sekunden annähernd mithalten konnte.

Anzeige
Anzeige

Die Modelle sind kostenlos in der Hugging-Face-Umgebung verfügbar, wo Benutzer sie direkt mit Konkurrenzmodellen wie Dall-E, Stable Diffusion, Karlo und mehr vergleichen können. Nutzer können einfach einen Prompt eingeben und alle KI generieren gleichzeitig ein Bild.

In unseren Tests führte dies jedoch bei vielen Modellen zu Fehlermeldungen. Besser funktioniert es, wenn die Bilder nacheinander mit den unterschiedlichen Modellen generiert werden.

Anzeige
Anzeige

ETRI veröffentlicht weitere Modelle

Neben Koala hat das ETRI noch weitere KI-Modelle vorgestellt, zum Beispiel Ko-LLaVA, ein visuelles Sprachmodell, das visuelle Intelligenz mit Sprach-KI kombiniert. Dieses Modell ist in der Lage, Bilder und Videos zu analysieren und sich darüber auf Koreanisch auszutauschen.

Ein weiteres Modell ist KEByT5, das speziell entwickelt wurde, um die koreanischen Sprache zu verstehen und damit zu arbeiten. Es kann neue Wortprägungen und Worte, die nicht in den Trainingsdaten enthalten sind, verstehen.

Das Team betonte, dass das Kernpatent dieser Technologie auf der Wissensdestillation basiert. Diese Technik ermöglicht es kleineren Modellen, die Funktionen größerer Modelle zu übernehmen, indem sie mithilfe von KI Wissen effizient ansammeln.

Mehr zu diesem Thema
Fast fertig!

Bitte klicke auf den Link in der Bestätigungsmail, um deine Anmeldung abzuschließen.

Du willst noch weitere Infos zum Newsletter? Jetzt mehr erfahren

Anzeige
Anzeige
Schreib den ersten Kommentar!
Bitte beachte unsere Community-Richtlinien

Wir freuen uns über kontroverse Diskussionen, die gerne auch mal hitzig geführt werden dürfen. Beleidigende, grob anstößige, rassistische und strafrechtlich relevante Äußerungen und Beiträge tolerieren wir nicht. Bitte achte darauf, dass du keine Texte veröffentlichst, für die du keine ausdrückliche Erlaubnis des Urhebers hast. Ebenfalls nicht erlaubt ist der Missbrauch der Webangebote unter t3n.de als Werbeplattform. Die Nennung von Produktnamen, Herstellern, Dienstleistern und Websites ist nur dann zulässig, wenn damit nicht vorrangig der Zweck der Werbung verfolgt wird. Wir behalten uns vor, Beiträge, die diese Regeln verletzen, zu löschen und Accounts zeitweilig oder auf Dauer zu sperren.

Trotz all dieser notwendigen Regeln: Diskutiere kontrovers, sage anderen deine Meinung, trage mit weiterführenden Informationen zum Wissensaustausch bei, aber bleibe dabei fair und respektiere die Meinung anderer. Wir wünschen Dir viel Spaß mit den Webangeboten von t3n und freuen uns auf spannende Beiträge.

Dein t3n-Team

Melde dich mit deinem t3n Account an oder fülle die unteren Felder aus.

Bitte schalte deinen Adblocker für t3n.de aus!
Hallo und herzlich willkommen bei t3n!

Bitte schalte deinen Adblocker für t3n.de aus, um diesen Artikel zu lesen.

Wir sind ein unabhängiger Publisher mit einem Team von mehr als 75 fantastischen Menschen, aber ohne riesigen Konzern im Rücken. Banner und ähnliche Werbemittel sind für unsere Finanzierung sehr wichtig.

Schon jetzt und im Namen der gesamten t3n-Crew: vielen Dank für deine Unterstützung! 🙌

Deine t3n-Crew

Anleitung zur Deaktivierung
Artikel merken

Bitte melde dich an, um diesen Artikel in deiner persönlichen Merkliste auf t3n zu speichern.

Jetzt registrieren und merken

Du hast schon einen t3n-Account? Hier anmelden

oder
Auf Mastodon teilen

Gib die URL deiner Mastodon-Instanz ein, um den Artikel zu teilen.

Anzeige
Anzeige