Neues aus der Welt der KI vom 11.06.25

Die Entwicklungen im Bereich der generativen Künstlichen Intelligenz schreiten in rasantem Tempo voran. Neue Werkzeuge, Funktionen und Anwendungen erscheinen in kurzen Abständen und verändern die Möglichkeiten digitaler Kommunikation, Produktion und Interaktion grundlegend. Der Überblick „Neues aus der Welt der KI“ bündelt aktuelle Trends und stellt ausgewählte Technologien vor, die in jüngster Zeit Aufmerksamkeit erregt haben – unabhängig von konkreten Anwendungsbereichen wie Bildung oder Verwaltung.

Sprach- und Bildverarbeitung: KI wird gesprächiger – und menschlicher

Eröffnet wurde die Veranstaltung mit einer Demonstration des neuen Advanced Voice Mode von ChatGPT. Dieser erlaubt es, nahezu in Echtzeit mit dem Sprachmodell zu kommunizieren – inklusive Simultanübersetzung und situationsbezogener Interaktion. Besonders eindrucksvoll: die mobile Anwendung, bei der KI gesprochene Sprache analysiert, visuelle Informationen über die Smartphone-Kamera erkennt und direkt reagiert.

Ergänzend wurden Tools vorgestellt, mit denen KI Inhalte auf Bildschirmen analysiert und kommentiert. Genannt wurden:

KI erzeugt Emotionen, Bilder und Avatare – zwischen kreativer Innovation und kritischer Reflexion

Ein weiterer Aspekt, der zur Sprache kam, war die Bildgenerierung mit Flux im BFL Playground (https://playground.bfl.ai/image/generate). Das KI-Modell Flux ermöglicht die sehr schnelle und präzise Erzeugung detailreicher Bilder. Nutzende können dabei gezielt Stilrichtungen, Inhalte und Kompositionen bestimmen. In der Diskussion wurde betont, wie faszinierend diese kreativen Möglichkeiten sind – aber auch, dass sie Fragen nach der Authentizität digitaler Bilder und der Urheberschaft in der digitalen Kunst aufwerfen.

Ein weiterer Fokus lag auf ElevenLabs (https://elevenlabs.io/), einer Plattform zur Sprachsynthese mit emotionaler Stimmfärbung. In einer Live-Demo wurde gezeigt, wie sich Texte mit Emotionen wie Aufregung, Angst oder Ironie vertonen lassen. Die Stimmen klingen dabei erstaunlich menschlich – was kreative Möglichkeiten eröffnet, aber auch Risiken birgt, etwa durch Deepfakes oder telefonischen Betrug.

Auch Googles VEO3 https://deepmind.google/models/veo/ – eine Plattform für KI-basierte Videoproduktion – wurde angesprochen. Dabei können Videos mit realistisch wirkenden, KI-gesteuerten Personen erstellt werden, inklusive passender Audiospur. In der Diskussion wurde deutlich: Erstmals sind diese Videos kaum noch von echten Videoaufnahmen zu unterscheiden. Das wirft grundlegende gesellschaftliche und pädagogische Fragen auf – etwa zur Glaubwürdigkeit medialer Inhalte, zum Umgang mit potenzieller Desinformation und zur Vermittlung kritischer Medienkompetenz.

Ergänzend wurde HeyGen (https://erwachsenenbildung.digital/?s=heygen&ct_post_type=post%3Apage) vorgestellt – ein Dienst, der es ermöglicht, aus Texten realistisch animierte Videos mit KI-Avataren zu erstellen. Besonders hervorzuheben ist die einfache Bedienung und Mehrsprachigkeit. Auch hier wurde die Frage diskutiert, wie solche Inhalte kenntlich gemacht und medienethisch eingeordnet werden sollten.

Die Veranstaltung machte deutlich: Die Entwicklung generativer KI schreitet rasant voran. Neue Tools werden nicht nur leistungsfähiger, sondern auch nutzerfreundlicher und emotional überzeugender. Gleichzeitig wächst die gesellschaftliche Verantwortung, mit diesen Technologien bewusst und reflektiert umzugehen.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert