KABOOM! Oder KI-Boom?

KABOOM! Oder KI-Boom?

KABOOM! Oder KI-Boom?

Vielen Dank für die Einladung zur DOMOTEX-Messe in Hannover durch die DECOR UNION. Wir konnten hier unser neuestes KI-Tool vorstellen, das auch Ihre Homepage in KI-Suchmaschinen sichtbar macht!

Klassische Suchmaschinenoptimierung hilft für Sichtbarkeit bei KI-Systemen nicht wirklich. Wir haben u. a. eine Studie der Universität Toronto in unsere Entwicklung einfließen lassen. Die Ergebnisse können sich sehen lassen!

Und das durchweg positive Feedback nach unserer Präsentation zeigt uns: Wir sind auf dem richtigen Weg, KI für unsere Kunden EFFEKTIV einzusetzen. Nochmals herzlichen Dank an die DECOR UNION für die Einladung!

Das von uns entwickelte Tool können wir zurzeit nicht der Öffentlichkeit verfügbar machen, weil die Inspiration dazu durch unseren Kunden DECOR UNION geleistet wurde.

Seien Sie also gespannt!

 

KI-Musik für ein Museum

ki-musik-fuer-museum

Etwas komisch, wenn man Musik für ein Museum in „DJ STUDIO“ abmischt. Passt eigentlich nicht zusammen – aber am Ende passt es doch.

Für ein zukünftiges Projekt haben wir mithilfe von Musik-KI Hintergrundmusik für ein Museum erstellt, welches sich auf Ägypten spezialisiert hat.

Wir freuen uns, wenn diese Hintergrundmusik (darübergelegt wird ein Sprecher) demnächst online geht. Bis dahin können Sie unseren Entwurf hier anhören:

Es handelte sich hier um eine HINTERGRUNDMUSIK, die dann auf einer anderen Tonspur mit einem Sprecher (lauter) belegt wird.

Wir können aber auch „echte Musik“. Demnächst in den Playlisten wird es unsere neu kreierte Künstlerin „DaGirlX“ geben. Das ist echter NYC-Drill-Style, der aktuell und chartstauglich ist. Hören Sie mal rein:

Google hat heute Gemini 3 Pro veröffentlicht

Google veröffentlicht  Gemini 3 Pro

Am heutigen Dienstag hat Google mit Gemini 3 Pro die nächste Ausbaustufe seines KI-Flaggschiffs enthüllt. Nach Gemini 1 mit Fokus auf echte Multimodalität und Gemini 2 mit deutlich ausgebauten Fähigkeiten im logischen Denken, wird Gemini 3 nun als bislang leistungsfähigstes Modell des Konzerns positioniert. Die Vorabversion von Gemini 3 Pro steht ab sofort in verschiedenen Google-Diensten sowie für Entwickler und Unternehmen bereit.

Schon der erste Blick zeigt: Google legt die Messlatte deutlich höher. Gemini 3 übertrifft direkt zum Start sämtliche derzeit öffentlich verfügbaren KI-Modelle – darunter die bisherigen Top-Performer Grok 4.1 von xAI, Claude Sonnet 4.5 von Anthropic und natürlich GPT-5.1 von OpenAI. In LMArena übernimmt Gemini 3 Pro bereits die Führung.

Google-CEO Sundar Pichai unterstreicht das so: Monatlich werden KI-gestützte Übersichten an rund 2 Milliarden Menschen ausgespielt, Gemini wird von über 650 Millionen Nutzerinnen und Nutzern verwendet, mehr als 70 % der Cloud-Kundschaft nutzen Googles KI-Angebote und 13 Millionen Entwicklerinnen und Entwickler haben bereits mit den generativen Modellen gearbeitet – nur ein Ausschnitt dessen, was aktuell passiert.


Kernkompetenzen von Gemini 3 Pro

Google hebt für Gemini 3 Pro insbesondere folgende Stärken hervor:

Schlussfolgern & Benchmarks

  • 1.501 Punkte im LMArena-Ranking – aktuell Platz 1

  • 37,5 % bei “Humanity’s Last Exam” ohne Tools

  • 91,9 % im GPQA Diamond-Benchmark

  • 23,4 % bei MathArena Apex (neuer Bestwert im Mathe-Bereich)

  • 72,1 % bei SimpleQA Verified (faktische Genauigkeit)

Multimodale Fähigkeiten

  • 81 % bei MMMU-Pro

  • 87,6 % bei Video-MMMU

  • Kann Text, Bilder, Videos, Audio und Code gleichzeitig verarbeiten

  • Unterstützt Eingaben mit einem Kontextfenster von bis zu 1 Million Tokens

Programmierung

  • Elo 1.487 (Top-Wert in der WebDev Arena)

  • 54,2 % bei Terminal-Bench 2.0

  • 76,2 % bei SWE-bench Verified

  • Stärkerer Fokus auf Zero-Shot-Generierung für komplexe Web-Oberflächen

Agentische Funktionen

  • Verbessertes Langzeit-Planning (Top-Platzierung bei Vending-Bench 2)

  • Zuverlässigere Tool-Nutzung über längere Zeiträume

  • Unterstützung mehrstufiger, agentischer Workflows

Sicherheit & Robustheit

  • Reduzierte Tendenz zur unkritischen Zustimmung („yes-saying“)

  • Höhere Resistenz gegen Prompt-Injections

  • Mehr Schutz vor Cyberangriffen

  • Externe Evaluierungen durch Apollo, Vaultis und Dreadnode


Wo Gemini 3 Pro verfügbar ist

Gemini 3 Pro lässt sich über verschiedene Kanäle nutzen:

  • Gemini App (für Endanwender)

  • Google AI Pro und Ultra-Abos (KI-Modus in der Google Suche)

  • Google AI Studio und Vertex AI (für Entwickler-Workflows)

  • Google Antigravity (neue Plattform für agentische Anwendungen)

  • Gemini CLI

  • Drittplattformen: Cursor, GitHub, JetBrains, Manus, Replit

Ein zusätzlicher „Deep Think“-Modus mit nochmals gesteigerter Schlussfolgerungsleistung (u. a. 41,0 % bei Humanity’s Last Exam und 93,8 % bei GPQA Diamond) ist geplant und soll nach weiteren Sicherheitsprüfungen für Google AI Ultra-Abonnements freigeschaltet werden.

Und falls sich für Sie die ganze Meldung als neue Nachricht für „NERDS“ anhört, dann kontakten Sie uns. Denn: Wir erklären Ihnen, wie Sie KI in Ihrem Unternehmen effektiv und erfolgreich einsetzen können. Und natürlich arbeiten wir noch immer DSGVO-konform. Und das geht auch mit den KI-Systemen, wenn man weiß, wie man das System korrekt konfiguriert!

Meine Nacht mit Elon Musk: GROK 4 und GROK 4 heavy veröffentlicht!

Meine Nacht mit Elon Musk: GROK 4 und GROK 4 heavy veröffentlicht!

Letzte Nacht (10. Juli 2025) habe ich mir den X-Livestream von Elon Musk angeschaut, wo er die neuen KI-Modelle Grok 4 und Grok 4 Heavy von xAI vorgestellt hat. Das wurde eine lange Nacht! Typisch Musk – die Show begann mit über einer Stunde Verspätung.

Elon Musk schwärmte, dass die Modelle absolute Game-Changer sind, die auf Doktorandenniveau in Mathe, Physik und Chemie abliefern können. Grok 4 hat im ARC-AGI-2-Benchmark 16,2 % erreicht – fast doppelt so viel wie der bisherige Spitzenreiter Claude Opus 4. Elon Musk betonte, dass Grok 4 bei kniffligen Ingenieurfragen glänzt, wo Google und Co. schlappmachen. Und Grok 4 Heavy? Das ist die Turbo-Version für richtig harte Herausforderungen!
Das Ganze wurde möglich durch den Supercomputer Colossus mit 200.000 GPUs, der xAI (der Firma hinter GROK) einen bemerkenswerten Schub gibt. Ok. Große Worte kennt man von Musk und deshalb sind Pressekonferenzen immer vorsichtig zu genießen.

Und die Kosten? Grok 4 kostet 30 Dollar im Monat (heißt seit heute Abend „SUPERGROK“), Grok 4 Heavy satte 300 Dollar. Wir haben heute im Laufe des Tages die 30-Dollar-Version testen können und ich muss sagen: KRASS. Wir lassen immer das gleiche Briefing für eine App durch die verschiedenen KIs laufen und können somit vergleichen. Das Ergebnis und die Geschwindigkeit von GROK 4 sind wirklich atemberaubend.

Eine Anbindung von GROK 4 an z.b. Visual Studio Code ist nicht inbegriffen. Hier ist eine zusätzliche Investition für die API nötig:

GROK 4 - API - Kosten

Und seien Sie versichert: Wir testen regelmäßig, was es an Neuigkeiten im Bereich KI gibt. Schließlich wird auch ChatGPT demnächst eine neue Version vorstellen und der chinesische Konzern Bytedance (TikTok) mischt auch groß mit. Und da ergeben sich auch persönliche Kontakte mit KI-Firmen, wie z.b. Pythagora, die in DE noch unbekannt sind. Seien Sie gespannt – wir sind es auch.

Wir kreieren den passenden Sound für Ihr Unternehmen

Ihre Idee. Unser Sound. Ein Song, der begeistert.

Sie haben eine Botschaft, ein Gefühl oder ein besonderes Ereignis – wir machen daraus Musik. Mit professioneller DJ-Software, wie sie auch in internationalen Studios und auf den größten Festivalbühnen der Welt genutzt wird, komponieren und produzieren wir individuelle Songs, die auf ganzer Linie überzeugen. Egal ob für private Anlässe, Werbung, Social Media oder Image-Kampagnen: Unsere Produktionen treffen den richtigen Ton.

Was uns besonders macht? Wir kombinieren kreatives Musikhandwerk mit innovativer Technologie. Neben klassischer Musikproduktion setzen wir gezielt auf die Möglichkeiten von Künstlicher Intelligenz. So entstehen einzigartige Kompositionen, bei denen Klang, Emotion und Timing perfekt aufeinander abgestimmt sind – effizient, kreativ und auf den Punkt.

Lassen Sie sich überraschen, was alles möglich ist, wenn Mensch und Maschine gemeinsam Musik machen.
Wir bringen Ihre Idee zum Klingen.

Hier können Sie unser ganz aktuelles Beispiel anhören.

Wir kreieren den Sound für Ihr Unternehmen. Professionelle Technik und das Wissen um die perfekte Markenplatzierung sorgen für den passenden Sound.

Video-KI mit Auto-Sound: VEO 3 von Google.

Google DeepMind präsentierte auf der Google I/O 2025 mit Veo 3 die nächste Generation der KI-Videoerstellung . Das Modell kann Videos auf Basis von Text- oder Bildvorgaben erzeugen und gleichzeitig nativ Audiospuren generieren.

Veo 3 erstellt Videos in bis zu 4 K-Auflösung und verwendet eine Real-World-Physik-Engine, die Bewegungen, Licht- und Toneffekte besonders realistisch darstellt. Gleichzeitig produziert es Soundeffekte, Ambient-Noise und sogar Sprachpassagen direkt aus dem Prompt, sodass keine nachträgliche Audiobearbeitung nötig ist. Außerdem gibt es weitere ZAHLREICHE Möglichkeiten, die Generierung des Videos zu beeinflussen.

Veo 3 ist ZUR ZEIT über die Google Gemini App exklusiv für Abonnenten des Google AI Ultra-Plans verfügbar und kann über die Flow-Oberfläche getestet werden. Und zu jetzigen Sekunde in Deutschland noch nicht verfügbar. Wir hatten das gleiche jedoch mit CODEX 1 von ChatGPT: Innerhalb von nur zwei Tagen veränderte sich hier ebenfalls alles. Soll heißen: DRANBLEIBEN IST ANGESAGT! Wir bleiben dran!

Bevor ich Sie hier mit langweiligen Details aufhalte: Es gibt eine Website, die von Google als Hersteller erstellt wurde und atemberaubende Beispiele zeigt. Diese finden Sie hier:
https://deepmind.google/models/veo/

ChatGPT mit Bildgenerierung nich wirklich toll,

ChatGPT 4o jetzt ganz neu mit Bildgenerierung in allen Plänen kostenlos. Aber nicht wirklich toll.

Die neue Bildgenerierung in ChatGPT 4o ist zwar ein spannendes Feature, aber in der Praxis leider oft enttäuschend – vor allem, wenn es um Infografiken geht. Was auf den ersten Blick wie eine nette Visualisierung aussieht, entpuppt sich beim genaueren Hinsehen häufig als wenig brauchbar.

Ein zentrales Problem: die Beschriftungen. Textelemente in den Grafiken sind oft falsch, unvollständig oder schlichtweg sinnlos. Labels stimmen nicht mit den dargestellten Daten überein, Achsenbeschriftungen sind verdreht oder widersprüchlich, und manchmal sind Wörter sogar falsch geschrieben oder wirken, als wären sie zufällig ausgewählt worden. Das Ergebnis ist eher verwirrend als hilfreich.

Dazu kommt ein generelles Designproblem. Viele der generierten Infografiken wirken visuell unausgewogen – zu viel Text auf engem Raum, schlechte Farbwahl oder Elemente, die nicht zueinanderpassen. Man merkt schnell: Hier fehlt die Struktur und Klarheit, die eine gute Infografik auszeichnet.

Kurz gesagt: Für grobe Ideen oder schnelle Skizzen kann die Funktion okay sein. Wer aber Wert auf inhaltliche Korrektheit, saubere Beschriftungen und ein professionelles Layout legt, sollte lieber auf andere Tools zurückgreifen – oder gleich mit einem echten Grafikdesigner zusammenarbeiten.

Und wenn Sie uns folgen, dann wissen Sie, dass wir KI/AI lokal intensiv nutzen und selbst KI/AI nutzen. Trotzdem dürfen wir natürlich über auch wirklich negativen Output von KI/AI berichten. DONE!

ChatGPT mit Bildgenerierung nich wirklich toll,

MANUS – der neue KI-Agent aus China

Obwohl Manus als autonomer KI-Agent angekündigt wurde, der komplexe Aufgaben eigenständig erledigen kann, ist der Zugang derzeit stark eingeschränkt. Manus befindet sich in einer geschlossenen Beta-Phase, und Zugangscodes werden zu hohen Preisen auf Online-Marktplätzen gehandelt, was das Interesse, aber auch die Exklusivität unterstreichen soll. ​

Einige Experten äußern Bedenken hinsichtlich der tatsächlichen Fähigkeiten von Manus. Es wird vermutet, dass Manus auf bestehenden Modellen wie Claude 3.5 Sonnet von Anthropic basiert und nicht vollständig neu entwickelt wurde.

Diese Kombination aus begrenztem Zugang und gemischten Testergebnissen führt zu Spekulationen über die Authentizität und Zuverlässigkeit von Manus. Und obwohl wir gleich zum Launch von Manus eine Einladung erbeten haben, sind wir noch immer nicht freigeschaltet.

Wenn Sie Videos von MANUS auf YouTube anschauen, finden Sie nur Ausschnitte aus dem offiziellen Video von MANUS. Entweder ist das Ganze ein riesen Marketing-Gag oder das Modell ist wirklich so toll, wie einige KI-Experten vermuten. Lassen wir uns überraschen!

Schauen Sie selbst: https://manus.im/

NACHTRAG VOM 16.3.2025:
Ich habe heute eine persönliche Einladung zu MANUS erhalten und habe dem System eine beispielhafte Anfrage nach der Planung eines Urlaubs gestellt, so wie es auf deren Homepage als Beispiel gezeigt wird. Die Antwort von MANUS nach drei Minuten:

High system load has caused an internal server error. The task usage consumed for this task will be refunded. Please try again later or create a new task. (10091) Hilfe bei diesem Problem erhalten.

Gerne berichte ich, wenn MANUS erfolgreich eine Aufgabe erledigt hat;-)

 

MANUS.IM - die neue KI aus China

SORA – die innovative Video-KI von OpenAI – nun auch in der EU verfügbar

Nach langer Wartezeit ist SORA – die innovative Video-KI von OpenAI – nun auch in der EU verfügbar. Ab sofort können Inhaber eines ChatGPT Plus‑ oder Pro‑Plans Videos aus Texteingaben erstellen.

Kreative Ideen werden in kurze, beeindruckende Clips verwandelt – Plus-Abonnenten (20 Dollar pro Monat) erhalten beispielsweise Videos in bis zu 720 Pixel Auflösung, während Pro-Nutzer (200 Dollar im Monat) sogar Videos in 1080 Pixel Auflösung und mit längerer Dauer generieren können.

Das Tool nutzt modernste Diffusionstechnologie, um realistische Szenen zu erzeugen, und bietet einen zeitsparenden Weg, visuelle Konzepte als Text-zu-Video umzusetzen.

In unseren eigenen Tests konnten wir jedoch erkennen, dass die Darstellung von Text in den Videos bislang nicht wirklich funktioniert. Auch einige Details aus der vorgegebenen Videobeschreibung (den Prompts) wurden nicht zu 100 Prozent umgesetzt. Wir nutzen zurzeit u. a. RunwayLM, KLING AI und PIKA.ART und werden SORA damit in den nächsten Tagen ausführlich vergleichen. Seien Sie gespannt!

SORA – die innovative Video-KI von OpenAI – nun auch in der EU verfügbar.

Das Barrierefreiheitsstärkungsgesetz (BFSG) und die Umsetzung barrierefreier Webseiten zum 28. Juni 2025.

Wie bereits damals zum Thema DSGVO mitgeteilt, sind wir nur der Überbringer der Nachrichten, nicht jedoch der Schuldige!

Das Barrierefreiheitsstärkungsgesetz (BFSG) ist eine verbindliche gesetzliche Vorgabe, die sicherstellen soll, dass digitale Inhalte und Dienstleistungen für alle Menschen zugänglich sind. Es richtet sich insbesondere an Unternehmen und öffentliche Stellen und verpflichtet diese, ihre Webseiten und digitalen Produkte so zu gestalten, dass sie barrierefrei genutzt werden können.

Die Grundlage dafür bildet der European Accessibility Act (EAA), der in nationales Recht umgesetzt wurde. Barrierefreiheit bedeutet, dass Menschen mit Behinderungen digitale Inhalte ebenso leicht nutzen können wie Menschen ohne Einschränkungen. Dazu gehören nicht nur technische Anpassungen, sondern auch gestalterische und inhaltliche Änderungen, um eine gleichberechtigte Teilhabe zu gewährleisten. Webseiten, Anwendungen und Medienangebote müssen daher den Bedürfnissen aller Nutzergruppen gerecht werden.

Private sowie B2B-Angebote unterliegen nicht dem BFSG. Auch Kleinunternehmen (<10 Beschäftigte) und Unternehmen, die einen Jahresumsatz beziehungsweise eine Bilanzsumme von höchstens zwei Millionen Euro haben, sind nicht zur Einhaltung des BFSG verpflichtet. Eins schließt das Andere aus!