KI-Modelle Verzeichnis
Entdecken und vergleichen Sie die neuesten KI-Modelle von Top-Unternehmen weltweit.
AI Model Providers
Explore models from leading AI companies
Tencent Hunyuan AI
6 models
Google AI
6 models
ByteDance AI
5 models
Alibaba AI
5 models
Runway (RunwayML / Runway AI)
3 models
OpenAI
3 models
Bilibili AI
2 models
Black Forest Labs (BFL AI)
2 models
MiniMax AI: Die Zukunft der künstlichen Intelligenz neu definieren
2 models
NVIDIA AI
1 model
Sheng Shu
1 model
Lightricks
1 model
Lvmin Zhang (lllyasviel)
1 model
xAI
1 model
Coqui AI
1 model
Resemble AI
1 model
SkyReels AI
1 model
HeyGen AI
1 model
DeepSeek AI
1 model
Ideogram AI
1 model
Luma AI
1 model
Meta AI
1 model
Stability AI
1 model
Zhipu AI
1 model
KuaiShou AI
1 model
Recraft AI
0 models
PixVerse AI
0 models
Moonshot AI
0 models
Erschließen Sie unbegrenztes Potenzial mit Boson AI
0 models
FLUX AI
0 models
Sesame AI: Das menschlichste KI-Spracherlebnis
0 models
All AI Models (50)
Browse our comprehensive collection of AI models
Qwen Image Layered
Transformieren Sie die Art und Weise, wie Sie visuelle Inhalte mit fortschrittlicher Layered Architecture analysieren und verarbeiten
Sana video
Sana Video bringt effiziente, hochwertige Text-zu-Video- und Bild-zu-Video-Generierung in deinen Browser. Erstelle kohärente 720p-, 16-fps-Clips bis zu einer Minute mit forschungsgestützter Leistung. Probiere Sana Video auf Story321 aus und liefere schnell hochwertige Bewegungsinhalte.
Vidu
Vidu AI Video Generator - Erstellen Sie atemberaubende HD-Videos mit bis zu 16 Sekunden Länge aus Textprompts. Vidu wird von der U-ViT-Architektur der Tsinghua-Universität angetrieben und verwandelt Ihre Ideen in hochwertige 1080p-Videos mit fortschrittlicher Physiksimulation und filmischer Kameraführung.
Hailuo
Erleben Sie den Durchbruch in der KI-Videogenerierung mit Hailuo 2.3, dem Flaggschiffmodell von MiniMax, das beispiellosen Realismus, Bewegungsgenauigkeit und kreative Vielseitigkeit bietet.
DeepSeek-OCR
DeepSeek-OCR ist ein fortschrittliches KI-gestütztes Modell zur optischen Zeichenerkennung, das Text aus Bildern und Dokumenten in über 100 Sprachen präzise extrahiert und über spezielle Funktionen für komplexe Layouts, Handschrift, Diagramme und mathematische Formeln verfügt.
LTX Video
LTX Video ist ein fortschrittliches KI-Video-Generierungsmodell, das Text-Prompts in hochwertige, kohärente Videoinhalte mit außergewöhnlicher Szenenkonsistenz und flexibler Stilkontrolle umwandelt.
Gemma
Gemma ist eine Familie von schlanken Open-Source-KI-Modellen von Google DeepMind, die eine hohe Leistung für Textgenerierung, Fragenbeantwortung und verschiedene Sprachaufgaben bieten.
Flux AI
Fortschrittliche Text-zu-Bild-KI-Modellreihe von Black Forest Labs mit ultrahoher Auflösung, hyperrealistischer Ausgabe und außergewöhnlichem Prompt-Verständnis.
Runway Gen
Erlebe die Zukunft der Videogenerierung mit Runway Gen-3 Alpha. Erstelle hochgradig steuerbare, ausdrucksstarke Videos mit beispielloser Wiedergabetreue, Konsistenz und Bewegungsqualität. Von fotorealistischen Szenen bis hin zu stilisierter Animation liefert Gen-3 Alpha professionelle Ergebnisse mit erweiterten Regisseurmodus-Steuerelementen und multimodalen Fähigkeiten.
Act-One
Act-One ist ein KI-gestütztes Charakteranimationswerkzeug von Runway, das einfache Videoperformances in ausdrucksstarke 3D-Charakteranimationen verwandelt, indem es nur eine einzige Kamera verwendet und so komplexe Motion-Capture-Ausrüstung überflüssig macht.
IndexTTS
IndexTTS ist ein industrietaugliches Text-to-Speech-System von Bilibili, das hochwertige Sprachsynthese mit Zero-Shot-Voice-Cloning, mehrsprachiger Unterstützung und Emotionskontrollfunktionen bietet.
Seedance AI
Seedance ist ein Multi-Shot-KI-Videogenerierungsmodell von ByteDance, das Text oder Bilder in filmische, bewegungskonsistente Videosequenzen umwandelt.
Seedream AI
Seedream ist ByteDance's KI-Bildgenerierungs- und Bearbeitungsmodell der nächsten Generation, das hochwertige, zweisprachige Visualisierungen mit bemerkenswerter Geschwindigkeit, Realismus und Konsistenz erstellt.
Ray
Ray is an intelligent video generation model by Luma AI that produces cinematic, physics-aware, and multi-view consistent videos from natural language prompts.
GPT Image
GPT Image is an advanced multimodal model that transforms text and image inputs into high-quality, customizable visuals for creative and professional use.
FramePack
FramePack ist ein KI-Modell, das zeitliche Informationen über Video-Frames hinweg komprimiert, um eine flüssigere, kohärentere und effizientere Videogenerierung zu erreichen.
XTTS
XTTS is a multilingual text-to-speech model by Coqui AI that generates lifelike, expressive, and natural voices from text in real time.
VGGT
VGGT empowers developers and researchers with a single forward pass to predict camera poses, depth maps, point clouds, and more—no external bundle adjustment required.
SkyReels
SkyReels ist ein fortschrittliches KI-Videogenerierungsmodell, das Textprompts in filmische, fotorealistische Videoclips mit einer Länge von bis zu 12 Sekunden mit professioneller Kamerasteuerung und Szenenkontinuität umwandelt.
Avatar IV
Avatar IV ist ein fortschrittliches KI-Modell, das Text-Prompts in lebensechte, emotional ausdrucksstarke Video-Avatare mit natürlichen Bewegungen und Sprache umwandelt.
Wan Alpha
Wan-Alpha ist ein fortschrittliches Text-zu-Video-Generierungsmodell, das hochwertige RGBA-Videos mit transparenten Hintergründen für nahtlose visuelle Effekte und Compositing erstellt.
Sora
Sora 2 verwandelt deine Fantasie in Realität, indem es atemberaubende, fotorealistische Videos mit synchronisiertem Audio aus einfachen Textbeschreibungen erstellt. Erlebe die Zukunft der Videoerstellung mit dem fortschrittlichsten KI-Modell von OpenAI, das bahnbrechende Physiksimulation, Multi-Shot-Funktionen und sogar die Möglichkeit bietet, mit Cameo in deinen eigenen KI-generierten Videos mitzuspielen.
GLM
GLM-4.6 is Zhipu AI's flagship model with 355B total parameters and 32B activated parameters. It delivers exceptional coding capabilities rivaling Claude Sonnet 4, features a 200K context window for handling complex tasks, enhanced intelligent search, and superior multilingual translation. Designed for developers, enterprises, and creators seeking cutting-edge AI performance.
Hunyuan 3D
Transform your ideas and images into stunning, production-ready 3D assets with Tencent's revolutionary Hunyuan 3D. Featuring advanced diffusion models, professional texture synthesis, and seamless workflow integration for game development, product design, and digital art.
Hunyuan Image
Hunyuan Image 3.0 transforms your ideas into stunning, photorealistic images with unprecedented prompt adherence and intelligent reasoning. Powered by 80B parameters and 64 experts MoE architecture, it delivers exceptional semantic accuracy and visual excellence. Experience the future of AI image generation with native multimodal understanding.
Hunyuan Video Generator
Hunyuan Video transforms your text descriptions into stunning, high-quality videos with exceptional physical accuracy and temporal consistency. Powered by a 13B parameter Unified Diffusion Transformer architecture, it generates up to 5-second videos at 720p resolution with superior motion dynamics and visual fidelity. Experience the future of video creation with advanced Flow Matching schedulers and parallel inference capabilities.
Kling AI
Erstelle kinoreife Videos mit beispiellosem Tempo und kreativer Kontrolle. Kling 2.5 Turbo liefert filmreife Klarheit, physikgenaue Bewegung und fortschrittliche Funktionen wie Start-/Endbilder für nahtloses Storytelling.
Gemini
Google Gemini is Google’s flagship multimodal AI model that seamlessly understands text, images, audio, and video to deliver enterprise-grade reasoning and automation.
Veo
Veo 3.1 is Google DeepMind's flagship AI video generator delivering 4K visuals, native audio, and precise creative controls.
Minimax Music
Explore Minimax Music—your gateway to groundbreaking music experiences, events, and artists. Discover releases, join events, and connect with the Minimax Music community.
Entfesseln Sie Ihr GameDev-Potenzial mit Hunyuan Gamecraft
Generieren Sie Spielideen, Handlungsstränge, Code und mehr. Beschleunigen Sie Ihren Spieleentwicklungs-Workflow.
Nano Banana – Verwandle Wörter mit KI in atemberaubende Bilder
Erleben Sie die nächste Generation der KI-Bilderstellung mit Nano Banana. Von der Charakterkonsistenz bis zum nahtlosen visuellen Storytelling definiert Nano Banana neu, was mit KI möglich ist. Beginnen Sie mit dem Generieren und Bearbeiten von Bildern in Sekundenschnelle.
Erzeuge beeindruckende Videos mit Runway Act-One
Verwandle Text, Bilder und Videos in atemberaubende Kinoerlebnisse.
Entfesseln Sie Ihre Kreativität mit Eleven Music: KI-gestützte Musikgenerierung
Erstellen Sie lizenzfreie Musik in jedem Genre. Perfekt für Kreative, Unternehmen und Künstler.
Erschließen Sie unbegrenztes Potenzial mit GPT-OSS
Passen Sie GPT-Modelle an, steuern Sie sie und stellen Sie sie mit beispielloser Flexibilität bereit.
Erstelle interaktive Welten mit Genie 3
Erstelle steuerbare Umgebungen aus Bildern und Videos. Entfessle deine Fantasie.
Entfesseln Sie fotorealistische 3D-Avatare mit OmniHuman
Erstellen Sie steuerbare, lebensechte digitale Menschen. Zugänglicher Code, Modelle und Datensätze.
Entfesseln Sie Ihre Vision: Einführung in die Qwen Image-Serie
Generieren, verstehen und transformieren Sie Bilder mit beispielloser KI. Die nächste Generation visueller Anwendungen wird unterstützt.
Erstellen Sie beeindruckende Grafiken mit perfekten Ideogramm-Zeichen
Erstellen Sie Bilder mit fehlerfreiem Text. Entfesseln Sie Ihre Kreativität mit KI-gestützter Zeichengenerierung.
Mühelos beeindruckende Videos mit Runway Aleph erstellen
Entfesseln Sie Ihre Kreativität. Produzieren Sie hochwertige Videos aus Text, Bildern und mehr.
Entfesseln Sie Ihre Fantasie mit Grok Imagine
Generieren Sie atemberaubende Grafiken mit beispielloser Geschwindigkeit und kreativer Kontrolle.
Klonen Sie jede Stimme sofort mit Openvoice
Erschließen Sie unübertroffenes Klonen von Stimmen mit mehrsprachiger Unterstützung und atemberaubender Genauigkeit.
Entfesseln Sie grenzenlose Kreativität mit FLUX.1 Krea
Generieren Sie atemberaubende Visualisierungen aus Text. Schnellere Workflows, beispiellose künstlerische Kontrolle.
Entfesseln Sie die Kraft des Klangs mit Higgs Audio
Erstellen Sie hochmoderne Audio-KI. Schnelle Feature-Extraktion, nahtlose ML-Integration.
Erschließen Sie tiefere Einblicke mit Qwen3 Thinking: Die KI der nächsten Generation für Schlussfolgerungen
Denken, planen und erstellen Sie wie nie zuvor. Erleben Sie die Leistungsfähigkeit von Qwen3 Thinking.
Nahtlose Kommunikation mit Qwen3 MT freischalten
Mehrsprachige KI der nächsten Generation: Überwinden Sie Sprachbarrieren, steigern Sie die globale Reichweite und übersetzen Sie mit beispielloser Genauigkeit.
Mühelos beeindruckende 3D-Assets mit Hunyuan World generieren
Verwandeln Sie Text und Bilder in hochwertige 3D-Modelle. Entfesseln Sie Ihr kreatives Potenzial.
Entfesseln Sie Ihre Fantasie mit Gemini Image
Generieren Sie mühelos atemberaubende Bilder. Förderung der Kreativität für Entwickler und Forscher.
Entfesseln Sie KI-Innovationen mit ByteDance Seed: Fundamentale Modelle für die Zukunft
Beschleunigen Sie Ihre Forschung und Entwicklung mit leistungsstarken, vortrainierten KI-Modellen. Greifen Sie schneller zu, integrieren Sie und innovieren Sie.
Entfesseln Sie visuelle KI: Einführung von HiDream E1 für ein noch nie dagewesenes Bildverständnis
Generieren und verstehen Sie Bilder wie nie zuvor. Entwickler, Forscher und Innovatoren stärken.