Katalog Modeli AI
Odkryj i porównaj najnowsze modele AI od wiodących firm na całym świecie.
AI Model Providers
Explore models from leading AI companies
Tencent Hunyuan AI
7 models
Google AI
6 models
ByteDance AI
5 models
Alibaba AI
5 models
Runway (RunwayML / Runway AI)
3 models
OpenAI
3 models
Bilibili AI
2 models
Resemble AI
2 models
Luma AI
2 models
Black Forest Labs (BFL AI)
2 models
MiniMax AI: Nowa definicja przyszłości sztucznej inteligencji
2 models
Microsoft AI
1 model
NVIDIA AI
1 model
Sheng Shu
1 model
Lightricks
1 model
Lvmin Zhang (lllyasviel)
1 model
xAI
1 model
Coqui AI
1 model
SkyReels AI
1 model
HeyGen AI
1 model
DeepSeek AI
1 model
Ideogram AI
1 model
Meta AI
1 model
Stability AI
1 model
Zhipu AI
1 model
KuaiShou AI
1 model
Meshy AI
0 models
Recraft AI
0 models
PixVerse AI
0 models
Moonshot AI
0 models
Odblokuj Nieograniczony Potencjał z Boson AI
0 models
FLUX AI
0 models
Sesame AI: Najbardziej ludzkie doświadczenie głosu AI
0 models
All AI Models (50)
Browse our comprehensive collection of AI models
Ray 3
Unlock the future of content creation with Ray 3, the most advanced generative video model available on Story321. Experience unprecedented speed, photorealistic quality, and cinematic motion control.
Chatterbox Turbo
Odkryj moc Chatterbox Turbo, najnowocześniejszego modelu generowania głosu w czasie rzeczywistym, zaprojektowanego z myślą o płynnej konwersacyjnej sztucznej inteligencji. Doświadcz ultra-niskiego opóźnienia, wierności brzmienia zbliżonej do ludzkiej i niezrównanej skalowalności dla swoich aplikacji.
Hunyuan Motion
Hunyuan Motion to najnowocześniejszy pakiet do generowania ruchu ludzkiego 3D na podstawie tekstu, który przekształca język naturalny w wysokiej jakości animację postaci opartą na szkieletach. Zbudowany na miliardzie parametrów Diffusion Transformer i Flow Matching, Hunyuan Motion zapewnia najnowocześniejsze śledzenie instrukcji, płynny ruch i gotowe do produkcji wyjścia dzięki prostemu przepływowi pracy od polecenia do animacji, wspieranemu przez CLI i Gradio. Dowiedz się więcej i zacznij korzystać z oficjalnego repozytorium na [github.com](https://github.com/Tencent-Hunyuan/HY-Motion-1.0).
Trellis
Ujednolicona, wysokiej jakości i wieloformatowa platforma do generowania zasobów 3D oparta na Trellis
Qwen Image Layered
Zmień sposób analizy i przetwarzania treści wizualnych dzięki zaawansowanej architekturze warstwowej
Sana video
Sana video przenosi wydajne, wysokiej jakości generowanie wideo z tekstu i obrazu do Twojej przeglądarki. Twórz spójne klipy 720p, 16 klatek na sekundę do jednej minuty z wydajnością opartą na badaniach. Wypróbuj Sana video na Story321 i szybko dostarczaj dopracowane treści ruchome.
Vidu
Generator wideo AI Vidu - Twórz oszałamiające filmy HD o długości do 16 sekund na podstawie podpowiedzi tekstowych. Oparty na architekturze U-ViT z Uniwersytetu Tsinghua, Vidu przekształca Twoje pomysły w wysokiej jakości filmy 1080p z zaawansowaną symulacją fizyki i kinową pracą kamery.
Hailuo
Doświadcz przełomu w generowaniu wideo AI dzięki Hailuo 2.3, flagowemu modelowi MiniMax, który zapewnia niespotykany dotąd realizm, dokładność ruchu i kreatywną wszechstronność.
DeepSeek-OCR
DeepSeek-OCR to zaawansowany model optycznego rozpoznawania znaków oparty na sztucznej inteligencji, który dokładnie wyodrębnia tekst z obrazów i dokumentów w ponad 100 językach, ze specjalistycznymi możliwościami dla złożonych układów, pisma ręcznego, wykresów i wzorów matematycznych.
LTX Video
LTX Video to zaawansowany model generowania wideo AI, który przekształca prompty tekstowe w wysokiej jakości, spójne treści wideo z wyjątkową spójnością scen i elastyczną kontrolą stylu.
Gemma
Gemma is a family of lightweight, open-source AI models from Google DeepMind that deliver powerful performance for text generation, question answering, and various language tasks.
Flux AI
Advanced text-to-image AI model series by Black Forest Labs, featuring ultra-high resolution, hyper-realistic output, and exceptional prompt understanding.
Runway Gen
Doświadcz przyszłości generowania wideo dzięki Runway Gen-3 Alpha. Twórz wysoce kontrolowane, ekspresyjne filmy z niespotykaną dotąd wiernością, spójnością i jakością ruchu. Od fotorealistycznych scen po stylizowaną animację, Gen-3 Alpha zapewnia profesjonalne rezultaty dzięki zaawansowanym elementom sterującym trybu reżyserskiego (Director Mode) i możliwościom multi-modalnym.
Act-One
Act-One to narzędzie do animacji postaci oparte na sztucznej inteligencji firmy Runway, które przekształca proste występy wideo w ekspresyjne animacje postaci 3D za pomocą tylko jednej kamery, eliminując potrzebę skomplikowanego sprzętu do przechwytywania ruchu.
IndexTTS
IndexTTS to przemysłowej klasy system zamiany tekstu na mowę firmy Bilibili, który zapewnia wysokiej jakości syntezę głosu z klonowaniem głosu bez dodatkowego treningu, obsługą wielu języków i możliwościami kontroli emocji.
Seedance AI
Seedance to model generowania wideo AI wieloujęciowego firmy ByteDance, który przekształca tekst lub obrazy w kinowe, spójne pod względem ruchu sekwencje wideo.
Seedream AI
Seedream to model generowania i edycji obrazów AI nowej generacji od ByteDance, który tworzy wysokiej jakości, dwujęzyczne wizualizacje z niezwykłą szybkością, realizmem i spójnością.
Ray
Ray is an intelligent video generation model by Luma AI that produces cinematic, physics-aware, and multi-view consistent videos from natural language prompts.
GPT Image
GPT Image is an advanced multimodal model that transforms text and image inputs into high-quality, customizable visuals for creative and professional use.
FramePack
FramePack to model AI, który kompresuje informacje czasowe między klatkami wideo, aby osiągnąć płynniejsze, bardziej spójne i wydajne generowanie wideo.
XTTS
XTTS is a multilingual text-to-speech model by Coqui AI that generates lifelike, expressive, and natural voices from text in real time.
VGGT
VGGT empowers developers and researchers with a single forward pass to predict camera poses, depth maps, point clouds, and more—no external bundle adjustment required.
SkyReels
SkyReels to zaawansowany model generowania wideo AI, który przekształca podpowiedzi tekstowe w kinowe, fotorealistyczne klipy wideo o długości do 12 sekund z profesjonalną kontrolą kamery i ciągłością scen.
Avatar IV
Avatar IV to zaawansowany model AI, który przekształca polecenia tekstowe w realistyczne, ekspresyjne emocjonalnie awatary wideo z naturalnym ruchem i mową.
Wan Alpha
Wan-Alpha is an advanced text-to-video generation model that creates high-quality RGBA videos with transparent backgrounds for seamless visual effects and compositing.
Sora
Sora 2 przekształca Twoją wyobraźnię w rzeczywistość, tworząc oszałamiające, fotorealistyczne filmy wideo ze zsynchronizowanym dźwiękiem na podstawie prostych opisów tekstowych. Doświadcz przyszłości tworzenia wideo dzięki najbardziej zaawansowanemu modelowi AI OpenAI, oferującemu przełomową symulację fizyki, możliwości wielokrotnych ujęć, a nawet możliwość wystąpienia w swoich własnych filmach wideo generowanych przez AI dzięki Cameo.
GLM
GLM-4.6 is Zhipu AI's flagship model with 355B total parameters and 32B activated parameters. It delivers exceptional coding capabilities rivaling Claude Sonnet 4, features a 200K context window for handling complex tasks, enhanced intelligent search, and superior multilingual translation. Designed for developers, enterprises, and creators seeking cutting-edge AI performance.
Hunyuan 3D
Przekształć swoje pomysły i obrazy w oszałamiające zasoby 3D gotowe do produkcji dzięki rewolucyjnemu Hunyuan 3D firmy Tencent. Zawiera zaawansowane modele dyfuzyjne, profesjonalną syntezę tekstur i bezproblemową integrację przepływu pracy do tworzenia gier, projektowania produktów i sztuki cyfrowej.
Hunyuan Image
Hunyuan Image 3.0 transforms your ideas into stunning, photorealistic images with unprecedented prompt adherence and intelligent reasoning. Powered by 80B parameters and 64 experts MoE architecture, it delivers exceptional semantic accuracy and visual excellence. Experience the future of AI image generation with native multimodal understanding.
Hunyuan Video Generator
Hunyuan Video transforms your text descriptions into stunning, high-quality videos with exceptional physical accuracy and temporal consistency. Powered by a 13B parameter Unified Diffusion Transformer architecture, it generates up to 5-second videos at 720p resolution with superior motion dynamics and visual fidelity. Experience the future of video creation with advanced Flow Matching schedulers and parallel inference capabilities.
Kling AI
Twórz filmowe filmy z bezprecedensową prędkością i kontrolą kreatywną. Kling 2.5 Turbo zapewnia filmową klarowność, realistyczny ruch oparty na fizyce i zaawansowane funkcje, takie jak Klatki Początkowe i Końcowe dla płynnego opowiadania historii.
Gemini
Google Gemini is Google’s flagship multimodal AI model that seamlessly understands text, images, audio, and video to deliver enterprise-grade reasoning and automation.
Veo
Veo 3.1 is Google DeepMind's flagship AI video generator delivering 4K visuals, native audio, and precise creative controls.
Odkryj Minimax Music: Gdzie Innowacja Spotyka Się z Dźwiękiem
Odkryj Minimax Music – Twoją bramę do przełomowych muzycznych doświadczeń, wydarzeń i artystów. Odkrywaj wydawnictwa, dołączaj do wydarzeń i łącz się ze społecznością Minimax Music.
Uwolnij swój potencjał GameDev dzięki Hunyuan Gamecraft
Generuj pomysły na gry, fabuły, kod i nie tylko. Doładuj swój proces tworzenia gier.
Nano Banana - Przekształć słowa w oszałamiające obrazy dzięki AI
Poznaj nową generację tworzenia obrazów AI dzięki Nano Banana. Od spójności postaci po płynne opowiadanie historii wizualnych, Nano Banana redefiniuje to, co jest możliwe dzięki AI. Zacznij generować i edytować obrazy w kilka sekund.
Generuj oszałamiające filmy wideo dzięki Runway Act-One
Przekształć tekst, obrazy i wideo w zapierające dech w piersiach kinowe wrażenia.
Uwolnij swoją kreatywność dzięki Eleven Music: Generowanie muzyki oparte na sztucznej inteligencji
Twórz muzykę wolną od tantiem w dowolnym gatunku. Idealne dla twórców, firm i artystów.
Odblokuj Nieograniczony Potencjał z GPT-OSS
Dostosuj, kontroluj i wdrażaj modele GPT z niezrównaną elastycznością.
Buduj interaktywne światy z Genie 3
Twórz kontrolowane środowiska z obrazów i wideo. Uwolnij swoją wyobraźnię.
Uwolnij Fotorealistyczne Awatary 3D z OmniHuman
Twórz kontrolowane, realistyczne cyfrowe postacie. Dostępny kod, modele i zbiory danych.
Uwolnij swoją wizję: Przedstawiamy serię Qwen Image
Generuj, rozumiej i przekształcaj obrazy dzięki niezrównanej sztucznej inteligencji. Zasilanie nowej generacji aplikacji wizualnych.
Ideogram Character
Craft images with flawless text. Unleash your creativity with AI-powered character generation.
Generuj Oszałamiające Filmy Bez Wysiłku z Runway Aleph
Uwolnij swoją kreatywność. Produkuj wysokiej jakości wideo z tekstu, obrazów i nie tylko.
Uwolnij swoją wyobraźnię dzięki Grok Imagine
Generuj oszałamiające wizualizacje z niezrównaną szybkością i kreatywną kontrolą.
Klonuj dowolny głos natychmiast dzięki Openvoice
Odblokuj niezrównane klonowanie głosu dzięki obsłudze wielu języków i oszałamiającej dokładności.
Uwolnij nieograniczoną kreatywność dzięki FLUX.1 Krea
Generuj oszałamiające wizualizacje z tekstu. Szybsze przepływy pracy, niezrównana kontrola artystyczna.
Odkryj moc dźwięku z Higgs Audio
Buduj najnowocześniejsze audio AI. Szybka ekstrakcja cech, bezproblemowa integracja ML.
Odblokuj głębsze spostrzeżenia dzięki Qwen3 Thinking: AI rozumowania nowej generacji
Rozumuj, planuj i twórz jak nigdy dotąd. Doświadcz mocy Qwen3 Thinking.
Odblokuj płynną komunikację dzięki Qwen3 MT
Wielojęzyczna sztuczna inteligencja nowej generacji: Przełam bariery językowe, zwiększ globalny zasięg i tłumacz z niezrównaną dokładnością.