دليل نماذج الذكاء الاصطناعي
اكتشف وقارن أحدث نماذج الذكاء الاصطناعي من كبرى الشركات في جميع أنحاء العالم.
AI Model Providers
Explore models from leading AI companies
Tencent Hunyuan AI
7 models
Alibaba AI
6 models
Google AI
6 models
ByteDance AI
5 models
Runway (RunwayML / Runway AI)
3 models
مفتوح الذكاء الاصطناعي
3 models
Lightricks
2 models
Bilibili AI
2 models
Resemble AI
2 models
Luma AI
2 models
Black Forest Labs (BFL AI)
2 models
مينيماكس للذكاء الاصطناعي: إعادة تعريف مستقبل الذكاء الاصطناعي
2 models
Microsoft AI
1 model
NVIDIA AI
1 model
Sheng Shu
1 model
Lvmin Zhang (lllyasviel)
1 model
xAI
1 model
Coqui AI
1 model
SkyReels AI
1 model
HeyGen AI
1 model
DeepSeek AI
1 model
Ideogram AI
1 model
Meta AI
1 model
Stability AI
1 model
Zhipu AI
1 model
KuaiShou AI
1 model
Meshy AI
0 models
Recraft AI
0 models
PixVerse AI
0 models
Moonshot AI
0 models
أطلق العنان للإمكانات اللامحدودة مع Boson AI
0 models
FLUX AI
0 models
سمسم AI: تجربة صوت الذكاء الاصطناعي الأكثر إنسانية
0 models
All AI Models (50)
Browse our comprehensive collection of AI models
LTX-2
اكتشف قوة LTX-2، نموذج إنشاء الفيديو الحديث المتوفر على story321. اختبر العرض السريع للغاية والجودة السينمائية والاتساق الذي لا مثيل له مع LTX-2.
Qwen Image Edit
اكتشف قوة Qwen Image Edit، نموذج تحرير الصور القائم على التعليمات والمتطور والمصمم للمبدعين والمطورين. قم بتحويل الصور بدقة باستخدام أوامر اللغة الطبيعية على story321.com.
Ray 3
أطلق العنان لمستقبل إنشاء المحتوى مع Ray 3، وهو نموذج الفيديو التوليدي الأكثر تقدمًا المتوفر على Story321. جرب سرعة غير مسبوقة وجودة واقعية وتحكم سينمائي في الحركة.
Chatterbox Turbo
اكتشف قوة Chatterbox Turbo، وهو نموذج توليد الصوت في الوقت الفعلي المتطور المصمم للذكاء الاصطناعي للمحادثة السلس. اختبر زمن انتقال منخفض للغاية وجودة صوت شبيهة بالبشر وقابلية تطوير لا مثيل لها لتطبيقاتك.
Hunyuan Motion
Hunyuan Motion هي مجموعة متطورة لإنشاء حركة بشرية ثلاثية الأبعاد من النص تحول اللغة الطبيعية إلى رسوم متحركة عالية الجودة للشخصيات تعتمد على الهيكل العظمي. استنادًا إلى محول انتشار بمليار معلمة وFlow Matching، يوفر Hunyuan Motion اتباعًا للتعليمات على أحدث طراز وحركة سلسة ومخرجات جاهزة للإنتاج مع سير عمل بسيط من المطالبة إلى الرسوم المتحركة مدعومًا بـ CLI وGradio. تعرف على المزيد وابدأ عبر المستودع الرسمي على [github.com](https://github.com/Tencent-Hunyuan/HY-Motion-1.0).
Trellis
إطار عمل موحد وعالي الدقة ومتعدد التنسيقات لإنشاء أصول ثلاثية الأبعاد مدعوم من تريليس
Qwen Image Layered
حوّل طريقة تحليل ومعالجة المحتوى المرئي الخاص بك باستخدام بنية الطبقات المتقدمة
Sana video
يجلب فيديو Sana إنشاء نص إلى فيديو وصورة إلى فيديو فعال وعالي الجودة إلى متصفحك. أنشئ مقاطع متماسكة بدقة 720 بكسل و16 إطارًا في الثانية تصل إلى دقيقة واحدة مع أداء مدعوم بالبحث. جرب فيديو Sana على Story321 وشحن محتوى حركة مصقول بسرعة.
Vidu
مُولِّد الفيديو بالذكاء الاصطناعي Vidu - أنشئ مقاطع فيديو مذهلة عالية الدقة تصل مدتها إلى 16 ثانية من مطالبات نصية. مدعوم ببنية U-ViT من جامعة تسينغ هوا، يحول Vidu أفكارك إلى مقاطع فيديو عالية الجودة بدقة 1080 بكسل مع محاكاة فيزيائية متقدمة وعمل كاميرا سينمائي.
Hailuo
جرب الطفرة في إنشاء الفيديو بالذكاء الاصطناعي مع Hailuo 2.3، النموذج الرائد لـ MiniMax الذي يقدم واقعية ودقة حركة ومرونة إبداعية غير مسبوقة.
DeepSeek-OCR
DeepSeek-OCR هو نموذج متقدم للتعرف الضوئي على الحروف مدعوم بالذكاء الاصطناعي يستخرج النصوص بدقة من الصور والمستندات بأكثر من 100 لغة، مع قدرات متخصصة للتخطيطات المعقدة والكتابة اليدوية والمخططات والصيغ الرياضية.
LTX Video
LTX Video هو نموذج متقدم لإنشاء الفيديو AI يحول مطالبات النص إلى محتوى فيديو عالي الجودة ومتماسك مع اتساق مشهد استثنائي وتحكم مرن في النمط.
Gemma
جيما هي عائلة من نماذج الذكاء الاصطناعي مفتوحة المصدر وخفيفة الوزن من Google DeepMind التي تقدم أداءً قويًا لإنشاء النصوص والإجابة على الأسئلة ومهام لغوية متنوعة.
Flux AI
Advanced text-to-image AI model series by Black Forest Labs, featuring ultra-high resolution, hyper-realistic output, and exceptional prompt understanding.
Runway Gen
جرب مستقبل توليد الفيديو مع Runway Gen-3 Alpha. أنشئ مقاطع فيديو معبرة وقابلة للتحكم بدرجة كبيرة بدقة واتساق وجودة حركة غير مسبوقة. من المشاهد الواقعية إلى الرسوم المتحركة الأنيقة، يقدم Gen-3 Alpha نتائج احترافية مع عناصر تحكم متقدمة في وضع المخرج (Director Mode) وقدرات متعددة الوسائط.
Act-One
Act-One هي أداة لتحريك الشخصيات مدعومة بالذكاء الاصطناعي من Runway تحول عروض الفيديو البسيطة إلى رسوم متحركة ثلاثية الأبعاد معبرة للشخصيات باستخدام كاميرا واحدة فقط، مما يلغي الحاجة إلى معدات التقاط الحركة المعقدة.
IndexTTS
IndexTTS هو نظام تحويل النص إلى كلام صناعي من Bilibili يقدم تركيبًا صوتيًا عالي الجودة مع استنساخ صوتي فوري ودعم متعدد اللغات وقدرات التحكم في المشاعر.
Seedance AI
Seedance هو نموذج لإنشاء فيديو متعدد اللقطات بالذكاء الاصطناعي من ByteDance يحول النص أو الصور إلى تسلسلات فيديو سينمائية ومتسقة الحركة.
Seedream AI
Seedream هو نموذج ByteDance للجيل التالي من الذكاء الاصطناعي لإنشاء الصور وتحريرها والذي ينشئ صورًا مرئية عالية الجودة وثنائية اللغة بسرعة وواقعية واتساق ملحوظ.
Ray
Ray is an intelligent video generation model by Luma AI that produces cinematic, physics-aware, and multi-view consistent videos from natural language prompts.
GPT Image
GPT Image is an advanced multimodal model that transforms text and image inputs into high-quality, customizable visuals for creative and professional use.
FramePack
FramePack هو نموذج للذكاء الاصطناعي يضغط المعلومات الزمنية عبر إطارات الفيديو لتحقيق إنشاء فيديو أكثر سلاسة وتماسكًا وكفاءة.
XTTS
XTTS is a multilingual text-to-speech model by Coqui AI that generates lifelike, expressive, and natural voices from text in real time.
VGGT
VGGT empowers developers and researchers with a single forward pass to predict camera poses, depth maps, point clouds, and more—no external bundle adjustment required.
SkyReels
SkyReels هو نموذج متقدم لتوليد الفيديو بالذكاء الاصطناعي يحول المطالبات النصية إلى مقاطع فيديو سينمائية وواقعية يصل طولها إلى 12 ثانية مع تحكم احترافي بالكاميرا واستمرارية المشهد.
Avatar IV
Avatar IV هو نموذج متقدم للذكاء الاصطناعي يحول المطالبات النصية إلى صور رمزية فيديو نابضة بالحياة ومعبرة عاطفياً بحركة وكلام طبيعيين.
Wan Alpha
Wan-Alpha is an advanced text-to-video generation model that creates high-quality RGBA videos with transparent backgrounds for seamless visual effects and compositing.
Sora
يحول سورا 2 خيالك إلى واقع من خلال إنشاء مقاطع فيديو مذهلة وواقعية مع صوت متزامن من أوصاف نصية بسيطة. جرب مستقبل إنشاء الفيديو مع نموذج الذكاء الاصطناعي الأكثر تقدمًا من OpenAI والذي يتميز بمحاكاة فيزيائية رائدة وقدرات لقطات متعددة وحتى القدرة على الظهور في مقاطع الفيديو التي يتم إنشاؤها بواسطة الذكاء الاصطناعي باستخدام كاميو.
GLM
GLM-4.6 is Zhipu AI's flagship model with 355B total parameters and 32B activated parameters. It delivers exceptional coding capabilities rivaling Claude Sonnet 4, features a 200K context window for handling complex tasks, enhanced intelligent search, and superior multilingual translation. Designed for developers, enterprises, and creators seeking cutting-edge AI performance.
Hunyuan 3D
حوّل أفكارك وصورك إلى أصول ثلاثية الأبعاد مذهلة وجاهزة للإنتاج باستخدام Hunyuan 3D الثوري من Tencent. يتميز بنماذج انتشار متقدمة وتجميع نسيج احترافي وتكامل سلس لسير العمل لتطوير الألعاب وتصميم المنتجات والفن الرقمي.
Hunyuan Image
Hunyuan Image 3.0 transforms your ideas into stunning, photorealistic images with unprecedented prompt adherence and intelligent reasoning. Powered by 80B parameters and 64 experts MoE architecture, it delivers exceptional semantic accuracy and visual excellence. Experience the future of AI image generation with native multimodal understanding.
Hunyuan Video Generator
Hunyuan Video transforms your text descriptions into stunning, high-quality videos with exceptional physical accuracy and temporal consistency. Powered by a 13B parameter Unified Diffusion Transformer architecture, it generates up to 5-second videos at 720p resolution with superior motion dynamics and visual fidelity. Experience the future of video creation with advanced Flow Matching schedulers and parallel inference capabilities.
Kling AI
Create cinematic videos with unprecedented speed and creative control. Kling 2.5 Turbo delivers film-grade clarity, physics-accurate motion, and advanced features like Start/End Frames for seamless storytelling.
Gemini
Google Gemini is Google’s flagship multimodal AI model that seamlessly understands text, images, audio, and video to deliver enterprise-grade reasoning and automation.
Veo
Veo 3.1 is Google DeepMind's flagship AI video generator delivering 4K visuals, native audio, and precise creative controls.
اكتشف مينيماكس ميوزيك: حيث يلتقي الابتكار بالصوت
استكشف مينيماكس ميوزيك - بوابتك إلى تجارب موسيقية وفعاليات وفنانين رائدة. اكتشف الإصدارات وانضم إلى الفعاليات وتواصل مع مجتمع مينيماكس ميوزيك.
أطلق العنان لإمكانيات تطوير الألعاب الخاصة بك مع Hunyuan Gamecraft
إنشاء أفكار للألعاب وقصص وأكواد والمزيد. عزز سير عمل تطوير لعبتك.
نانو بنانا - حوّل الكلمات إلى صور مذهلة باستخدام الذكاء الاصطناعي
جرب الجيل التالي من إنشاء الصور بالذكاء الاصطناعي مع نانو بنانا. من اتساق الشخصية إلى سرد القصص المرئية السلس، يعيد نانو بنانا تعريف ما هو ممكن باستخدام الذكاء الاصطناعي. ابدأ في إنشاء الصور وتحريرها في ثوانٍ.
إنشاء مقاطع فيديو مذهلة باستخدام Runway Act-One
حوّل النصوص والصور ومقاطع الفيديو إلى تجارب سينمائية تخطف الأنفاس.
أطلق العنان لإبداعك مع Eleven Music: توليد موسيقى مدعوم بالذكاء الاصطناعي
قم بإنشاء موسيقى خالية من حقوق الملكية في أي نوع. مثالي للمبدعين والشركات والفنانين.
أطلق العنان للإمكانات اللامحدودة مع GPT-OSS
قم بتخصيص نماذج GPT والتحكم فيها ونشرها بمرونة لا مثيل لها.
بناء عوالم تفاعلية مع Genie 3
إنشاء بيئات قابلة للتحكم من الصور ومقاطع الفيديو. أطلق العنان لخيالك.
أطلق العنان للصور الرمزية ثلاثية الأبعاد الواقعية مع OmniHuman
إنشاء شخصيات رقمية نابضة بالحياة وقابلة للتحكم. رمز ونماذج ومجموعات بيانات يمكن الوصول إليها.
أطلق العنان لرؤيتك: تقديم سلسلة صور Qwen
قم بإنشاء الصور وفهمها وتحويلها باستخدام ذكاء اصطناعي لا مثيل له. تشغيل الجيل التالي من التطبيقات المرئية.
إنشاء صور مذهلة بأحرف Ideogram مثالية
صمم صورًا بنص لا تشوبه شائبة. أطلق العنان لإبداعك من خلال إنشاء الأحرف المدعوم بالذكاء الاصطناعي.
إنشاء مقاطع فيديو مذهلة بسهولة مع Runway Aleph
أطلق العنان لإبداعك. قم بإنتاج فيديو عالي الجودة من النصوص والصور والمزيد.
أطلق العنان لخيالك مع Grok Imagine
قم بإنشاء صور مذهلة بسرعة لا مثيل لها وتحكم إبداعي.
استنساخ أي صوت على الفور باستخدام Openvoice
أطلق العنان لاستنساخ صوتي لا مثيل له مع دعم متعدد اللغات ودقة مذهلة.
أطلق العنان للإبداع اللامحدود مع FLUX.1 Krea
إنشاء صور مذهلة من النص. سير عمل أسرع، وتحكم فني لا مثيل له.
أطلق العنان لقوة الصوت مع Higgs Audio
بناء الذكاء الاصطناعي الصوتي المتطور. استخراج سريع للميزات، وتكامل سلس لـ ML.