AI 模型目錄
探索與比較全球頂尖公司的最新 AI 模型。
AI Model Providers
Explore models from leading AI companies
Tencent Hunyuan AI
6 models
Google AI
6 models
ByteDance AI
5 models
Alibaba AI
5 models
Runway (RunwayML / Runway AI)
3 models
開放人工智能
3 models
Bilibili AI
2 models
Black Forest Labs (BFL AI)
2 models
MiniMax AI:重新定義人工智能的未來
2 models
NVIDIA AI
1 model
Sheng Shu
1 model
Lightricks
1 model
Lvmin Zhang (lllyasviel)
1 model
xAI
1 model
Coqui AI
1 model
Resemble AI
1 model
SkyReels AI
1 model
HeyGen AI
1 model
DeepSeek AI
1 model
Ideogram AI
1 model
Luma AI
1 model
Meta AI
1 model
Stability AI
1 model
Zhipu AI
1 model
KuaiShou AI
1 model
Recraft AI
0 models
PixVerse AI
0 models
Moonshot AI
0 models
使用 Boson AI 解鎖無限潛能
0 models
FLUX AI
0 models
芝麻AI:最富人情味的AI語音體驗
0 models
All AI Models (50)
Browse our comprehensive collection of AI models
Qwen Image Layered
透過先進的分層架構,轉變您分析和處理視覺內容的方式
Sana video
Sana 影片將高效、高品質的文字轉影片和圖片轉影片產生帶到您的瀏覽器。使用研究支援的效能創建連貫的 720p、16 fps 片段,最長可達一分鐘。在 Story321 上試用 Sana 影片,並快速發布精美的動作內容。
Vidu
Vidu AI 影片產生器 - 從文字提示創建長達 16 秒的令人驚豔的高清影片。Vidu 由清華大學的 U-ViT 架構提供支援,可將您的想法轉化為具有先進物理模擬和電影鏡頭運鏡的高品質 1080p 影片。
Hailuo
體驗海螺2.3在AI影片生成方面的突破,MiniMax的旗艦模型,提供前所未有的真實感、運動精度和創作多功能性。
DeepSeek-OCR
DeepSeek-OCR 是一款由 AI 驅動的先進光學字元辨識模型,能夠準確地從 100 多種語言的圖像和文件中提取文字,並具有處理複雜版面、手寫文字、圖表和數學公式的專門功能。
LTX Video
LTX 影片是一種先進的 AI 影片生成模型,可將文字提示轉換為高品質、連貫的影片內容,並具有卓越的場景一致性和靈活的風格控制。
Gemma
Gemma 是 Google DeepMind 開發的一系列輕量級開放原始碼 AI 模型,可為文字生成、問答和各種語言任務提供強大的效能。
Flux AI
Black Forest Labs 的高級文字生成圖像 AI 模型系列,具有超高解析度、超逼真輸出和卓越的提示詞理解能力。
Runway Gen
透過 Runway Gen-3 Alpha 體驗影片生成的未來。創建具有高度可控性、表現力的影片,並具有前所未有的保真度、一致性和運動品質。從照片寫實場景到風格化動畫,Gen-3 Alpha 透過先進的導演模式控制和多模式功能提供專業級的結果。
Act-One
Act-One 是 Runway 的一款 AI 角色動畫工具,它只需使用單個攝影機即可將簡單的影片表演轉換為富有表現力的 3D 角色動畫,無需複雜的動作捕捉設備。
IndexTTS
IndexTTS 是 Bilibili 開發的工業級文字轉語音系統,提供高品質的語音合成,具有零樣本聲音複製、多語言支援和情感控制功能。
Seedance AI
Seedance 是 ByteDance 的多鏡頭 AI 影片生成模型,可將文字或圖片轉換為電影般的、動作一致的影片序列。
Seedream AI
Seedream 是字節跳動的下一代 AI 圖像生成和編輯模型,它以驚人的速度、真實感和一致性創建高品質的雙語視覺效果。
Ray
Ray is an intelligent video generation model by Luma AI that produces cinematic, physics-aware, and multi-view consistent videos from natural language prompts.
GPT Image
GPT Image is an advanced multimodal model that transforms text and image inputs into high-quality, customizable visuals for creative and professional use.
FramePack
FramePack 是一種 AI 模型,可壓縮影片幀之間的時間資訊,以實現更流暢、更連貫且更高效的影片生成。
XTTS
XTTS is a multilingual text-to-speech model by Coqui AI that generates lifelike, expressive, and natural voices from text in real time.
VGGT
VGGT empowers developers and researchers with a single forward pass to predict camera poses, depth maps, point clouds, and more—no external bundle adjustment required.
SkyReels
SkyReels 是一種先進的 AI 影片生成模型,可將文字提示詞轉換為電影級、照片般逼真的影片片段,最長可達 12 秒,並具有專業的攝影機控制和場景連續性。
Avatar IV
Avatar IV 是一個先進的 AI 模型,可將文字提示轉換為栩栩如生、情感豐富的影片頭像,具有自然的動作和語音。
Wan Alpha
萬象 Alpha 是一種先進的文字轉影片生成模型,可創建具有透明背景的高品質 RGBA 影片,以實現無縫的視覺效果和合成。
Sora
Sora 2 透過從簡單的文字描述中創建令人驚嘆的、照片級真實的影片,並具有同步音訊,將您的想像力轉化為現實。使用 OpenAI 最先進的 AI 模型體驗影片創作的未來,該模型具有突破性的物理模擬、多鏡頭功能,甚至能夠透過 Cameo 在您自己的 AI 生成影片中擔任主角。
GLM
GLM-4.6 is Zhipu AI's flagship model with 355B total parameters and 32B activated parameters. It delivers exceptional coding capabilities rivaling Claude Sonnet 4, features a 200K context window for handling complex tasks, enhanced intelligent search, and superior multilingual translation. Designed for developers, enterprises, and creators seeking cutting-edge AI performance.
Hunyuan 3D
Transform your ideas and images into stunning, production-ready 3D assets with Tencent's revolutionary Hunyuan 3D. Featuring advanced diffusion models, professional texture synthesis, and seamless workflow integration for game development, product design, and digital art.
Hunyuan Image
Hunyuan Image 3.0 transforms your ideas into stunning, photorealistic images with unprecedented prompt adherence and intelligent reasoning. Powered by 80B parameters and 64 experts MoE architecture, it delivers exceptional semantic accuracy and visual excellence. Experience the future of AI image generation with native multimodal understanding.
Hunyuan Video Generator
Hunyuan Video transforms your text descriptions into stunning, high-quality videos with exceptional physical accuracy and temporal consistency. Powered by a 13B parameter Unified Diffusion Transformer architecture, it generates up to 5-second videos at 720p resolution with superior motion dynamics and visual fidelity. Experience the future of video creation with advanced Flow Matching schedulers and parallel inference capabilities.
Kling AI
Create cinematic videos with unprecedented speed and creative control. Kling 2.5 Turbo delivers film-grade clarity, physics-accurate motion, and advanced features like Start/End Frames for seamless storytelling.
Gemini
Google Gemini is Google’s flagship multimodal AI model that seamlessly understands text, images, audio, and video to deliver enterprise-grade reasoning and automation.
Veo
Veo 3.1 is Google DeepMind's flagship AI video generator delivering 4K visuals, native audio, and precise creative controls.
探索米尼馬克斯音樂:創新與音響的交匯
探索米尼馬克斯音樂——您通往突破性音樂體驗、活動和藝術家的入口。 發現發行、參加活動,並加入米尼馬克斯音樂社群。
使用混元 Gamecraft 釋放您的遊戲開發潛力
產生遊戲創意、故事情節、程式碼等。增強您的遊戲開發工作流程。
Nano Banana - 使用 AI 將文字轉換為令人驚豔的圖像
使用 Nano Banana 體驗下一代 AI 圖像創建。從角色一致性到無縫的視覺故事講述,Nano Banana 重新定義了 AI 的可能性。開始在幾秒鐘內生成和編輯圖像。
使用 Runway Act-One 製作令人驚豔的影片
將文字、圖像和影片轉化為令人嘆為觀止的電影體驗。
使用 Eleven Music 釋放您的創造力:AI 驅動的音樂生成
創作任何流派的免版稅音樂。非常適合創作者、企業和藝術家。
使用 GPT-OSS 解鎖無限潛能
使用無與倫比的彈性自訂、控制和部署 GPT 模型。
使用 Genie 3 構建互動世界
從圖像和影片創建可控制的環境。釋放您的想像力。
使用 OmniHuman 釋放逼真的 3D 頭像
創建可控的、栩栩如生的數字人類。可訪問的代碼、模型和數據集。
釋放您的視野:Qwen Image 系列介紹
使用無與倫比的 AI 生成、理解和轉換圖像。為下一代視覺應用程式提供動力。
使用完美的表意文字元生成令人驚嘆的視覺效果
製作具有完美文字的圖像。通過 AI 驅動的字元生成釋放您的創造力。
使用 Runway Aleph 輕鬆生成令人驚豔的影片
釋放您的創造力。從文字、圖像等製作高品質影片。
使用 Grok Imagine 釋放您的想像力
以無與倫比的速度和創意控制產生令人驚豔的視覺效果。
使用 Openvoice 即時複製任何聲音
透過多語言支援和驚人的準確性解鎖無與倫比的聲音複製。
使用 FLUX.1 Krea 釋放無限創意
從文字生成令人驚嘆的視覺效果。更快的工作流程,無與倫比的藝術控制。
使用 Higgs Audio 解鎖聲音的力量
構建尖端的音訊 AI。快速特徵提取、無縫 ML 整合。
使用 Qwen3 Thinking 解鎖更深入的洞察力:新一代推理 AI
以前所未有的方式進行推理、規劃和創造。體驗 Qwen3 Thinking 的力量。
使用 Qwen3 MT 解鎖無縫溝通
下一代多語言 AI:打破語言障礙,提升全球影響力,並以無與倫比的準確性進行翻譯。
使用混元世界輕鬆生成令人驚豔的 3D 資產
將文字和圖像轉換為高品質的 3D 模型。釋放您的創造潛力。
使用 Gemini Image 釋放您的想像力
輕鬆生成令人驚豔的視覺效果。為開發人員和研究人員提供創造力。
利用字節跳動 Seed 釋放 AI 創新:面向未來的基礎模型
通過強大的預訓練 AI 模型加速您的研究和開發。更快地訪問、集成和創新。
釋放視覺 AI 的力量:HiDream E1 隆重登場,實現前所未有的圖像理解
以前所未有的方式生成和理解圖像。賦能開發人員、研究人員和創新者。