AIモデルディレクトリ
世界中のトップ企業の最新AIモデルを見つけて比較しましょう。
AI Model Providers
Explore models from leading AI companies
Tencent Hunyuan AI
6 models
Google AI
6 models
ByteDance AI
5 models
Alibaba AI
5 models
Runway (RunwayML / Runway AI)
3 models
オープンAI
3 models
Bilibili AI
2 models
Black Forest Labs (BFL AI)
2 models
MiniMax AI:人工知能の未来を再定義する
2 models
Microsoft AI
1 model
NVIDIA AI
1 model
Sheng Shu
1 model
Lightricks
1 model
Lvmin Zhang (lllyasviel)
1 model
xAI
1 model
Coqui AI
1 model
Resemble AI
1 model
SkyReels AI
1 model
HeyGen AI
1 model
DeepSeek AI
1 model
Ideogram AI
1 model
Luma AI
1 model
Meta AI
1 model
Stability AI
1 model
Zhipu AI
1 model
KuaiShou AI
1 model
Recraft AI
0 models
PixVerse AI
0 models
Moonshot AI
0 models
Boson AIで無限の可能性を解き放つ
0 models
FLUX AI
0 models
Sesame AI:最も人間らしいAI音声体験
0 models
All AI Models (50)
Browse our comprehensive collection of AI models
Trellis
Trellisを活用した、統合的で高忠実度なマルチフォーマット3Dアセット生成フレームワーク
Qwen Image Layered
高度なレイヤー化アーキテクチャで、ビジュアルコンテンツの分析と処理方法を変革します
Sana video
Sana videoは、効率的で高品質なテキストからビデオおよび画像からビデオの生成をブラウザにもたらします。研究に裏打ちされたパフォーマンスで、最大1分のコヒーレントな720p、16fpsのクリップを作成します。Story321でSana videoを試して、洗練されたモーションコンテンツを迅速に出荷しましょう。
Vidu
Vidu AIビデオジェネレーター - テキストプロンプトから最大16秒の素晴らしいHDビデオを作成します。清華大学のU-ViTアーキテクチャを搭載したViduは、高度な物理シミュレーションと映画のようなカメラワークを備えた高品質の1080pビデオにあなたのアイデアを変換します。
Hailuo
Hailuo 2.3でAI動画生成のブレークスルーを体験してください。MiniMaxのフラッグシップモデルは、前例のないリアリズム、モーション精度、創造的な多様性を提供します。
DeepSeek-OCR
DeepSeek-OCRは、AIを活用した高度な光学文字認識モデルであり、複雑なレイアウト、手書き文字、チャート、および数式に特化した機能を備え、100以上の言語で画像やドキュメントからテキストを正確に抽出します。
LTX Video
LTXビデオは、高度なAIビデオ生成モデルであり、テキストプロンプトを、卓越したシーンの一貫性と柔軟なスタイル制御を備えた、高品質でまとまりのあるビデオコンテンツに変換します。
Gemma
Gemmaは、Google DeepMindの軽量なオープンソースAIモデルのファミリーであり、テキスト生成、質問応答、およびさまざまな言語タスクに強力なパフォーマンスを提供します。
Flux AI
Black Forest Labsによる高度なテキストから画像へのAIモデルシリーズ。超高解像度、ハイパーリアリスティックな出力、および卓越したプロンプト理解を特徴としています。
Runway Gen
Runway Gen-3 Alphaでビデオ生成の未来を体験してください。前例のない忠実度、一貫性、そしてモーション品質で、高度に制御可能で表現力豊かなビデオを作成できます。フォトリアリスティックなシーンから様式化されたアニメーションまで、Gen-3 Alphaは、高度なDirector Modeコントロールとマルチモーダル機能で、プログレードの結果を提供します。
Act-One
Act-OneはRunwayによるAI搭載のキャラクターアニメーションツールで、シンプルなビデオパフォーマンスを、複雑なモーションキャプチャ装置を必要とせずに、カメラ1台だけで表現力豊かな3Dキャラクターアニメーションに変換します。
IndexTTS
IndexTTSは、Bilibiliによる産業グレードのテキスト読み上げシステムであり、ゼロショット音声クローン、多言語サポート、および感情制御機能を備えた高品質の音声合成を提供します。
Seedance AI
Seedanceは、ByteDanceによるマルチショットAI動画生成モデルであり、テキストまたは画像を映画のような、モーションの一貫性のある動画シーケンスに変換します。
Seedream AI
Seedreamは、ByteDanceの次世代AI画像生成および編集モデルであり、驚くべきスピード、リアリズム、および一貫性で高品質のバイリンガルビジュアルを作成します。
Ray
Ray is an intelligent video generation model by Luma AI that produces cinematic, physics-aware, and multi-view consistent videos from natural language prompts.
GPT Image
GPT Image is an advanced multimodal model that transforms text and image inputs into high-quality, customizable visuals for creative and professional use.
FramePack
FramePackは、ビデオフレーム間の時間情報を圧縮して、よりスムーズでコヒーレントで効率的なビデオ生成を実現するAIモデルです。
XTTS
XTTS is a multilingual text-to-speech model by Coqui AI that generates lifelike, expressive, and natural voices from text in real time.
VGGT
VGGT empowers developers and researchers with a single forward pass to predict camera poses, depth maps, point clouds, and more—no external bundle adjustment required.
SkyReels
SkyReelsは、テキストプロンプトを、プロのカメラ制御とシーンの継続性を備えた、最大12秒の映画のようなフォトリアリスティックな動画クリップに変換する高度なAI動画生成モデルです。
Avatar IV
Avatar IVは、テキストプロンプトを、自然な動きと音声を備えた、まるで生きているかのような、感情豊かに表現するビデオアバターに変換する高度なAIモデルです。
Wan Alpha
Wan-Alphaは、シームレスな視覚効果と合成のために、透明な背景を持つ高品質のRGBAビデオを作成する高度なテキストからビデオへの生成モデルです。
Sora
Sora 2は、簡単なテキスト記述から、同期されたオーディオを備えた素晴らしいフォトリアリスティックなビデオを作成することにより、あなたの想像力を現実に変えます。画期的な物理シミュレーション、マルチショット機能、さらにはカメオで独自のAI生成ビデオに出演できるOpenAIの最先端AIモデルで、ビデオ作成の未来を体験してください。
GLM
GLM-4.6 is Zhipu AI's flagship model with 355B total parameters and 32B activated parameters. It delivers exceptional coding capabilities rivaling Claude Sonnet 4, features a 200K context window for handling complex tasks, enhanced intelligent search, and superior multilingual translation. Designed for developers, enterprises, and creators seeking cutting-edge AI performance.
Hunyuan 3D
Tencentの革新的なHunyuan 3Dで、あなたのアイデアや画像を素晴らしい、すぐに制作に使える3Dアセットに変えましょう。高度な拡散モデル、プロフェッショナルなテクスチャ合成、およびゲーム開発、製品設計、およびデジタルアートのためのシームレスなワークフロー統合を備えています。
Hunyuan Image
Hunyuan Image 3.0 transforms your ideas into stunning, photorealistic images with unprecedented prompt adherence and intelligent reasoning. Powered by 80B parameters and 64 experts MoE architecture, it delivers exceptional semantic accuracy and visual excellence. Experience the future of AI image generation with native multimodal understanding.
Hunyuan Video Generator
Hunyuan Video transforms your text descriptions into stunning, high-quality videos with exceptional physical accuracy and temporal consistency. Powered by a 13B parameter Unified Diffusion Transformer architecture, it generates up to 5-second videos at 720p resolution with superior motion dynamics and visual fidelity. Experience the future of video creation with advanced Flow Matching schedulers and parallel inference capabilities.
Kling AI
比類のない速度とクリエイティブなコントロールでシネマティックな動画を作成します。クリング 2.5 ターボは、映画グレードの鮮明さ、物理演算に基づいた動き、そしてシームレスなストーリーテリングのための開始/終了フレームなどの高度な機能を提供します。
Gemini
Google Gemini is Google’s flagship multimodal AI model that seamlessly understands text, images, audio, and video to deliver enterprise-grade reasoning and automation.
Veo
Veo 3.1 is Google DeepMind's flagship AI video generator delivering 4K visuals, native audio, and precise creative controls.
Minimax Music
Explore Minimax Music—your gateway to groundbreaking music experiences, events, and artists. Discover releases, join events, and connect with the Minimax Music community.
Hunyuan Gamecraftでゲーム開発の可能性を解き放つ
ゲームのアイデア、ストーリーライン、コードなどを生成します。ゲーム開発ワークフローを強化します。
Nano Banana - AIで言葉を素晴らしい画像に変換
Nano Bananaで次世代のAI画像作成を体験してください。キャラクターの一貫性からシームレスなビジュアルストーリーテリングまで、Nano BananaはAIで可能なことを再定義します。数秒で画像の生成と編集を開始します。
Runway Act-Oneで素晴らしいビデオを生成
テキスト、画像、ビデオを息を呑むような映画体験に変えましょう。
Eleven Musicで創造性を解き放て:AI搭載の音楽生成
あらゆるジャンルのロイヤリティフリーの音楽を作成します。クリエイター、企業、アーティストに最適です。
GPT-OSSで無限の可能性を解き放つ
比類のない柔軟性でGPTモデルをカスタマイズ、制御、デプロイします。
Genie 3でインタラクティブな世界を構築する
画像とビデオから制御可能な環境を作成します。あなたの想像力を解き放ちます。
OmniHumanでフォトリアリスティックな3Dアバターを解き放つ
制御可能で生き生きとしたデジタルヒューマンを作成します。アクセス可能なコード、モデル、およびデータセット。
ビジョンを解き放つ:Qwen Imageシリーズのご紹介
比類のないAIで画像を生成、理解、変換します。次世代のビジュアルアプリケーションを強化します。
完璧なイデオグラム文字で素晴らしいビジュアルを生成
完璧なテキストで画像を作成します。AIを活用したキャラクター生成で創造性を解き放ちます。
Runway Alephで楽々と素晴らしいビデオを生成
あなたの創造性を解き放ちます。テキスト、画像などから高品質のビデオを制作します。
Grok Imagineであなたの想像力を解き放て
比類のないスピードと創造的な制御で素晴らしいビジュアルを生成します。
Openvoiceでどんな声でも瞬時にクローン
多言語サポートと驚異的な精度で、比類のない音声クローンを解き放ちます。
FLUX.1 Kreaで無限の創造性を解き放つ
テキストから素晴らしいビジュアルを生成します。より高速なワークフロー、比類のない芸術的な制御。
Higgs Audioでサウンドの力を解き放つ
最先端のオーディオAIを構築します。高速な特徴抽出、シームレスなML統合。
Qwen3 Thinking でより深い洞察を解き放つ:次世代の推論 AI
これまでになく推論し、計画し、創造します。Qwen3 Thinking のパワーを体験してください。
Qwen3 MT でシームレスなコミュニケーションを実現
次世代の多言語 AI: 言語の壁を打ち破り、グローバルなリーチを拡大し、比類のない精度で翻訳します。
Hunyuan Worldで、驚くほど美しい3Dアセットを簡単に生成
テキストと画像を高品質の3Dモデルに変換します。創造的な可能性を解き放ちます。
Unleash Your Imagination with Gemini Image
Generate stunning visuals effortlessly. Powering creativity for developers & researchers.
ByteDance SeedでAIイノベーションを解き放つ:未来のための基盤モデル
強力な事前トレーニング済みのAIモデルを使用して、研究開発を加速します。より迅速にアクセス、統合、革新します。