学习中心
掌握 AI 创作技巧,了解各模型特点
文生图
输入文字,生成精美图片
FLUX.2 Flex
Black Forest Labs
Black Forest Labs最新模型,文字渲染能力强化,可调节推理步数和引导系数。精细控制生成过程,专业级输出。
FLUX.1 Dev
Black Forest Labs
画质天花板,细节极致。适合海报、概念图、需要高品质输出的作品。
FLUX.1 Schnell
Black Forest Labs
闪电出图,2秒搞定。快速验证创意、批量生成素材的首选。
Qwen Image 2512
Alibaba (通义千问)
阿里通义最新图像生成。文字渲染优化、自然纹理细腻、人物生成逼真。支持LoRA训练,性价比高。
Fast SDXL
Stability AI
风格百变,提示词理解强。插画、动漫、写实都能驾驭。
HiDream I1
HiDream
创意爆棚,脑洞大开。适合艺术创作、抽象表达、探索性作品。
文生视频
用文字描述,直接生成视频
Veo 3.1
Google DeepMind
Google旗舰视频模型,原生音频生成、对话唇形同步、物理模拟逼真。支持720p/1080p输出,4-8秒时长可选。电影级画质,prompt遵循能力强。
Sora 2
OpenAI
OpenAI旗舰视频模型,同步对话+音效生成。支持Cameo角色系统、多镜头连贯、先进物理引擎。1080p输出,最长25秒(Pro),风格从超写实到动画全覆盖。
Kling 2.6 Pro
Kuaishou (快手)
顶级图生视频,电影级画质、流畅动作、原生音频生成。人物一致性最强,复杂场景和多角色故事的首选。
Video-01
MiniMax (海螺)
国产之光,动作流畅自然。短视频、产品展示、社交内容的可靠选择。
Kling 1.5 Pro
Kuaishou (快手)
人物一致性最强,电影级画质。拍人物、讲故事、做广告片的首选。
HunyuanVideo 1.5
Tencent (腾讯)
腾讯最新最强视频模型。理解力强,复杂提示词也能准确执行。适合有明确创意的项目,国产可靠。
HunyuanVideo
Tencent (腾讯)
理解力强,复杂提示词也能准确执行。适合有明确创意的项目。
Mochi 1
Genmo
自然场景大师,物理运动逼真。风景、自然、环境类视频效果出众。
LTX-2 19B
Lightricks
支持原生音频生成的大参数模型。文生视频、图生视频、视频扩展全支持,可搭配LoRA自定义风格。
Wan 2.6
Alibaba (阿里)
阿里最新视频模型,文生视频和图生视频双模式。性价比高,出图稳定,国产可靠选择。
图生视频
让静态图片动起来
Veo 3.1
Google DeepMind
Google最新视频模型,支持原生音频生成、多图参考和首尾帧控制。电影级画质,8秒1080p视频,物理效果逼真,对话唇形同步。
Kling 1.5 Pro
Kuaishou (快手)
电影级动态,支持首尾帧。让静态图片优雅地动起来,过渡自然流畅。
Luma Ray 2
Luma AI
写实风格王者,运动连贯。产品展示、人像动态、需要真实感的首选。
Video-01 I2V
MiniMax (海螺)
快速稳定,效果可靠。批量处理、快速预览、赶项目时的效率之选。
文生语音
文字秒变语音
Dia TTS
Nari Labs
对话神器,支持多角色和情感表达。配音、有声书、角色对白的最佳选择。
F5 TTS
F5-TTS
音质细腻,表现力强。适合有声读物、高品质配音、专业级输出。
Speech-02 HD
MiniMax
高清快速,清晰自然。日常配音、视频旁白、快速出活的首选。
快速选择指南
提示词写作技巧
描述要具体
不要「一只猫」,要「一只橘色的胖猫躺在阳光下的窗台上」
分层次写
主体 → 动作 → 场景 → 光线 → 风格
善用 AI 润色
点击「AI 润色」自动补充专业词汇
多试几次
同样的提示词,不同模型效果差异很大