首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· 为你推荐开源项目:Meridian——专属个人情报站!
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· Coze、Dify、FastGPT:哪款智能体平台最强?深度对比分析!
· 剪映克隆声音功能详解:剪映上线5秒“AI克隆音色”,一堆AI公司又要进入慢性死亡了...
· ChatGLM智谱清言
· 火山写作
· AI换脸:FaceFusion和Roop在线版修复,支持手机,平板,低配电脑!
· MOSS
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
人工智能
胎教级SO-VITS-SVC使用教程:人工智能生成歌曲
/Win11/Mac/Ubuntu)上安装配置Python3.10开发环境 v3u.cn/a_id_200 so-vits-svc安装 在你自定义的目录下使用Git命令
克
隆项目
音乐
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,语音识别数倍加速
懂技术的小伙伴也可以寻找其他替代方案,比如语音转文字模型 Whisper、文字翻译 GPT、声音
克
隆 + 生成音频 so-vits-svc、生成符合音频的嘴型视频 GeneFace++dengdeng。
语音
HeyGen
大模型
腾讯开源混元AI绘画大模型
具体安装和使用: 依赖关系和安装 首先
克
隆存储库: git clone https://github.com/tencent/HunyuanDiT cd HunyuanDiT
腾讯
混元
文生图
ComfyUI
解放AI生产力——为什么要使用ComfyUI
为了解决的这个问题,
斯
坦福的某个天才发明了controlnet,它可以通过不同的预处理方式,来控制图片的构成 这是一张用3D建模做的图片: 利用canny预处理,这张图片可以变成这样: 在这个插件面世之前
文生图
Stable Diffusion
【Stable Diffusion操作升级】Stable Diffusion 常用模型下载与说明
miniatureWorldStyle_v10:0.8> 小技巧 如果你下载了一个模型,却不知道怎么安装,打开这个网站 https://spell.novelai.dev/ 把你下载的模型拖进去,立
马
就会帮你解析
文生图
SD
开源
一个专业级 AI 聊天浏览器,开源了!
克
隆项目并跳转到指定文件夹: 2.
开源
大模型聊天
ComfyUI
StableDiffusion升级版SDXL:一键运行包ComfyUI和18G模型分享!
另外,尝试了一下昨天的关键词"一个在火星上骑着白
马
的宇航员" ,出效果的稳定性感觉上没有1.0版机器人高,但是也能出类似的图片。
comfyui
sdxl
文生图
数字人
数字人直播哪家强?百度、硅基、风平与闪剪四大AI数字人横向评测!
另外,AI合成的声音还有一种更高级的存在,就是
克
隆自己的声音,用自己
克
隆的声音匹配自己的数字人模型,口型匹配度非常高,数字人更容易达到以假乱真的水平,刘润的数字人短视频作品就是例子,难以识别真假。
数字人
数字分身
开源
截至2023年5月份业界支持中文大语言模型开源总结及商用协议分析
Vicuna模型是由多家研究机构合作开发的,包括UC Berkeley、CMU、
斯
坦福等。
大模型
生成式AI与大语言模型的区别
随着各自市场价值数十亿美元,这两种现象正在医疗保健、电子商务(例如亚
马
逊)、房地产以及其他行业的未来中勾勒出一片光明的前景。
生成式AI
大语言模型
区别
Agent
AI Agent行业深度:框架拆解、应用方向、应用领域及相关公司深度梳理!
使用多个外部工具:1)能
克
隆github仓库、启动其他agent、发言、发送推文和生成图片,支持所有矢量数据库和LLM提供商/文本到图片模型/浏览器。
AI
Agents
大模型
Agent
AI Agent行业深度:框架拆解、应用方向、应用领域及相关公司深度梳理
使用多个外部工具:1)能
克
隆github仓库、启动其他agent、发言、发送推文和生成图片,支持所有矢量数据库和LLM提供商/文本到图片模型/浏览器。
AI
Agent
大模型
人工智能
开源
7.1k Star!RAGFlow:最新开源OCR+深度文档理解的RAG引擎、大海捞针测试、降低幻觉、服务化API集成进业务!
克
隆仓库: 4.
OCR
RAG
开源
RAG
RAG——使用检索增强生成构建特定行业的大型语言模型
在你提到的另一个场景中,你在班迪普尔的路上开车时,遇到了一只大象过
马
路。
大模型
阿里
阿里&字节发表VividTalk,只需单张照片即可根据音频生成栩栩如生的人物说话头像视频
为了进一步增强嘴唇运动和更准确地建模,我们还选择了与嘴唇相关的地标并将其转换为高
斯
图,这是一种更紧凑和有效的表示。
VividTalk
视频
<
...
20
21
22
23
24
25
26
27
28
29
...
>
1
2
4
5
6
7
8
9
100