首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· AI声音克隆 | 最全最简教程(权威版)
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· 大模型时代 AI 技术在金融行业的创新应用
· 国内法律类大模型介绍
· 宁德核电推出全球参数量最大的核工业大模型|InfoQ 独家
· 自己电脑上跑大语言模型(LLM)要多少内存?
· 40个值得收藏的AI prompt提示词,帮助你更好地思考问题,做出更加准确地商业决策,让你无往不利
· 【语音领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
· 大模型评测新思路:弱智吧精华问题大全
· 划重点!全网最全AI数字人工具合集!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
世界上最流行(github排名高)的开源移动机器人的操作系统ROS开源了!!
端口连接器 § § 港口位置 § § ROBOTIS OP3 不再具有 3.5 毫米麦
克
风和音频插孔
ROS
机器人
开源模型
人工智能
胎教级SO-VITS-SVC使用教程:人工智能生成歌曲
/Win11/Mac/Ubuntu)上安装配置Python3.10开发环境 v3u.cn/a_id_200 so-vits-svc安装 在你自定义的目录下使用Git命令
克
隆项目
音乐
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,语音识别数倍加速
懂技术的小伙伴也可以寻找其他替代方案,比如语音转文字模型 Whisper、文字翻译 GPT、声音
克
隆 + 生成音频 so-vits-svc、生成符合音频的嘴型视频 GeneFace++dengdeng。
语音
HeyGen
大模型
腾讯开源混元AI绘画大模型
具体安装和使用: 依赖关系和安装 首先
克
隆存储库: git clone https://github.com/tencent/HunyuanDiT cd HunyuanDiT
腾讯
混元
文生图
ComfyUI
解放AI生产力——为什么要使用ComfyUI
为了解决的这个问题,
斯
坦福的某个天才发明了controlnet,它可以通过不同的预处理方式,来控制图片的构成 这是一张用3D建模做的图片: 利用canny预处理,这张图片可以变成这样: 在这个插件面世之前
文生图
Stable Diffusion
【Stable Diffusion操作升级】Stable Diffusion 常用模型下载与说明
miniatureWorldStyle_v10:0.8> 小技巧 如果你下载了一个模型,却不知道怎么安装,打开这个网站 https://spell.novelai.dev/ 把你下载的模型拖进去,立
马
就会帮你解析
文生图
SD
开源
一个专业级 AI 聊天浏览器,开源了!
克
隆项目并跳转到指定文件夹: 2.
开源
大模型聊天
ComfyUI
StableDiffusion升级版SDXL:一键运行包ComfyUI和18G模型分享!
另外,尝试了一下昨天的关键词"一个在火星上骑着白
马
的宇航员" ,出效果的稳定性感觉上没有1.0版机器人高,但是也能出类似的图片。
comfyui
sdxl
文生图
数字人
数字人直播哪家强?百度、硅基、风平与闪剪四大AI数字人横向评测!
另外,AI合成的声音还有一种更高级的存在,就是
克
隆自己的声音,用自己
克
隆的声音匹配自己的数字人模型,口型匹配度非常高,数字人更容易达到以假乱真的水平,刘润的数字人短视频作品就是例子,难以识别真假。
数字人
数字分身
开源
截至2023年5月份业界支持中文大语言模型开源总结及商用协议分析
Vicuna模型是由多家研究机构合作开发的,包括UC Berkeley、CMU、
斯
坦福等。
大模型
生成式AI与大语言模型的区别
随着各自市场价值数十亿美元,这两种现象正在医疗保健、电子商务(例如亚
马
逊)、房地产以及其他行业的未来中勾勒出一片光明的前景。
生成式AI
大语言模型
区别
开源
7.1k Star!RAGFlow:最新开源OCR+深度文档理解的RAG引擎、大海捞针测试、降低幻觉、服务化API集成进业务!
克
隆仓库: 4.
OCR
RAG
开源
Agent
AI Agent行业深度:框架拆解、应用方向、应用领域及相关公司深度梳理!
使用多个外部工具:1)能
克
隆github仓库、启动其他agent、发言、发送推文和生成图片,支持所有矢量数据库和LLM提供商/文本到图片模型/浏览器。
AI
Agents
大模型
Agent
AI Agent行业深度:框架拆解、应用方向、应用领域及相关公司深度梳理
使用多个外部工具:1)能
克
隆github仓库、启动其他agent、发言、发送推文和生成图片,支持所有矢量数据库和LLM提供商/文本到图片模型/浏览器。
AI
Agent
大模型
人工智能
阿里
阿里&字节发表VividTalk,只需单张照片即可根据音频生成栩栩如生的人物说话头像视频
为了进一步增强嘴唇运动和更准确地建模,我们还选择了与嘴唇相关的地标并将其转换为高
斯
图,这是一种更紧凑和有效的表示。
VividTalk
视频
<
...
20
21
22
23
24
25
26
27
28
29
...
>
1
2
4
5
6
7
8
9
100