首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 人工智能训练的灾难性遗忘以及解决方案
· SoFlu软件机器人
· AI时代,如何利用ChatGPT一分钟洗稿一篇文章?
· SD入门教程二:文生图基础用法(提示词)
· 垂直领域大模型的思考
· 微信为什么使用 SQLite 保存聊天记录!
· ViTPose+:迈向通用身体姿态估计的视觉Transformer基础模型
· 令人惊艳的开源图标生成AI模型:ChartLlama (南洋理&腾讯)
· 惊艳!2.77亿参数锻造出Agent+GPT-4V模型组合,领航AI领航机器人、游戏、医疗革新,通用智能时代你准备好了吗?
· 深入探讨:Agent全自动写作长篇小说技术原理解析
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
VividTalk:用一张照片和一段
音
频让人物栩栩如生地说话
最新的突破来自VividTalk项目,这是一个能够将单张照片和一段
音
频结合起来,创造出仿佛真人在说话的视频的技术。
VividTalk
视频
RVC和SVC声
音
模型难找?推荐这个网站
本篇文章介绍:1, 声
音
数据集训练到模型的过程 2 ,SVC和RVC声
音
模型网站推荐 一、声
音
数据集训练到模型的过程 AI声
音
模型训练是通过分析大量
音
频数据来学习声
音
特性,生成与目标声
音
相似的新
音
频
声音克隆
数字人
AI
音
乐热潮下,“神曲工作室”率先失业
有些人在不知道
音
乐是AI制作前,会给予较高评价,一旦得知是AI做的,态度就会大
转
弯了。
音乐
音频
人工智能
胎教级SO-VITS-SVC使用教程:人工智能生成歌曲
说明服务已经正常启动了,这里so-vits-svc会在后台运行一个基于Flask框架的web服务,端口号是7860,此时访问本地的网址:127.0.0.1:7860: 孙燕姿无损
音
色
模型
音乐
大模型
玩
转
大模型必备:milvus向量数据库私有化安装部署及使用介绍
将容器名称替
换
为你自己的。
向量数据库
GLM-4-Voice 9B——实时多语言语
音
对话 AI——几分钟内即可在本地安装
然而,大多数模型在流利地切
换
语言、理解口语查询的细微差别以及提供高质量响应方面仍然面临挑战。
GLM-4-Voice
9B
语音
安装
开源
OpenAI 开源语
音
识别 Whisper 的使用体验怎么样?
快速
转
换
:Buzz 的模型在本地离线运行,无需互联网连接,因此
转
换
速度非常快,适用于大量语
音
转
换
。
生成式AI
开源
网易有道强力开源中英双语语
音
克隆
其中的
音
素(phonemes)可以这样得到: python frontend.py data/my_text.txt > data/my_text_for_tts.txt. 5.
语音
开源
开源
从 GPT-4o 到 LiveKit:实时语
音
交互的开源实现
今天我们来聊聊OpenAI 发布会提到的实时对话语
音
技术。
GPT-4o
语音交互
开源
生成式AI领域拓展!MetaAI开源AudioCraft:一个支持AudioGen、MusicGen等模型的
音
频生成开发框架
然而,
音
频生成领域的进展却相对滞后。
开源模型
Stable Diffusion
Stable Diffusion基础:ControlNet之图片高仿
我们将通过几个实例来加深体会,比如照片
转
二次元风格、名画改造、AI减肥成功图片制作、绘本小故事等等。
文生图
LLM
4种通过LLM进行文本知识图谱的构建方法对比介绍
我们在以前的文章中已经介绍了使用大语言模型将非结构化文本
转
换
为知识图谱。
知识图谱
大模型
开源
OpenAI真的开源了!这波「实时语
音
」操作,让万物开口说话,我爱了
以前,智能玩具里只能播放预设的程序和声
音
,顶多就是进行一两轮简单提问,你可以理解成是“单向输出”,现在有了这个 openAI 的实时语
音
软件开发包,就变成了“双向交互”,能和你进行实时的语
音
对话。
OpenAI
嵌入式实时语音
SDK
大模型
AI大模型LLM可以帮助企业做什么?
通过语
音
交互、图像处理等技术,辅助企业内部运营。
大模型
阿里
ReplaceAnything:阿里最新项目!重绘图片里的任何元素,商用价值极高!用最简单的部署创造最大的价值!
摘要 ReplaceAnything是阿里团队即将开源的项目,针对图像里的人物替
换
、服装替
换
、背景替
换
等方面做了极大的优化,使用户上传图片可以指定部分区域生成新内容,并且做到了严格保留遮挡区域,这对AIGC
ReplaceAnything
文生图
<
...
6
7
8
9
10
11
12
13
14
15
...
>
1
2
4
5
6
7
8
9
100