首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· ChatGLM智谱清言
· 赛博牛马,智谱 AI,悄悄出了一个 AI PPT
· 终极福利:15个中文AI写作提示词帮你覆盖所有主流写作场景!!!
· 结构化Prompt必备基础:5分钟学会Markdown语法,实现提示词创作自由!
· AI创作 |如何通过GPT进行漫画视频的故事改写
· PPT又又有新突破了!智谱AI代码流造PPT
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 第3期 SDXL和SD的10大区别!你知道几个?
· 深入探讨:Agent全自动写作长篇小说技术原理解析
· Stable Diffusion 加速/优化/升级 优化出图速度
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,
语
音
识别数倍加速
前段
时
间,「霉霉大秀中文」的视频在各个社交媒体走红,随后又出现了「郭德纲大秀英
语
」等类似视频。
语音
HeyGen
工具
惊艳推荐!8款好用又免费的文本转
语
音
TTS工具
具有神经网络真人发
音
、支持在线体验和本地部署(通过Docker等方
式
)。
TTS
Maker
语音
深
入
浅出:大
语
言模型中必不可少的技术——Embedding简介
简单来说,embedding就是一个N维的
实
值向量,它几乎可以用来表示任何事情,如文本、
音
乐、视频等。
embedding
数字人
一款构建AI数字人项目开源了!自动
实
现
音
视频同步!
1、Video-Tetalking Video-ReTalking 是一个利用AI
实
现视频人物嘴型与输
入
的声
音
同步的创新技术。
AI数字人
音视频同步
Prompt
大
语
言模型定制化应用的三种方
式
:Prompt engineering、Fine tuning、Pre-trainning的区别
在
实
现大
语
言模型的定制化应用中,的确有几种常用的方
式
:Prompt Engineering(提示工程)、Fine-tuning(微调)和Pre-training(预训练)。
大模型
开源
OpenAI 开源
语
音
识别 Whisper 的使用体验怎么样?
登录进
入
工作台后,使用
语
言识别功能,点击【新建项目】-【
语
音
转写】。
生成式AI
ChatGPT
ChatGPT 的对话框过
时
了?这款 AI 产品提供了一种很新的聊天方
式
比如,问问广州今天的天气如何,Flowith 就会进行
实
时
搜索。
ChatGPT
聊天
开源
RAGFlow:开源的RAG引擎,专注于深
入
的文档理解,支持处理各种复杂格
式
的非结构化数据
该项目提供了一个简化的RAG工作流,适用于各种规模的企业,通过结合使用大型
语
言模型(LLM)来提供基于严谨引用的真
实
问答能力。
RAGFlow
RAG
开源
免训练!单图秒级别生成AI写真,人像生成进
入
无需训练的单阶段
时
代
这一创新版本摒弃了传统的人物模型训练过程,能够直接生成 zero-shot 目标人像,引领 AI 人像生成进
入
了无需训练的单阶段
时
代。
FaceChain
FACT
文生图
Ollama最新更新v0.1.33,
实
现了多并发可同
时
与多个模型聊天对话!
上周,Ollama进行了v0.1.33版本更新,为本地部署的开源大型
语
言模型(LLMs)带来了重大改进。
ollama
语言大模型
聊天
剪映克隆声
音
功能详解:剪映上线5秒“AI克隆
音
色”,一堆AI公司又要进
入
慢性死亡了...
也是在那一天,N多AI初创公司宣布进
入
死亡倒计
时
。
剪映
声音克隆
开源
生成
式
AI领域拓展!MetaAI开源AudioCraft:一个支持AudioGen、MusicGen等模型的
音
频生成开发框架
支持的模型 · · AudioCraft使用 · · AudioCraft开源地址 · AudioCraft简介 产生高保真
音
频任何类型的
音
频都需要对不同尺度的复杂信号和模
式
进行建模
开源模型
教程
SD
入
门教程六:ControlNet基础
入
门
从上图可以看到,我们在使用 ControlNet 的
时
候,会先将 text prompt 和图片一起输
入
到 ControlNet 的模型中,然后 ControlNet 的模型会生成一张 latent
ControlNet
文生图
开源
【
语
音
领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+
实
战部署推理!
它在支持5种
语
言的同
时
提供高速处理。
asr
tts
声音
大模型
炸裂!百川开源第1个7B多模态大模型 Baichuan-Omni | 能够同
时
分析图像/视频/
音
频/文本
同
时
,作者还利用自动
语
音
识别(ASR)数据来训练
音
频
语
言模型。
Baichuan-Omni
多模态大模型
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100