首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· AI虚拟主播数字人技术实现Wav2Lip
· 我用AI写小说:「素材篇」4种大神写爽文技巧+找素材新思路+三翻四震举例说明
· Suno音乐新手指南(手把手完整版教程)
· SD3 正式开源 Sora同源架构
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· clone-voice:一键克隆声音,开源AI技术让声音创作更便捷、更个性化
· 一位芯片投资人的十年复盘:谁是中国的英伟达|AI光年
· 汇总1400+文献的神级“上下文工程”综述,治愈初学者的AI迷失症
· 我尝试了 100 个免费 AI 工具,这些是最好的
· 深入探讨:Agent全自动写作长篇小说技术原理解析
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
ChatGPT
ChatGPT丨一次性修改全
文
的提示
语
!
当需要一次性修改全
文
的格式时,可以使用提示词来改进
文
章的结构、
语
言和流畅性: 1.
写文章
阿里
阿里&字节发表VividTalk,只需单张照片即可根据
音
频
生
成栩栩如
生
的人物说话头像视频
只需提供一张人物的静态照片和一段
语
音
录
音
,VividTalk即可制作出一个看起来像是实际说话的人物的视频。
VividTalk
视频
Prompt
硬核Prompt赏析:HuggingGPT告诉你Prompt可以有多“工程”
,它让ChatGPT这样的LLM能够使用HuggingFace社区的各种模型(包括但不仅限于
文
生
图、图
生
文
、
语
音
转
文
字、
文
字合成
语
音
等),从而让LLM能驱动其他智能Agent,实现多模态能力。
提示词
prompt
Google
AI“同声传译”新进展!Google发布,无监督,
语
音
识别:Translatotron 3!
语
音
识别(ASR)是指将人类的
语
音
转换为
文
本的技术,然而,目前的
语
音
识别技术还面临着一些挑战,其中最大的一个就是如何支持更多的
语
言。
Translatotron
语音识别
大
语
言模型应用中的
文
本分块策略
分块的主要原因是确保我们向量化的内容的噪
音
尽可能少,并且具有
语
义相关性。
开源模型
Stable Diffusion
Stable Diffusion AnimateDiff | 最火
文
本
生
成视频插件库
AnimateDiff介绍 AnimateDiff采用控制模块来影响Stable Diffusion模型,通过大量短视频剪辑的训练,它能够调整图像
生
成过程,
生
成一系列与训练视频剪辑相似的图像。
动画
视频
AnimateDiff
教程
AI声
音
克隆 | 最全最简教程(权威版)
TTS 的英
文
全名是 Text To Speech,中
文
译名是“
文
本转
语
音
”。
声音克隆
教程
开源
【
语
音
领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
CosyVoice-instruct-300M:能够
生
成富有情感表现力的
语
音
,允许通过指令
文
本进行精细调整。
asr
tts
声音
开源
书
生
·万卷:难得的中
文
开源数据集
中国的AI产业要迎头赶上,中
文
的数据集是最大的短板之一。
大模型
AI制作艺术二维码 -
文
生
图
前几天看到几个逼格比较高的二维码,然后自己动手做了一下,给大家看看效果: 1、
文
生
图(狮子): 2、
文
生
图(城市): 下边将开始介绍怎么做的,有兴趣的可以继续读一读
文生图
RAG
RAG——使用检索增强
生
成构建特定行业的大型
语
言模型
下面是检索增强技术论
文
的摘要部分,从中我们可以看到,检索增强技术是用于知识密集型nlp任务处理
文
本
生
成时,先通过信息检索技术来增强信息输入来使
生
成的内容更具体、更多样化和更真实的技术。
大模型
ComfyUI
ComfyUI 基础教程(二):
文
生
图基础流程
一、
文
生
图(text2img)使用步骤 .
comfyui
文生图
语
音
识别的未来已来:深入了解faster-whisper的突破性进展
这种实现不仅提高了
语
音
识别的速度,还优化了内存使用效率。
语音识别
Faster-Whisper
Sora
一
文
带你看懂OpenAI-Sora
生
成视频的原理
Sora,在粤
语
中有点像“傻啦”,可以创建长达 60 秒的视频,其中包含高度详细的场景、复杂的摄像机运动以及充满活力的情感的多个角色。
视频生成
sora
变天了,AI可以一键
生
成中
文
海报了......
就在昨晚,即梦AI悄悄上线了2.1图像模型,这个模型能够通过提示词一键
生
成中英
文
海报,离了大谱。
2.1图像模型
文生图
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100