首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 20 个提升您设计水平的DALLE-3提示词
· Stable Diffusion | SD的老舅ComfyUI来了,节点式工作流,分部控制出图
· SD入门教程二:文生图基础用法(提示词)
· 大模型评测新思路:弱智吧精华问题大全
· 字节,悄咪咪做了个 Liblib
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· 造梦师手记:SDXL迎来了AI插画师
· 大模型业务应用中数据准备的要求、难点及解决思路
· 【开源黑科技】鹅厂PhotoMaker AI绘画工具,一键打造多风格头像!
· M3E 可能是最强大的开源中文嵌入模型
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
ChatGPT
ChatGPT丨一次性修改全
文
的提示
语
!
当需要一次性修改全
文
的格式时,可以使用提示词来改进
文
章的结构、
语
言和流畅性: 1.
写文章
Prompt
硬核Prompt赏析:HuggingGPT告诉你Prompt可以有多“工程”
,它让ChatGPT这样的LLM能够使用HuggingFace社区的各种模型(包括但不仅限于
文
生
图、图
生
文
、
语
音
转
文
字、
文
字合成
语
音
等),从而让LLM能驱动其他智能Agent,实现多模态能力。
提示词
prompt
Google
AI“同声传译”新进展!Google发布,无监督,
语
音
识别:Translatotron 3!
语
音
识别(ASR)是指将人类的
语
音
转换为
文
本的技术,然而,目前的
语
音
识别技术还面临着一些挑战,其中最大的一个就是如何支持更多的
语
言。
Translatotron
语音识别
大
语
言模型应用中的
文
本分块策略
分块的主要原因是确保我们向量化的内容的噪
音
尽可能少,并且具有
语
义相关性。
开源模型
教程
AI声
音
克隆 | 最全最简教程(权威版)
TTS 的英
文
全名是 Text To Speech,中
文
译名是“
文
本转
语
音
”。
声音克隆
教程
开源
【
语
音
领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
CosyVoice-instruct-300M:能够
生
成富有情感表现力的
语
音
,允许通过指令
文
本进行精细调整。
asr
tts
声音
AI制作艺术二维码 -
文
生
图
前几天看到几个逼格比较高的二维码,然后自己动手做了一下,给大家看看效果: 1、
文
生
图(狮子): 2、
文
生
图(城市): 下边将开始介绍怎么做的,有兴趣的可以继续读一读
文生图
开源
书
生
·万卷:难得的中
文
开源数据集
中国的AI产业要迎头赶上,中
文
的数据集是最大的短板之一。
大模型
Stable Diffusion
Stable Diffusion AnimateDiff | 最火
文
本
生
成视频插件库
AnimateDiff介绍 AnimateDiff采用控制模块来影响Stable Diffusion模型,通过大量短视频剪辑的训练,它能够调整图像
生
成过程,
生
成一系列与训练视频剪辑相似的图像。
动画
视频
AnimateDiff
ComfyUI
ComfyUI 基础教程(二):
文
生
图基础流程
一、
文
生
图(text2img)使用步骤 .
comfyui
文生图
RAG
RAG——使用检索增强
生
成构建特定行业的大型
语
言模型
下面是检索增强技术论
文
的摘要部分,从中我们可以看到,检索增强技术是用于知识密集型nlp任务处理
文
本
生
成时,先通过信息检索技术来增强信息输入来使
生
成的内容更具体、更多样化和更真实的技术。
大模型
语
音
识别的未来已来:深入了解faster-whisper的突破性进展
这种实现不仅提高了
语
音
识别的速度,还优化了内存使用效率。
语音识别
Faster-Whisper
RAG
一
文
看懂RAG:大
语
言模型落地应用的未来
其中一些主要限制包括: 不适应多模态数据:基础RAG主要关注
文
本数据的检索和
生
成,对于多模态数据(例如图像、
音
频)的处理能力有限。
rag
检索增强
Sora
一
文
带你看懂OpenAI-Sora
生
成视频的原理
Sora,在粤
语
中有点像“傻啦”,可以创建长达 60 秒的视频,其中包含高度详细的场景、复杂的摄像机运动以及充满活力的情感的多个角色。
视频生成
sora
变天了,AI可以一键
生
成中
文
海报了......
就在昨晚,即梦AI悄悄上线了2.1图像模型,这个模型能够通过提示词一键
生
成中英
文
海报,离了大谱。
2.1图像模型
文生图
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100