首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 赛博牛马,智谱 AI,悄悄出了一个 AI PPT
· PPT又又有新突破了!智谱AI代码流造PPT
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 多智能体开发框架怎么选型?京东 JoyAgent vs langchain LangGraph,两种Agent开发哲学的碰撞!
· AI创作 |如何通过GPT进行漫画视频的故事改写
· Suno音乐新手指南(手把手完整版教程)
· 剪映专业版智能补帧
· 数字人之声音克隆:无样本,1分钟样本完美克隆声音,开源
· Ollama还是vLLM?深度解析四大顶级LLM服务框架:性能、特性与技术选型指南
· 爆肝!超详细的胎教级Midjourney使用教程,看这一篇就够!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
动作识别模型有哪些
考虑对一小段视频进
行
编码,假设起始帧为T,连续L帧(不包含T帧)。
动作识别
模型
视频
超越Animate Anyone! 南加大&字节提出MagicPose,不需任何微调就可生成逼真的人类视频
论文阅读 MagicPose:现实的人类姿势和面部表情重新定位与身份意识扩散 摘要 在这项工作中,我们提出了MagicPose,这是一种基于扩散的模型,用于在具有挑战性的人舞视频中进
行
2D
MagicPose
视频
Prompt
使用思维链写Prompt
思维链有多种形式,其中最简单,最流
行
的一种就是在提示语中加入“让我们一步步来(Let's think step by step)”的说法。
思维链
prompt
开源
网易有道强力开源中英双语语音克隆
PromptTTS): https://github.com/netease-youdao/EmotiVoice EmotiVoice Docker镜像 尝试EmotiVoice最简单的方法是运
行
docker
语音
开源
大模型
从零开始学习大模型-第二章-大模型学习路线
预训练和微调:理解大模型的预训练和微调过程,学习如何使用预训练模型进
行
特定任务的微调。
大模型
学习
大模型
如何下载及使用通义千问7B开源大模型
studios/qwen/Qwen-7B-Chat-Demo/summary 环境配置与安装 本文在ModelScope的Notebook的环境(这里以PAI-DSW为例)配置下运
行
通义千问
如何避免大语言模型绕过知识库乱答的情况?LlamaIndex 原理与应用简介
在查询期间,我们可以在调用 LLM 合成答案之前,使用 Embeddings 对节点进
行
最大相似度检索。
大语言模型
ChatGPT
你是否发现ChatGPT甚至不能按字数要求回复问题?有人做了评测并讨论了可能的原因
该工作的主要贡献是对LLM在五个任务和十个生成基准上的可控性进
行
全面分析,其中包括受控故事生成、受控带有情感和主题的自由格式生成、受控改述生成和受控基本原理生成,见figure1。
大模型
控制
OpenAI
基于 OpenAI Whisper 模型的实时语音转文字工具
· WhisperLive 具有跨平台支持的优点,可以在不同的操作系统上运
行
,包括 Windows、macOS 和 Linux。
WhisperLive
音频
开源软件
Prompt
8个超级GPTs Agent,每个浏览量超20w+(实用建议+攻防Prompt)
可能干货有点多,大家得准备好了~ 自己搭建的几个应用 1)Web Builder 之前搭建的一个网站开发助手V0.1 版本,目前还没对接一键部署平台,需要你自
行
去搭建环境,但是网站开发助手会给你零门槛操作的建议
GPTs
Agent
Prompt
Dynamic Prompts插件,魔法提示词由魔法帮你补全(插件篇)
启动动态提示词 还记得我们在《嘛呢吽-咒语范式(关键词篇)》中提到过webui的一种语法,通过“|”让生成的图中出现进
行
组合排列吗?
文生图
提示词
语音
实时语音克隆
简要总结:这份内容介绍了实时语音克隆技术的实现,使用SV2TTS框架和波形神经网络进
行
多说话人的文本到语音合成。
语音
克隆
Langchain的一些问题和替代选择
比如说这个,就是一个简单的分割函数:
行
为不一致并且隐藏细节 LangChain因隐藏重要细节和
行
为不一致而受到批评,这可能导致生产系统出现意想不到的问题。
大模型
Stable Diffusion
硬核解读Stable Diffusion(系列二)
generator = torch.Generator("cuda").manual_seed(42) # 定义随机seed,保证可重复性 # 执
行
推理
StableDiffusion
文生图
大模型
无限逼近真人效果的“超真实人像大模型”,或许它才是你一直在寻找的真爱!
作者提出了一种名为Sdxl的模型,通过在低分辨率图像上进
行
多步骤的潜在扩散操作,逐渐生成高分辨率图像。
大模型
文生图
<
...
89
90
91
92
93
94
95
96
97
98
>
1
2
4
5
6
7
8
9
100