首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· PPT又又有新突破了!智谱AI代码流造PPT
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 深入探讨:Agent全自动写作长篇小说技术原理解析
· ComfyUI的特性以及安装流程
· Stable Diffusion图生图(真人转动漫)
· AI创作 |如何通过GPT进行漫画视频的故事改写
· 数字人之声音克隆:无样本,1分钟样本完美克隆声音,开源
· SD入门教程三:采样器及参数调整
· 一键部署本地私人专属知识库,开源免费!可接入GPT-4、Llama 3、Gemma、Kimi等几十种大模型,零代码集成。
· Cursor 0.50 版本:一场惊艳的编程体验升级之旅
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
clone-voice:一键克隆声音,开源AI技术让声音创作更便捷、更个性化
在这个过程中,模型
通
过大量的音频样本数据学习如何从文本生成对应的Mel-spectrogram,逐渐掌握声音的韵律、语调、发音方式等各种细节特征,从而能够根据输入的文本生成相应的语音特征表示。
clone-voice
声音克隆
Agent
Agent具体实现
1 适用场景 · 需要多步组合、选择路径的复杂
问
题。
Agent
大模型
开源
ChatGLM3-6B:新一代开源双语对话语言模型,流畅对话与低部署门槛再升级
在语
义
、数学、推理、代码、知识等不同角度的数据集上测评显示,ChatGLM3-6B-Base 具有在 10B 以下的基础模型中最强的性能。
ChatGLM3
语音模型
开源模型
神奇的 OuteTTS - 0.1 - 350M:用几秒钟音频克隆声音的黑科技!
CTC 强制对齐(CTC forced alignment)
通
过 CTC 强制对齐技术,创建精确的单词到音频标记的映射。
OuteTTS-0.1-350M
音频
大模型
大模型微调方法总结
但是随着预训练语言模型越来越大,这个范式存在以下
问
题: ● 当我们 finetune 大模型时,由于训练成本太高,不太可能重新训练所有模型参数 ● 以前的方法(论文发表于 2021 年)都或多或少有其它性能
问
题
开源模型
换脸
10秒换脸,一张图片够了!SD Roop插件教程
本文旨在帮助用户完成诸如自定
义
角色、电商模特形象调整等任务。
AI换脸
人工智能
胎教级SO-VITS-SVC使用教程:人工智能生成歌曲
A卡应该是跑不了,只能
通
过CPU去跑了(AMD,no!)
音乐
比 Roop 和 Reactor 更像!IP Adapter 新模型为任何人做写真
ensp; 2️⃣输入提示词 · 提示词定
义
:
IP-Adapter
文生图
吴恩达老师建议大家关注 AI 智能体工作流
目前,我们
通
常在零样本 (Zero-shot) 模式下使用大语言模型 (LLM),即让模型一步步地生成输出,而不进行任何修改。
智能体
大语言模型
Stable Diffusion
Stable Diffusion教程:采样器
后向扩散时,Stable Diffusion 先会生成一张完全的噪音图,然后根据提示词的语
义
,
通
过不断的采样来去除噪音图中不符合语
义
的噪音,而采样器就是去除噪音用的算法程序。
画图
SD
采样器
Yi技术报告细节分享
o 聚类过滤:采用无监督语
义
聚类对文本进行分组,然后对聚类数据标注质量标签,为后续数据混合策略提供参考。
Yi模型
大模型
强!推荐一款自动化神器Autolt:不再重复工作!
由于其灵活性和可扩展性,AutoIt也被许多人用于编写各种自定
义
的Windows脚本和小工具。
Autolt
自动化
Prompt
让你起飞的五个Prompt框架模型
例如,面对两个截然不同的工作机会,用户可以
通
过考虑薪水、工作与生活的平衡、长期职业成长、公司文化和地点等因素来评估。
prompt
大模型
大模型
我为什么不看好大模型行业
赢家
通
吃对于
通
用大模型有可能是成立的。
大模型
开源
Embedding开源模型重磅玩家:北京智源人工智能研究院最新Embedding模型发布!登顶MTEB,免费商用授权!
这些向量能够捕捉到语
义
的丰富含
义
,使计算机可以像处理数字一样来处理文本。
开源模型
<
...
51
52
53
54
55
56
57
58
59
60
...
>
1
2
4
5
6
7
8
9
100