首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 第3期 SDXL和SD的10大区别!你知道几个?
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 6.2K Star!MIT出品的多语言语音合成神器,CPU实时推理吊打商业软件!
· 为你推荐开源项目:Meridian——专属个人情报站!
· 多智能体开发框架怎么选型?京东 JoyAgent vs langchain LangGraph,两种Agent开发哲学的碰撞!
· 让 AI 更懂你的 Prompt 提示词宝藏网站-FlowGPT
· 高效选择:Ollama与LM Studio深度对比
· 一键部署本地私人专属知识库,开源免费!可接入GPT-4、Llama 3、Gemma、Kimi等几十种大模型,零代码集成。
· 数字人之声音克隆:无样本,1分钟样本完美克隆声音,开源
· stable diffusion最全18种controlnet模型,详细教程讲解。
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
通义千问
阿里AI黑科技大揭秘:从通义千问到FaceChain,让图片和视频焕发新生!
VGen 可以根据用户输入的静态图像和文本生成目标接近、语义相同的视频,生成的视频具
高
清
(1280 * 720)、宽屏(16:9)、时序连贯、质感好等特点。
阿里云
视频
音频
教程
用so-vits-svc-4.1进行音色转换的极简教程!
主要是因为孙燕姿的音色独特,吐词
清
晰,网络上存在她的大量歌曲,非常便于训练。
so-vits-svc
音色转换
教程
写作
AI写作:一步到位,如何用 AI 生成整篇文章?做自媒体必看!
比如之前提到过的3W1H: 想用AI创作出
高
质量文案?
结构化提示词
写作
教程
Suno音乐新手指南(手把手完整版教程)
v2阶段,Suno生成的歌曲,经常出现开头几个字不
清
楚或者唱错唱漏的情况。
suno
歌曲
教程
大模型
快手大模型出炉!【快意】来袭!
具体对比结果如下所示: · C-Eval是一个全面的中文基础模型评测数据集,由
清
华大学、上海交通大学和爱丁堡大学合作构建,包含12342道单项选择题,涵盖数学、物理、化学、生物、历史、政治、
开源模型
Agent
谈Agent构建平台的设计
(当然不少情况是不是真的搞
清
楚了需求我是存疑的,不过这偏离了本文主题,就再讨论了) 这并非UI不够好看、或者产品的非LLM部分速度不够快、或者产品的服务经常无法访问之类的问题,就是最直接的是否有满足用户需求的问题
Agent
构建
AI备案实战指引
很多AI创业公司对AI算法备案不了解,甚至有人还搞不
清
楚做AI应用产品是否需要做算法备案,本文希望给大家一个解读。
备案
耗时7天,终于把15种ControlNet模型搞明白了
但目前现状是:随机性太强 很多时候能不能出来一个好看的画面,只能通过大量的「抽卡」实现,以数量去对冲概率 这种情况下,如果能用好控制出图的三个最关键因素,能让「出图与我们想象的画面一致」概率更
高
文生图
金融
金融行业的AIGC应用
东证金工的《ChatGPT 在量化投资中的运用:股票预测》研究了通过ChatGPT建立模型和生成源码,最终建立了LSTM股价预测模型;国金证券金融工程团队在2023年4月发布的研报《如何利用ChatGPT挖掘
高
频选股因子
金融
大模型
Stable Diffusion
Stable Diffusion ControlNet:Reference“垫图”功能,不炼丹也能保持同一人物
Style Fidelity(仅用于均衡模式):风格保真度, 3、来个可爱的猫咪案例演示: 在网上找一张背景干净,主体
清
晰的图片,这里找的一个猫,将图片改为512x512px尺寸
文生图
RAG
RAG从入门到精通-RAG简介
可解释性强,RAG可以通过提示工程等技术,使得LLM生成的答案具有更强的可解释性,从而提
高
了用户对于答案的信任度和满意度。
rag
大模型
LLM
最详细的文本分块(Chunking)方法——可以直接影响基于LLM应用效果
的复杂性 RAG涉及的内容其实广泛,包括Embedding、分词分块、检索召回(相似度匹配)、chat系统、ReAct和Prompt优化等,最后还有与LLM的交互,整个过程技术复杂度很
高
。
RAG
大模型
下载
8个常用中文OCR数据集,附下载链接
图像的分辨率较
高
,介于1294*864和1920*1280之间。
OCR
CodeGeeX:Tab一下,代码自动生成
我们对数据进行了去重和
清
洗,整个代码语料含有23种编程语言、总计1587亿个标识符(不含填充符)。
大模型
Roop参数说明,ROOP->StyleGAN演示!
因为roop的核心模型只有128像素,所以如果你的视频很大,不管你给的素材有多么
高
清
,合成之后都是模糊的。
视频
StyleGAN
<
...
39
40
41
42
43
44
45
46
47
48
...
>
1
2
4
5
6
7
8
9
100