首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 多智能体开发框架怎么选型?京东 JoyAgent vs langchain LangGraph,两种Agent开发哲学的碰撞!
· ComfyUI 基础教程(一)环境部署和插件安装
· 赛博牛马,智谱 AI,悄悄出了一个 AI PPT
· ComfyUI的特性以及安装流程
· 6个最佳开源TTS引擎
· 掌握这10个AI 工具用1小时完成别人1周的工作
· 混合专家模型 (MoE) 详解
· RVC和SVC声音模型难找?推荐这个网站
· 字节跳动推出MagicVideo-V2:引领AI视频生成新时代。
· [Stable Diffusion]SD安装、常用模型(checkpoint、embedding、LORA)、提示词具、常用插件
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
QAnything:网易有道最新开源的“本地化部署知识库”AI问答系统
如果想要分别使用嵌入和重排功能,请参
考
BCEmbedding LLM。
网易
RAG
知识库
视频
AI自动生成视频全流程干货
过程会有点漫长,需要等待几分钟,而且文字转化视频对于文字的长度有限制,所以如果你脚本太长了,可以
考
虑分段生成,然后自己再组合再一起。
AI
视频
ComfyUI
ComfyUI初学者指南
在本教程
结
束时,您将有机会制作一个非常复杂的教程。
文生图
comfyui
Agent
为什么大佬都在说Agent是未来?换个角度来谈一谈
LLM:能够生成“无法
考
证可能正确”以及“不一定及时”的相关行程攻略,景点等信息。
Agent
大模型
AI绘画:InstantID Win11本地安装记录!
可以参
考
以往的文章。
InstantID
Win11
安装
微调
Qwen7b微调保姆级教程
所以,
总
共是有 27个样本。
Qwen7b
大模型
ComfyUI
使用python调用comfyui-api,实现出图自由
就可以设置对应的参数,在函数中解析替换这个键值 我在最后还设置了一个文件'prompt.xlsx',方便写入大量的prompt进行替换 这样就可以解放双手,996的压榨显卡啦(不是) 3、参
考
来源
comfyui
工作流
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,语音识别数倍加速
other=arxiv:2311.00430 此外,有项测试
结
果表明,在处理 150 分钟的音频时,Distil-Whisper 的速度可以达到 Faster-Whisper 的 2.5 倍。
语音
HeyGen
阿里
阿里Outfit Anyone实现真人百变换装
然而,现有方法往往难以生成高保真度和细节一致的
结
果。
Outfit
Anyone
阿里
教程
用so-vits-svc-4.1进行音色转换的极简教程
注意:推理上传的歌曲同样需要进行人声分离,离线工具可以
考
虑UVR5,在线服务可以选择,但是每天有1-2次免费机会: https://vocalremover.org/zh/cutter 推理完成后
声音
sovits
Stable Diffusion
Stable diffusion又一个电商换装/换模特辅助插件
今天继续玩换装 分享一款辅助插件 Inpaint anything 这个插件
结
合了 segment anything 进行蒙版提取 在segment anything
Stable
diffusion
文生图
Mokker,想取代商业棚拍效果的场景生成AI
Mookker有两个特点非常吸引人,一是因为需要上传产品图片,所以产品在生成式的AI
结
果中是非常准确的,不会受AI生成影响产品的
结
构和内容,如果没有时间抠图,上传后也会贴心帮您抠好图;二是添加摄影道具的时候可以布局前后和位置关系
Mokker
图生图
医疗
惊艳!2.77亿参数锻造出Agent+GPT-4V模型组合,领航AI领航机器人、游戏、医疗革新,通用智能时代你准备好了吗?
结
合经验丰富的护士提供的视频字幕和临床文档,模型在医疗任务中的表现得到了显著提升,特别是在视频字幕生成、视觉问答和RASS评分预测等方面。
Agent+GPT-4V
大模型
工具
OCRmyPDF—可智能识别PDF文本和图片信息的工具
引用 更多信息请参
考
:https://github.com/ocrmypdf/OCRmyPDF?
OCRmyPDF
工具
开源
Giraffe:世界上第一个商业可用的32K长上下文开源LLM(基于Llama-2)
在这里,我们分享一些
结
果以及培训和评估脚本,希望对社区有用。
开源模型
<
...
79
80
81
82
83
84
85
86
87
88
...
>
1
2
4
5
6
7
8
9
100