首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 数字人之声音克隆:无样本,1分钟样本完美克隆声音,开源
· PPT又又有新突破了!智谱AI代码流造PPT
· Suno音乐新手指南(手把手完整版教程)
· ComfyUI安装及生成第一张图
· 会“追问”的Agent,大模型知识库另类实践
· 国内厂商语音识别与Whisper评测:现状与概况对比
· 聊聊我对AI Agents技术的一些看法
· Agent : 一文读懂LLM Agent架构,详解Profile,Memory,Planning,Action模块作用
· 【工具书】文生图Midjourney最全prompt提示词分类对照表
· 建议收藏:超详细ChatGPT(GPT 4.0)论文润色指南
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
OpenAI
OpenAI 上线新功能力捧 RAG,开发者真的不需要向量
数
据库了?
近期, OpenAI 的开发者大会迅速成为各大媒
体
及开发者的热议焦点,有人甚至发出疑问“向量
数
据库是不是失宠了?”
RAG
检索
向量库
LLM
【
一
步
一
步引导】从零详细地梳理
一
个完整的 LLM 训练流程
已经有许多优秀的
仓
库做过这件事情,比如:[Chinese-LLaMA-Alpaca]。
大模型
训练
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,语音识别
数
倍加速
OpenAI 认为使用这样
一
个庞大而多样的
数
据集,可以提高模型对口音、背景噪音和技术术语的识别能力。
语音
HeyGen
不出所料,字节个把月就整出了自己的manus,不用积分,无需会员,快来
体
验coze空间吧
字
数
1713,阅读大约需 9 分钟
一
两个月前manus开始爆火的时候,我写过下面的内容 对manus的8个评价 文兄赞
一
个,公众号:PeopleSoft探究内行看门道,
manus
阿里
大模型
Westlake - Omni:西湖心辰推出的全球首个开源的中文情感端 - 端语音交互大模型
其中,中文情感语音交互领域的发展备受关注,因为它能够使机器更好地理解人类情感,提供更加人性
化
的交互
体
验。
Westlake
-
Omni
语音
RVC和SVC声音模型难找?推荐这个网站
本篇文章介绍:1, 声音
数
据集训练到模型的过程 2 ,SVC和RVC声音模型网站推荐
一
、声音
数
据集训练到模型的过程 AI声音模型训练是通过分析大量音频
数
据来学习声音特性,生成与目标声音相似的新音频
声音克隆
数字人
ComfyUI
ComfyUI学习笔记2,
一
文看透Workflow
类比webui的使用
体
验: 1.调好参
数
2.点击生成 3.等待结果 除了观察命令行窗口能获得
一
些生成进度中的信息,在webui界面上,基本还是传统软件的使用思维
comfyui
文生图
大模型
垂直领域大模型的思考
混合
数
据 如果想要领域的模型还具备
一
定的通用能力,即通用的能力不会退
化
(或者灾难性遗忘)这就需要在语言模型训练的时候混杂通用的
数
据。
垂直领域
大模型
pdf2htmlEX:效果相当好的
一
个PDF转HTML程序,和原始PDF几乎
一
模
一
样。
其背后是利用的Chrome Headless,让Chrome渲染PDF,再导出成HTML,甚至图片都转成了 base64 字符,所以
一
个网页就可以包含完整的文本、字
体
和图片等内容 这是我的
PDF转换
ChatGPT
数
学能力超ChatGPT,70B开源大模型火了:用AI微调AI,微软全华班出品
具
体
而言,Evol Instruction分为指令进
化
器和指令消除器。
开源模型
开源
俄罗斯人开源了最大的文生图模型:参
数
量12B,比SDXL大了3倍多!
DALL-E 2的这种两阶段的方案的
一
个是优势是第二阶段只需要纯图像
数
据来训练图像生成模型,而且采用CLIP image embedding作为条件比直接用文本训练模型更容易
一
些。
Kandinsky-3
文生图
开源模型
开源
爆火!腾讯开源PhotoMaker:高效地定制
化
生成任意风格的逼真人类照片!
解决: 提出
一
种高效的个性
化
文本图像生成方法PhotoMaker, · 它主要是将任意
数
量的输入ID图像编码到堆栈ID嵌入中以保留ID信息。
PhotoMaker
文生图
大模型
使用大模型自动回复小红书/抖音/快手评论:通过RAG 优
化
LLMs实现
另外,由于知识存储在外部
数
据库中,更新系统知识就像在表中添加或删除记录
一
样简单。
RAG
大模型
自动回复
ComfyUI
ComfyUI安装及生成第
一
张图
暂时无法在飞书文档外展示此内容 您的电脑应该会努力工作
一
段时间。
ComfyUI
文生图
Stable Diffusion
SD入门教程
一
:Stable Diffusion 基础(技术篇)
各位同学可以简单将其理解为「将文本转
化
为机器能识别的多组
数
字信息」。
Stable
Diffusion
文生图
<
...
12
13
14
15
16
17
18
19
20
21
...
>
1
2
4
5
6
7
8
9
100