首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 说真的,学会用SD做电商图,你才是真的入了门
· 实操:基于 Ollama+AnythingLLM 的 AI 超级阅读法
· Flowith:革新你的工作方式,体验节点式 AI 的超流畅生产力
· 这个数字人开源项目太牛了,非常全面的项目解决方案(含源码)
· 和王小川聊再创业这一年:回应朱啸虎、谈中国AGI第三种可能
· PhotoMaker:腾讯最新开源,根据照片生成该人物各种风格图片,项目可落地!
· 巧用ChatGPT生成Stable Diffusion绘画提示词Prompt
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· Math.now
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
微调
大
语言
模
型
综述<演进,技术路线,区别,微调,实践,潜在问题与讨论>
[3]证明了在给定训练预算的情况下,即使减少
模
型
参数量,只要增加预训练的数据
大
小和训练时长(更
多
的训练tokens数),可以达到甚至超过原始
大
小
模
型
的效果。
大模型
盘古
华为盘古画画3.0发布 | PanGu-Draw:业界最
大
的中文文生图
模
型
,效果YYDS!
文章地址:https://arxiv.org/pdf/2312.16486.pdf 项目地址:https://pangu-draw.github.io 00 | 导言 目前的
大
规
模
扩散
模
型
代表了条件图像合成的巨
大
飞跃
PanGu-Draw
文生图
开源
最新最强开源
模
型
Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
它支持开关深度思考能力,就像给
模
型
配备了一个智能
大
脑的开关,你可以根据实际需求灵活调整。
Qwen3
开源模型
视频
Stability AI推出视频生成
模
型
Stable Video Diffusion
Stability AI近日推出了名为Stable Video Diffusion的视频生成
模
型
,该
模
型
基于该公司现有的Stable Diffusion文本转图像
模
型
,能够通过对现有图像进行动画化生成视频
Video
视频创作
SD
RAG
RAG
模
型
的主要痛点和解决方案
- 尝试使用
多
向量表示、近似最近邻搜索和最
大
内积搜索来提高速度,而不损害准确性。
rag
大模型
ComfyUI
StableDiffusion升级版SDXL:一键运行包ComfyUI和18G
模
型
分享!
·
模
型
很
大
,体积很
大
,参数很
大
,35/66亿。
comfyui
sdxl
文生图
LLM
LLM native策略的内部状
态
是否应该结构化 【2023Q3】
但他经常并不能把自己的能力量化的写下来,以及很
多
模
糊的感受他自己也很难形容。
大模型
对于AI,我们现阶段可以有的
态
度
包括AI在其他
模
态
的技术依然不算成熟和便利,需要一定的时间来迭代和发展。
文生图
AIGC
国外报告90%的AI类产品公司已经实现盈利,而国内
大
模
型
和AIGC的访谈说太卷了
国内
大
模
型
行业的发展情况:行业内卷严重,商业化难题突出,技术挑战仍存。”
大模型
如何从零开始训练专属 LoRA
模
型
?4600字总结送给你!
本文主要介绍如何训练 LoRA
模
型
,LoRA 是一种轻量化的
模
型
微调训练方法,是在原有
大
模
型
的基础上,对
模
型
进行微调,从而能够生成特定的人物、物品或画风。
训练
Google
再超Transformer!Google| 提出两个新
模
型
(Griffin、Hawk),强于Mamba,更省资源
这时,循环语言
模
型
成为一种替代方案,它们可以将整个序列压缩为固定
大
小的隐藏状
态
,并迭代更新。
transformer
训练
开源
Stability AI开源上新:3D生成引入视频扩散
模
型
也就是说,此番登场的SV3D首次将视频扩散
模
型
应用到了3D生成领域。
sv3d
建模
换脸
除了深度换脸、
模
拟配音,还能口
型
匹配的AI软件出现了
目前LipDub 支持28种语言,包括韩语、西班牙语、捷克语、泰米尔语和乌克兰语,它采用零镜头
模
式,可以在Captions的视频生成
模
型
在没见过主题的情况下推出流畅的视频。
AI
Prompt
硬核Prompt赏析:HuggingGPT告诉你Prompt可以有
多
“工程”
(包括但不仅限于文生图、图生文、语音转文字、文字合成语音等),从而让LLM能驱动其他智能Agent,实现
多
模
态
能力。
提示词
prompt
Fastwhisper + Pyannote 实现 ASR + 说话者识别
whisper很变
态
,粤语效果也还不错,因此,如果实际业务中需要涉及到不同的语言,还是更推荐whisper
多
一点 一、faster-whisper简单介绍 faster-whisper是使用
faster-whisper
语者识别
ASR
<
...
20
21
22
23
24
25
26
27
28
29
...
>
1
2
4
5
6
7
8
9
100