首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· PPT又又有新突破了!智谱AI代码流造PPT
· 中文开源OCR框架对比及介绍
· 18种 DALL-E 3 炫酷的文字效果和提示词
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· 最佳开源文生图大模型可图:安装与批量出图的完整教程
· 赛博牛马,智谱 AI,悄悄出了一个 AI PPT
· WSL2安装(详细过程)
· ComfyUI初学者指南
· 聊聊我对AI Agents技术的一些看法
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
ChatGPT
万字长文|40万人学习过|28个ChatGPT使用
技
巧,带你从
入
门到精通
12:将特定角色融
入
你的工作流中(产品经理写PRD) 对于一些小企业来说,一岗身兼多职是非常常见的角色,而如果你是个独立开发者,或者做自媒体的个体户,那你需要一些非常广的
技
能,但是却未必需要在这些广的职能上做得很专业
ChatGPT
使用技巧
教程
OCR
Windrecorder:连续记录屏幕内容,通过OCR
技
术
识别记录内容
推荐放在空间富足的分区中),通过终端命令 git clone https://github.com/Antonoko/Windrecorder 下载该工具; 可以打开想要安装的文件夹,在路径栏输
入
cmd
Windrecorder
录屏
开源
OpenAI真的开源了!这波「实时语音」操作,让万物开口说话,我爱了
但现在回想起来,那只麋鹿的“能说会道”,其实正是 OpenAI 今天才正式揭晓的“谜底”——他们开源了一个叫做
嵌
入
式实时语音 SDK 的东西!
OpenAI
嵌入式实时语音
SDK
Sora
OpenAI Sora视频生成模型
技
术
报告中英全文+总结+影响分析
•
技
术
细节写得比较泛(防止别人模仿)大概就是用视觉块编码(visual patch)的方式,把不同格式的视频统一编码成了用transformer架构能够训练的embeding,然后引
入
类似diffusion
sora
openai
视频生成
微调
四种微调
技
术
详解:SFT 监督微调、LoRA 微调、P-tuning v2、Freeze 监督微调方法
当谈到人工智能大语言模型的微调
技
术
时,我们进
入
了一个令人兴奋的领域。
大模型
人工智能
人工智能大语言模型微调
技
术
:SFT 、LoRA 、Freeze 监督微调方法
人工智能大语言模型微调
技
术
:SFT 监督微调、LoRA 微调方法、P-tuning v2 微调方法、Freeze 监督微调方法 1.SFT 监督微调 1.1 SFT 监督微调基本概念 SFT(Supervised
大模型
微调
换脸
技
术
爆炸!AI一图换脸新王者,Instant ID保姆级安装与使用测评
在SD中有很多人物换脸的新
技
术
,比如像之前的Roop还有ReActor,它们都可以实现仅凭一张图进行人物换脸,后来又出现了EasyPhoto,可以通过快速炼制的小模型来对人物进行模仿。
Instant
ID
文生图
教程
SD
入
门教程六:ControlNet基础
入
门
图片,这张图片会作为 Conditioning 和最开始的 prompt 一起再输
入
到 Stable Diffusion 模型中,从而影响模型生成的图片。
ControlNet
文生图
大模型
AI Agent:大模型与场景间的价值之桥,但不适合当纯
技
术
看
一类则是连续的,和周围环境的变化镶
嵌
在一起的的场景。
大模型
开源
从声纹模型到语音合成:音频处理 AI
技
术
前沿 | 开源专题 No.45
该项目还提供了其他功能: · MusicGen:一种最新
技
术
实现的可控文本到音乐模型。
AudioCraft
音频
万物皆可接
入
DeepSeek,44家接
入
R1的国产平台超详细大盘点
技
术
本身再牛,不能落地都是纸上谈兵。
deepseek
大模型
微调
大语言模型综述<演进,
技
术
路线,区别,微调,实践,潜在问题与讨论>
使用RoPE embeddings:使用的不是绝对或相对位置
嵌
入
,而是RoPE,是因为 RoPE
嵌
入
在长文本上具有更好的性能 , 采用Shared Input-Output Embeddings
大模型
Sora
微软研究团队:Sora核心
技
术
及未来机会研究报告-中英对照版
3.2.3 视频压缩
技
术
图 8: ViT
技
术
将一幅图像分割成多个固定大小的块,对每个块进行线性
嵌
入
,并加
入
位置信息,然后将这些向量序列输
入
标准的 Transformer
sora
论文
开源
clone-voice:一键克隆声音,开源AI
技
术
让声音创作更便捷、更个性化
在当今科
技
飞速发展的时代,声音克隆
技
术
作为人工智能领域的一项重要成果,正逐渐走进我们的生活。
clone-voice
声音克隆
Agent
【Agent专题】Agent架构设计:智能体架构设计的9大核心
技
术
全景深解析,附架构图
未来,随着
技
术
的不断发展,我们期待看到更多能够克服这些局限性的解决方案。
Agent
智能体架构
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100