首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 为你推荐开源项目:Meridian——专属个人情报站!
· GenColor.ai
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· 6个最佳开源TTS引擎
· Suno音乐新手指南(手把手完整版教程)
· AI换脸工具:facefusion使用心得
· ChatGLM智谱清言
· MCP服务介绍及应用场景报告-来自Manus
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
LLM
从思维链(CoT),到思维树(ToT),再到思维图(GoT):用LLMs
解
决复杂问题!
arxiv.org/pdf/2308.09687v2.pdf Code:https://github.com/spcl/graph-of-thoughts 背景介绍 近年来,随着基于
解
码
器
大模型
语音
从声纹模型到语音合成:音频处理 AI 技术前沿 | 开
源
专题 No.45
· EnCodec:一种高保真度神经音频编
解
码
器。
AudioCraft
音频
人工智能
Embedding开
源
模型重磅玩家:北京智
源
人工智能研究院最新Embedding模型发布!登顶MTEB,免费商用授权!
但是,现实中开
源
的Emebdding模型却很少。
开源模型
LLM
收藏!万字长文聊聊LLM Agents的现状,问题与未来
全文1.1w字,阅
读
时间约25分钟。
LLM
Agents
阿里
开
源
语音大语言模型来了!阿里基于Qwen-Chat提出Qwen-Audio!
论文链接:https://arxiv.org/pdf/2311.07919.pdf 开
源
代
码
:https://github.com/QwenLM/Qwen-Audio 引言 大型语言模型(LLMs
大模型
语音
大模型
如何下载及使用通义千问7B开
源
大模型
通义千问开
源
!
通义千问
大模型
字节推出开
源
绘画大模型SDXL-Lightning,秒级出图
字节推出了一个SDXL-Lightning模型。相较于其他SDXL大模型,SDXL-Lightning最显著的优点在于可一步生成图像。速度远超 Turbo 或 LCM!SDXL-Lightning是一种速度极快的文本到图像生成模型。它可以通过几个步骤生成高质量的画面
sdxl
字节
绘画
大模型
从零开始了
解
AI大模型 - 技术篇:万字深度好文人话说大模型技术
举个例子,一款预训练语言模型既能胜任自然语言分类、命名实体识别和指代消
解
等任务,也能轻松处理智能对话、阅
读
理
解
和文本生成等自然语言生成任务。
大模型
一网打尽 | 掌握64个策划思维模型,逆转职业寒冬!(高清图+模型详
解
)
3、横向:各种观点或内容,以演绎推理和归纳推理的方式回答
读
者的疑问。
策划思维模型
方法论
OpenAI
OpenAI 开
源
语音识别 Whisper 的使用体验怎么样?
作者:知乎用户 链接:https://www.zhihu.com/question/575983499/answer/3055288368 来
源
:知乎 著作权归作者所有。
生成式AI
M3E 可能是最强大的开
源
中文嵌入模型
“ 介绍m3e开
源
中文嵌入模型,在中文的表现上,超过ChatGPT。”
开源模型
最新最全的开
源
中文大语言模型列表
模型的主要特性有:较大提升LLaMA的中文理
解
能力,并尽可能减少对原始LLaMA英文能力的损伤;训练过程增加较多的任务型数据,利用ChatGPT生成
解
析,强化模型理
解
任务求
解
逻辑;全量参数更新,追求更好的生成效果
大模型
语音
网易有道强力开
源
中英双语语音克隆
但是将其更改为样式、音色控制并不复杂,类似于PromptTTS的原始闭
源
实现。
语音
开源
语音
从 GPT-4o 到 LiveKit:实时语音交互的开
源
实现
LiveKit 不仅有一个开
源
的 voice agent 方案[1],还能为你提供一个成熟且强大的实时多模态 AI
解
决方案。
GPT-4o
语音交互
数字人
一款构建AI数字人项目开
源
了!自动实现音视频同步!
如果把这个任务丢给 ChatGPT,它会直接返回一串可执行代
码
,但是代
码
通常会存在问题,例如执行报错、缺少依赖等,你需要反复跟 ChatGPT 对话来完善程序。
AI数字人
音视频同步
<
...
14
15
16
17
18
19
20
21
22
23
...
>
1
2
4
5
6
7
8
9
100