首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 为你推荐开源项目:Meridian——专属个人情报站!
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· GenColor.ai
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· Stable Diffusion 30种采样器全解!
· RVC和SVC声音模型难找?推荐这个网站
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· 全新换脸工具ReActor,比roop更强!
· 关于AI声音生成的一切(语音+音乐+嘴型)
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
OCR
完全指南——使用python提取PDF中的文本信息(包括表格和图片OCR)
为了避免在最终本文提取的时候遗漏这些“看上去像文本的图片”,我在创建过程中需要考虑做一些处
理
。
大语言模型
python
腾讯
腾讯 IMA: AI 智能教学新助手
腾讯 IMA(intelligent management assistant,智能管
理
助手)的出现,为教育教学注入了新的活力与智慧。
腾讯
IMA
智能教学
开源
开源语音大语言模型来了!阿里基于Qwen-Chat提出Qwen-Audio!
使LLMs能够感知和
理
解丰富的音频信号以进行音频交互引起了广泛关注。
大模型
语音
Agent
AI Agent的数字化革命:超越文本,走向自主决策与交互
LLM主要擅长处
理
和生成文本。
生成式AI
工具
FFmpeg之父新作——音频压缩工具 TSAC
其原
理
和我们之前介绍的突破压缩极限的AI语音编解码器类似,使用深度学习网络进行压缩,TSAC这里引入Transformer结构来提升性能。
TSAC
音频工具
ChatGPT
ChatGPT论文润色进阶指令
GPT-4.0在使用体验上相较于GPT-3.5有显著提升,特别是在逻辑推
理
方面。
ChatGPT
写作
教程
吴恩达Prompt教程之总结图解
本篇文章是前几篇文章的总结,一图胜千言,所以用如下的思维导图将吴恩达老师Prompt教程进行了梳
理
。
prompt
教程
吴恩达
AI音乐热潮下,“神曲工作室”率先失业
这些尚未解决的问题包括,无法自行重复自己刚刚生成的上一段或副歌;有的时候处
理
歌词,断句会不太符合语法;无法对已经生成的部分做修改。
音乐
音频
大模型
大模型训练为什么用A100不用4090
大模型推
理
为什么 4090 很香 推
理
和训练有什么区别?
大模型
换脸
WebUI使用用InstantID,AI换脸完美版
小红书 InstantX 团队公开了论文《 InstantID: Zero-shot Identity-Preserving Generation in Seconds 》和推
理
代码,他们表示: InstantID
换脸
小红书
大模型
中文原生文生图大模型来了!腾讯混元推出,Sora 同架构
5月14日,腾讯宣布旗下的混元文生图大模型全面升级并对外开源,目前已在 Hugging Face 平台及 Github 上发布,包含模型权重、推
理
代码、模型算法等完整模型,可供企业与个人开发者免费商用。
文生图
混元
腾讯
Prompt
使用思维链写Prompt
思维链(CoT),即 Chain of Thought,是一种解决问题的方法,这种方法涉及逐步、逻辑地思考问题,以便更好地
理
解和解决它。
思维链
prompt
大模型
大模型训练工程那些事
“曼哈顿计划(Manhattan Project)是二战期间由美国莱斯利·
理
查德·格罗夫斯将军领导,美国物
理
学家罗伯特·奥本海默负责的一项历史性的原子弹研制计划。
训练工程
大模型
大模型
最强国产开源多模态大模型MiniCPM-V:可识别图片、视频,还可在端侧部署
MiniCPM-V是面向图文
理
解的端侧多模态大模型系列。
minicpm
面壁
RAG
RAT = CoT + RAG
大规模语言模型(LLM)处于此类研究的最前沿,旨在模拟人类对概念的
理
解和表达。
RAT
协同思维链
检索增强生成
<
...
12
13
14
15
16
17
18
19
20
21
...
>
1
2
4
5
6
7
8
9
100