首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 全新换脸工具ReActor,比roop更强!
· ChatGLM智谱清言
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 为你推荐开源项目:Meridian——专属个人情报站!
· 阿里Qwen3系列模型惊艳亮相
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· Stable Diffusion | 常见问题清点汇总
· 从第一性原理看大模型Agent技术
· 请以“续航”为题目,写一篇议论文
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
人工智能
目前有哪些比较成功的人工智能应用?
语
音
:
音
乐,录
音
等等
音
频格式的文件。
生成式AI
提示词
45个 DALL-E 3 使用案例 (附提示词)
提示词: 为一张名为[具体名称,如 "明日回
声
"]的[具体类型,如 "摇滚"]专辑设计具有视觉冲击力的专辑封面,捕捉[具体主题或情感,如 "反叛与自由"]的情绪。
DALL-E
提示词
文生图
ChatGPT
使用 ChatGPT + Claude 撰写成功的商业计划书
拥抱商业规划中的人工智能革命 使用 ChatGPT 和 Claude 编写商业计划就像与以前从未听过
音
乐的演奏家一起进行即兴演奏。
工作
这个方法可以让AI写出的文章完全去掉GPT味儿!
捕捉灵感:当灵感来袭时,立即用手机文字或者语
音
输入功能记录下来,不受限制地自由发挥。
ChatGPT
写作
大模型
中文版开源Llama 2同时有了语言、多模态大模型,完全可商用
语
音
到文本多模态开源对话模型 (LLaSM) LinkSoul.AI 开源了可商用的中英文双语语
音
- 语言助手 LLaSM 以及中英文语
音
SFT 数据集 LLaSM-Audio-Instructions
开源模型
我去华强北走了一圈,发现这里正被另一种 AI 包围
这款产品和传统形态的翻译机不同,是一个磁吸金属小圆片,贴在手机后做
声
音
录入,颇有科技感,连接手机蓝牙后,能够翻译手机内的一切文字和语
音
,包括微信实时对话。
华强北
AI
OpenAI
向量数据库失宠了?OpenAI 力捧检索增强生成(RAG)技术,对行业来说意味着什么?
对于这些唱衰的
声
音
,一位 IDswyx 的用户为在 X 上发表言论称:“对于今年向向量数据库投资 2.35 亿美元的公司来说,他们要的不是基础模型实验室 Sherlocking 和增加上下文长度这些基础功能
检索增强生成
大语音模型
LLM
最详细的文本分块(Chunking)方法——可以直接影响基于LLM应用效果
这个真正难题我在前面的文章中《一些LLM的
声
音
总结》中提到过,基于大模型的企业应用中很大一部分需求就是RAG——检索增强生成。
RAG
大模型
写作
GPT让你拥有超强的写作能力!
密切注意保持作者原始的
声
音
和意图,同时进行必要的调整以增强清晰度和流畅性 4、为特定受众定制语言 prompt: 作为一名校对专家,你的任务是调整给定的[文本],使之与特定的[目标受众]产生共鸣。
GPT
写作
数据库
颠覆数据存储方式:向量数据库的威力
向量数据库通过计算向量之间的相似度来搜索数据,因此它特别适用于人脸识别、语
音
识别、推荐系统等需要高维度数据处理的领域。
编程
数据库
鹅厂版AI笔记悄悄上线,微信公众号优质内容秒变专属知识库,实测在此
基于Gemini 1.5,其最新
音
频摘要功能,可以让用户根据特定主题生成类似播客的
音
频对话。
ima
copilot
搜索
大模型
元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入
元象大模型去年起已和多个腾讯产品,包括QQ
音
乐、虎牙直播、全民K歌、腾讯云等,进行深度合作与应用探索,为文化、娱乐、旅游、金融领域打造创新领先的用户体验。
XVERSE-V
多模态大模型
阿里
四木测评|让教父唱《野狼disco》、恶搞《甄嬛传》,火遍全网的阿里明星项目EMO正式开放
这也意味着用户无法自行上传
音
频内容,只能通过官方创建好的模板来上传图片,生成固定
音
频内容的视频。
EMO
阿里
全民演唱
OpenAI
AI Agents大爆发:软件2.0雏形初现,OpenAI的下一步
In-context Reinforcement Learning with Algorithm Distillation 这篇论文认为,任何一种生成学习历史的算法都可以通过对动作执行行为的
克
隆
agent
开源
构建开源多模态RAG系统
亲爱的冒险家,请考虑一下:当你听到某人的
声
音
时,你能认出这个人,而当你看到他们时,你也知道他们是谁。
RAG
大模型
<
...
14
15
16
17
18
19
20
21
22
23
...
>
1
2
4
5
6
7
8
9
100