首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· GitHub星数暴涨,AIPC的开源实现,用AI记录电脑一整天的使用太简单了,功能非常多!
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· 两个案例教你如何用BRTR原则优化Prompt
· 万字长篇!超全Stable Diffusion AI绘画参数及原理详解
· ComfyUI-DDetailer脸部修复
· 我用AI写小说:「素材篇」4种大神写爽文技巧+找素材新思路+三翻四震举例说明
· 文心一言大模型使用指南
· ChatGPT提示词万能模板:BRTR原则,让ChatGPT完美理解你的需求
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
【语音领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
CosyVoice-300M # 进入项目环境 export PYTHONPATH=third_party/AcademiCodec:third_party/Matcha-
TTS
asr
tts
声音
腾讯
深度体验3天后,我把腾讯这款copilot锁进了程序坞
与多元化的功能相反,ima的首页并不复杂,就像传统搜索
引
擎
的主页,交互入口十分直接明了。
copilot
ima
知识库
语音
语音识别的未来已来:深入了解faster-whisper的突破性进展
faster-whisper简介 faster-whisper是基于OpenAI的Whisper模型的高效实现,它利用CTranslate2,一个专为Transformer模型设计的快速推理
引
擎
。
语音识别
Faster-Whisper
微信向量检索分析一体化数仓探索:OLAP For Embedding
相比于语义性检索
引
擎
(ES)与专业的高性能检索服务,OLAP 数仓的向量检索能力在场景有何区别?
OLAP
For
Embedding
一体化数仓
提示词
震撼!AI语言模型突破瓶颈,26个提示词原则
引
领GPT-4响应质量飙升57.7%!你的模型还在等什么?
不同的问法会
引
导AI生成不同风格、不同详细程度的答案。
语言模型
提示词
GPT-4
教程
AI声音克隆 | 最全最简教程(权威版)
TTS
的英文全名是 Text To Speech,中文译名是“文本转语音”。
声音克隆
教程
写作
火山写作:一款助力写作能力提升的AI助手
这是由字节跳动的火山
引
擎
团队精心打造的AI创作辅助工具,无论是修改毕业论文、精炼个人简历,还是进行全文修订、检查语法拼写错误,添加生动词汇及灵活修改等,火山写作都能为您提供全方位的协助。
火山写作
工具
文章
Agent
AI Agent的千亿美金问题:如何重构10亿知识工作职业,掀起软件生产革命?
火热的背后是 Agent 的思路为我们带来了 Software 2.0 的图景:LLM 作为推理
引
擎
能力不断增强,AI Agent 框架为其提供结构化思考的方法,软件生产进入“3D 打印”时代,可以根据用户需求进行个性化定制
大模型
AI编程
大模型
姜子牙大模型系列 | 为知识检索而生,Ziya-Reader开源,多个长文本中文任务第一
我们几乎每天都使用搜索
引
擎
,搜索是大模型需求最多的落地应用之一。
大模型
Ziya
教程
【万字长文-进阶教程】一文带你从入门到精通ChatTTS, 手把手教你固定音色、设置语速、添加停顿词、口头语、笑声!!
https://mp.weixin.qq.com/s/3h9NpU5Qn58WzSSeO9Ms9A 基础篇-ChatTTS介绍 ChatTTS 文本转语音项目在github爆火出圈,
引
来大家极大的关注
chattts
tts
文生语音
数字人
数字人之声音克隆:无样本,1分钟样本完美克隆声音,开源
零样本文本到语音(
TTS
): 输入 5 秒的声音样本,即刻体验文本到语音转换。
数字人
声音克隆
GPT-SoVITS
盘点字节跳动最新的AI应用
#65039;⃣ 今日头条的小悟空(200+AI工具集,海外名称为ChipChop),4️⃣ 大力教育的河马爱学(AI辅助学习工具),5️⃣ 巨量
引
擎
的即创
字节
AI工具
开源
【开源项目】Flow Matching 语音合成
CFM是一种新技术,已被证明可以改进扩散模型,Meta的Voicebox模型将CFM
引
入语音合成领域,下面是voicebox的一个工作流程图 Matcha-
TTS
是第一个开源conditional
音视频
Flow
Matching
Sora
OpenAI Sora视频生成模型技术报告中英全文+总结+影响分析
•技术细节写得比较泛(防止别人模仿)大概就是用视觉块编码(visual patch)的方式,把不同格式的视频统一编码成了用transformer架构能够训练的embeding,然后
引
入类似diffusion
sora
openai
视频生成
工具
AIGC工具提示词技巧
以前,我们和软件对话用的是搜索的逻辑:把我们想要的结果、方向描述出来放到浏览器、搜索
引
擎
做检索。
AIGC
提示词
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100