首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· ChatGLM智谱清言
· 赛博牛马,智谱 AI,悄悄出了一个 AI PPT
· 终极福利:15个中文AI写作提示词帮你覆盖所有主流写作场景!!!
· 结构化Prompt必备基础:5分钟学会Markdown语法,实现提示词创作自由!
· AI创作 |如何通过GPT进行漫画视频的故事改写
· PPT又又有新突破了!智谱AI代码流造PPT
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 第3期 SDXL和SD的10大区别!你知道几个?
· 深入探讨:Agent全自动写作长篇小说技术原理解析
· Stable Diffusion 加速/优化/升级 优化出图速度
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
生成
式
AI与大
语
言模型的区别
它利用机器学习算法分析
音
乐数据中的模
式
,并根据输
入
和风格偏好生成新颖的作品。
生成式AI
大语言模型
区别
爆肝7天!AI艺术字终极攻略,光影、隐藏、
嵌
入
、海报4种艺术字全拆解
ControlNet参数四大步骤 你只需要一步一步跟着操作,也能做出同款的AI艺术字 1.光影文字 2.
嵌
入
文字 3.隐藏文字 4.海报文字 每种都有对应的使用场景和变现方
式
真正地帮助了生产者提高生产力以及拓宽了变现渠道
文生图
开源
研究人员开源中文文本
嵌
入
模型,填补中文向量文本检索领域的空白
中文开源文本
嵌
入
模型中最被广泛使用的 text2vec 主要是在中文自然
语
言推理数据集上进行训练的。
GPT
企业
初创企业必知的 30种商业模
式
(附
实
例)
虽说合适的商业模
式
是要在
实
践中摸索,但提前对各种商业模
式
有所了解总是有用的。
初创
商业模式
开源
开源
语
音
大
语
言模型来了!阿里基于Qwen-Chat提出Qwen-Audio!
•
音
频
语
言标签:然后,我们引
入
了一个
语
言标签,用于指示
音
频中的口
语
语
言。
大模型
语音
Insanely Fast Whisper:超快的Whisper
语
音
识别脚本
项目简介 这篇内容介绍了OpenAI的Whisper Large v2
语
音
转录模型的超快速能力。
音频
Whisper
解读wav2lip:探究
语
音
驱动唇部动作的技术原理!
本文将深
入
介绍一下wav2lip的技术原理和细节,了解它是如何
实
现
语
音
驱动唇部运动的!
wav2lip
语音
开源
网易有道强力开源中英双
语
语
音
克隆
推理输
入
文本格
式
是: <speaker>|<style_prompt/emotion_prompt/content>|<phoneme>|<content>
语音
开源
开源
从声纹模型到
语
音
合成:
音
频处理 AI 技术前沿 | 开源专题 No.45
· 可以
实
现高效率、低延迟的
实
时
语
音
变化; · 跨平台兼容性强,适用于 Windows、Mac(M1)、Linux 等系统; espnet/espnet[3] Stars: 
AudioCraft
音频
开源
【开源项目】Flow Matching
语
音
合成
CFM是一种新技术,已被证明可以改进扩散模型,Meta的Voicebox模型将CFM引
入
语
音
合成领域,下面是voicebox的一个工作流程图 Matcha-TTS是第一个开源conditional
音视频
Flow
Matching
ChatGPT
模拟ChatGPT流
式
数据——SSE最佳
实
践(附可运行案例)
在使用 ChatGPT
时
,发现输
入
prompt 后,是使用流
式
的效果返回的数据,起初以为使用了 双工协议做的持久化连接,查看其网络请求,发现这个接口的通信方
式
并非传统的 http 接口或者 WebSockets
GPT
教程
【万字长文-进阶教程】一文带你从
入
门到精通ChatTTS, 手把手教你固定
音
色、设置
语
速、添加停顿词、口头
语
、笑声!!
对话
式
TTS: ChatTTS针对对话
式
任务进行了优化,
实
现了自然流畅的
语
音
合成,同
时
支持多说话人。
chattts
tts
文生语音
大模型
实
测15款AI大模型
实
时
新闻搜索能力:金融业资讯获取哪家强?
· 需“打假”:腾讯元宝混
入
7月15日数据;秘塔搜索同
时
出现2024和2025年内容;智普清言日期混乱。
AI
大模型
腾讯
腾讯的 PhotoMaker - 更快 更像 更可控的 AI Avatar
它主要通过堆叠ID
嵌
入
方
式
编码任意数量的输
入
ID图像,以保留ID信息。
PhotoMaker
文生图
开源
开源免费离线
语
音
识别神器whisper如何安装
whisper介绍 Open AI在2022年9月21日开源了号称其英文
语
音
辨识能力已达到人类水准的Whisper神经网络,且它亦支持其它98种
语
言的自动
语
音
辨识。
wisper
翻译
免费
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100