首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· AI写作不如意?万字长文深度剖析背后原因
· Ollama还是vLLM?深度解析四大顶级LLM服务框架:性能、特性与技术选型指南
· 6.2K Star!MIT出品的多语言语音合成神器,CPU实时推理吊打商业软件!
· 个人从零预训练1B LLM心路历程
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· ChatGPT论文润色进阶指令
· 国内外开源大语言模型一览表
· 还没有上手Stable Diffusion XL 1.0 的同学,看这篇文章就够了
· Midjourney AI绘画美女提示词分享二
· Stable Diffusion|提示词高阶用法(三)角色指定
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
数字人
数字人:从科幻走向现实的技术革命
创建数字人需要多方面的技术支持,包括计算机图形学、动作捕捉、
语
音
合成以及人工智能算法等。
数字人
语音
数字人
腾讯开源的数字人MuseTalk到底行不行?
该模型能够根据输入的
音
频信号,自动调整数字人物的面部图像,使其唇形与
音
频内容高度同步。
MuseTalk
数字人
音频
心理
万字长
文
,大
语
言模型如何宣告心理学的死亡?
他设想了一个不懂
中
文
的英
语
母
语
者被关在一个装满
中
文
符号和指令书的房间里。
大语音模型
工具
TTS它又来了!OpenVoice:一款借鉴于TTS实现的强大的AI
语
音
克隆工具!
各种AI工具也层出不穷,其
中
语
音
克隆技术 也是尤为引人瞩目的产品之一。
tts
文本转语音
13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
Fish Speech是一款由Fish Audio开发的开源的
文
本到
语
音
(TTS)工具,支持英
语
、日
语
、韩
语
、
中
文
、法
语
、德
语
、阿拉伯
语
和西班牙
语
。
Fish
Speech
本地搭建
Stable Diffusion
【ComfyUI】Blender+Stable Diffusion!少年啊,这盛世如你所愿!(附
中
文
汉化插件)
我们就先随便选择一个“
文
生图”
中
的“基础+自定VAE”吧。
开源模型
开源
【
语
音
领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
SenseVoice模型具有的功能特点: 多
语
言
语
音
识别:SenseVoice 支持包括
中
文
、英
文
、粤
语
、日
语
和韩
语
在内的多
语
言识别。
asr
tts
声音
神奇的 OuteTTS - 0.1 - 350M:用几秒钟
音
频克隆声
音
的黑科技!
就像一条简洁的高速公路,直接将
文
本输入转化为
语
音
输出,避免了繁琐的
中
间转换环节,提高了
语
音
合成的效率和速度。
OuteTTS-0.1-350M
音频
大模型
OCR终结了?旷视提出可以
文
档级OCR的多模态大模型框架Vary,支持
中
英
文
,已开源!
以往这一任务需要
文
本识别、布局检测和排序、公式表格处理、
文
本清洗等多个步骤—— 这一次,只需一句话命令,多模态大模型 Vary 直接端到端输出结果: 无论是
中
英
文
的大段
文
字
OCR
手写
文字识别
OCR
中
文
OCR超越GPT-4V,参数量仅2B,面壁小钢炮拿出了第二弹
此外,MiniCPM-V 2.0 还具备了独家的跨
语
言多模态泛化技术,让大模型可以用
中
文
解读英
文
菜单并给出推荐。
MiniCPM
大模型
大模型
姜子牙大模型系列 | 为知识检索而生,Ziya-Reader开源,多个长
文
本
中
文
任务第一
因此,关于检索增强的大模型的研究如火如荼,为了能从多个
文
档或超长
文
档
中
找到答案,各种超长上下
文
窗口的模型已经陆续发布。
大模型
Ziya
开源
17K star!30秒偷走你的声
音
,开源声
音
克隆工具
生成
语
音
的
语
言和参考
语
音
的
语
言都不需要出现在大规模说话人多
语
言训练数据集
中
。
OpenVoice
声音克隆
开源
ComfyUI
手把手教你用上SDXL——SDXL 1.0 模型资源/comfyUI
中
文
一键包下载
本
文
将着重介绍在你自己的电脑上部署SDXL1.0,因为各类在线使用网站
中
,虽然体验有了较大的优化,但是多多少少还是需要你掏出一定的经济代价。
SDXL
下载
写作
15个
中
文
AI写作提示词帮你覆盖所有主流写作场景!!!
请确保推
文
内容
中
不包含任何有争议或不适当的信息,并尽可能使用流畅、自然的
语
言。
写作
prompt
提示词
Sora
OpenAI Sora视频生成模型技术报告
中
英全
文
+总结+影响分析
、
音
效、视频AI生成的可用工具都已齐备,一个人可以无痛carry一个短片,好故事将价值千金,有才华的人更难被埋没。
sora
openai
视频生成
<
...
3
4
5
6
7
8
9
10
11
12
...
>
1
2
4
5
6
7
8
9
100