首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 全新换脸工具ReActor,比roop更强!
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 为你推荐开源项目:Meridian——专属个人情报站!
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· ChatGLM智谱清言
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· 阿里Qwen3系列模型惊艳亮相
· 你的下一个浏览器,可以是豆包电脑版!
· ComfyUI安装及生成第一张图
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
心理
万字长
文
,大
语
言模型如何宣告心理学的死亡?
他设想了一个不懂
中
文
的英
语
母
语
者被关在一个装满
中
文
符号和指令书的房间里。
大语音模型
数字人
腾讯开源的数字人MuseTalk到底行不行?
该模型能够根据输入的
音
频信号,自动调整数字人物的面部图像,使其唇形与
音
频内容高度同步。
MuseTalk
数字人
音频
神奇的 OuteTTS - 0.1 - 350M:用几秒钟
音
频克隆声
音
的黑科技!
就像一条简洁的高速公路,直接将
文
本输入转化为
语
音
输出,避免了繁琐的
中
间转换环节,提高了
语
音
合成的效率和速度。
OuteTTS-0.1-350M
音频
工具
TTS它又来了!OpenVoice:一款借鉴于TTS实现的强大的AI
语
音
克隆工具!
各种AI工具也层出不穷,其
中
语
音
克隆技术 也是尤为引人瞩目的产品之一。
tts
文本转语音
13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
Fish Speech是一款由Fish Audio开发的开源的
文
本到
语
音
(TTS)工具,支持英
语
、日
语
、韩
语
、
中
文
、法
语
、德
语
、阿拉伯
语
和西班牙
语
。
Fish
Speech
本地搭建
Stable Diffusion
【ComfyUI】Blender+Stable Diffusion!少年啊,这盛世如你所愿!(附
中
文
汉化插件)
我们就先随便选择一个“
文
生图”
中
的“基础+自定VAE”吧。
开源模型
大模型
OCR终结了?旷视提出可以
文
档级OCR的多模态大模型框架Vary,支持
中
英
文
,已开源!
以往这一任务需要
文
本识别、布局检测和排序、公式表格处理、
文
本清洗等多个步骤—— 这一次,只需一句话命令,多模态大模型 Vary 直接端到端输出结果: 无论是
中
英
文
的大段
文
字
OCR
手写
文字识别
开源
【
语
音
领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
SenseVoice模型具有的功能特点: 多
语
言
语
音
识别:SenseVoice 支持包括
中
文
、英
文
、粤
语
、日
语
和韩
语
在内的多
语
言识别。
asr
tts
声音
OCR
中
文
OCR超越GPT-4V,参数量仅2B,面壁小钢炮拿出了第二弹
此外,MiniCPM-V 2.0 还具备了独家的跨
语
言多模态泛化技术,让大模型可以用
中
文
解读英
文
菜单并给出推荐。
MiniCPM
大模型
大模型
姜子牙大模型系列 | 为知识检索而生,Ziya-Reader开源,多个长
文
本
中
文
任务第一
因此,关于检索增强的大模型的研究如火如荼,为了能从多个
文
档或超长
文
档
中
找到答案,各种超长上下
文
窗口的模型已经陆续发布。
大模型
Ziya
写作
15个
中
文
AI写作提示词帮你覆盖所有主流写作场景!!!
请确保推
文
内容
中
不包含任何有争议或不适当的信息,并尽可能使用流畅、自然的
语
言。
写作
prompt
提示词
Sora
OpenAI Sora视频生成模型技术报告
中
英全
文
+总结+影响分析
、
音
效、视频AI生成的可用工具都已齐备,一个人可以无痛carry一个短片,好故事将价值千金,有才华的人更难被埋没。
sora
openai
视频生成
开源
17K star!30秒偷走你的声
音
,开源声
音
克隆工具
生成
语
音
的
语
言和参考
语
音
的
语
言都不需要出现在大规模说话人多
语
言训练数据集
中
。
OpenVoice
声音克隆
开源
ComfyUI
手把手教你用上SDXL——SDXL 1.0 模型资源/comfyUI
中
文
一键包下载
本
文
将着重介绍在你自己的电脑上部署SDXL1.0,因为各类在线使用网站
中
,虽然体验有了较大的优化,但是多多少少还是需要你掏出一定的经济代价。
SDXL
下载
开源
昆仑万维携Skywork-13B打造AI新纪元:600GB
中
文
数据集全球开源
它不仅开源了130亿参数的大模型,更罕见地配套开源了600GB、150B Tokens的超大高质量
中
文
数据集,为全球AI研究者提供了前所未有的资源。
Skywork
开源
数据
<
...
3
4
5
6
7
8
9
10
11
12
...
>
1
2
4
5
6
7
8
9
100