首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 赛博牛马,智谱 AI,悄悄出了一个 AI PPT
· PPT又又有新突破了!智谱AI代码流造PPT
· Ollama还是vLLM?深度解析四大顶级LLM服务框架:性能、特性与技术选型指南
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 结构化Prompt必备基础:5分钟学会Markdown语法,实现提示词创作自由!
· 免费的文本生成视频解决方案:AnimateDiff下载-可用于StableDiffusion的webui以及ComfyUI
· AI创作 |如何通过GPT进行漫画视频的故事改写
· 深入探讨:Agent全自动写作长篇小说技术原理解析
· 终极福利:15个中文AI写作提示词帮你覆盖所有主流写作场景!!!
· 为你推荐开源项目:Meridian——专属个人情报站!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
炸裂!百川开源第1个7B多
模
态
大
模
型
Baichuan-Omni | 能够同时分析图像/视频/
音
频/文本
在本文中,作者介绍了 Baichuan-Omni,这是第一款开源的 7B 多
模
态
大
语
言
模
型
(MLLM),能够同时处理和分析图像、视频、
音
频和文本的
模
态,同时提供先进的
模
态交互体验和强
大
性能。
Baichuan-Omni
多模态大模型
开源
OpenAI开源
大
模
型
调测工具Transformer Debugger:可以在训练
大
模
型
之前理解
模
型
的运行情况并干预
这个工具可以帮助开发者调测
大
模
型
的推理情况,帮助我们理解
模
型
的输出并提供一定的解释支持。
大模型
调试工具
国内厂商
语
音
识别与Whisper评测:现状与概况对比
一、
语
音
识别现状 二、评测意义与预期成果 三、评测方案 四、评测结果 一、
语
音
识别现状 得益于近年来深度学习技术的快速发展,人工智能的主要分支(图像、
语
音
、自然
语
言处理等)都相继进入了
大
规
模
落地应用阶段
语音识别
Faster-Whisper
微调
【
大
模
型
微调】 Llama 2 :对话
模
型
的全过程微调
该项工作的作者提出 Llama 2
模
型
:这是经过一系列 预训练和微调的
大
语
言
模
型
(LLM),其参数规
模
从 7B 亿到 70B 不等。
大模型
开源
阿里云开源通义千问多
模
态
大
模
型
Qwen-VL,持续推动中国
大
模
型
生态建设
8月25日消息,阿里云推出
大
规
模
视觉
语
言
模
型
Qwen-VL,一步到位、直接开源。
大模型
编程
国产编程
大
模
型
CodeGeex
CodeGeeX: 多
语
言代码生成
模
型
架构:CodeGeeX是一个基于transformers的
大
规
模
预训练编程
语
言
模
型
。
编程
工具
TTS它又来了!OpenVoice:一款借鉴于TTS实现的强
大
的AI
语
音
克隆工具!
而 OpenVoice 作为一款强
大
的多
语
言即时
语
音
克隆AI工具,可以为用户提供高效、个性化的
语
音
克隆服务,是一款值得推荐的项目。
tts
文本转语音
AI里的
大
模
型
,你了解么
AI
大
模
型
是“人工智能预训练
大
模
型
”的简称,是指具有
大
量参数和复杂结构的机器学习
模
型
。
人工智能
开发
语
音
产品时设计唤醒词和命令词的技巧
在实际开发
语
音
产品过程中,要达到好的
语
音
识别效果,除了
语
音
算法要给力外,设计出好的唤醒词和命令词也能起到事倍功半的效果。
语音产品
唤醒词
命令词
开源
开源的
大
模
型
数据集
大
模
型
的算法
模
型
开源越来越多,
大
模
型
工程化也越来越稳定。
开源模型
数据集
大
模
型
的研究新方向:混合专家
模
型
(MoE)
随着不同应用场景的实际需求,
大
模
型
的参数会变得越来越
大
,复杂性和规
模
不断的增加,尤其是在多
模
态
大
模
型
的开发中,每个数据集可能完全不同,有来自文本的数据、图像的数据、
语
音
的数据等,包含不同的
模
式,特征和标注之间的关系可能也
大
有不同
MoE
大模型
换脸
除了深度换脸、
模
拟配
音
,还能口
型
匹配的AI软件出现了
目前LipDub 支持28种
语
言,包括韩
语
、西班牙
语
、捷克
语
、泰米尔
语
和乌克兰
语
,它采用零镜头
模
式,可以在Captions的视频生成
模
型
在没见过主题的情况下推出流畅的视频。
AI
打造
音
乐传奇:Suno推出
音
乐生成
模
型
Suno V3,让每个人都能成为作曲家
Suno AI全新
音
乐生成
模
型
Suno V3来临,掀起
音
乐界"ChatGPT时刻",人人皆可成为作曲家、歌手,瞬间超越自我,打造独一无二
音
乐专辑就在此刻!
suno
歌曲
音乐
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,
语
音
识别数倍加速
前段时间,「霉霉
大
秀中文」的视频在各个社交媒体走红,随后又出现了「郭德纲
大
秀英
语
」等类似视频。
语音
HeyGen
工具
惊艳推荐!8款好用又免费的文本转
语
音
TTS工具
这种技术使用深度神经网络
模
型
来合成
语
音
,能够更自然地
模
拟人类的发
音
和
语
调,从而产生更加流畅和自然的
语
音
输出。
TTS
Maker
语音
<
...
3
4
5
6
7
8
9
10
11
12
...
>
1
2
4
5
6
7
8
9
100