首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· MidjourneyAPI
· 国内厂商语音识别与Whisper评测:现状与概况对比
· StableDiffusion模型推荐系列(功能型)
· 造梦师手记:足控专属AI大模型,完美的少女
· Suno音乐新手指南(手把手完整版教程)
· 一个充满多智能体的数字社会正在浮现,商业的底层逻辑已进入重构倒计时
· windows安装向量数据库milvus
· 超详细的 Stable Diffusion ComfyUI 基础教程(三):Refiner 细化流程
· 解读 | SuperCLUE 2023年9月全面测评大模型四大能力
· 45个 DALL-E 3 使用案例 (附提示词) ,人人都是设计师
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
语音
「语音识别的未来已来」——探索Distil-Whisper,轻量级AI的强大力量
在AI
技
术
的浪潮中,一款新型的语音识别模型Distil-Whisper以其独特的魅力和强大的性能脱颖而出。
Distil-Whisper
语音识别
大模型
开源大模型部署及推理所需显卡成本必读:也看大模型参数与显卡大小的大致映射策略
在前面的文章中,我们介绍了大模型占用显卡空间的一些
分
析
情况,这次我们继续来看看具体量化角度上的结论。
开源模型
ChatGPT
爆肝两天!ChatGPT+提示词解决知识库目录混乱
对于职场新手可能缺乏有效的知识管理和
分
类
技
巧,导致知识库变得错综复杂。
智能分类
大模型
知识库
开源
开源即巅峰!微软VibeVoice 7B模型:跨语言、多说话人、长文本一次到位
微软最近开源的VibeVoice模型,以其创新的
技
术
和卓越的性能,为这一领域带来了重大突破。
VibeVoice
7B
语音
AGI
通往AGI之路:思维链提示过程
今天
分
享提示词的进阶学习内容,思维链提示。
思维链
提示词
RAG
一文看懂RAG:大语言模型落地应用的未来
RAG
技
术
为何如此重要?
rag
检索增强
人工智能
如何用人工智能协助我提高写代码的效率
如何利用人工智能技术提高编程效率?您可以将代码发送给AI,让其为您解释、注释、优化和重构代码。
人工智能
编程
阿里
阿里&字节发表VividTalk,只需单张照片即可根据音频生成栩栩如生的人物说话头像视频
它通过先进的音频到3D网格映射
技
术
和网格到视频的转换
技
术
,实现了高质量、逼真的音频驱动的说话头像视频生成。
VividTalk
视频
开源
阿里巴巴语音实验室发布开源语音处理框架ClearerVoice-Studio,支持语音增强、
分
离、目标说话人提取
虽然音频
技
术
日新月异,但许多现有方案在复杂场景中仍难以提供稳定且高质量的音频体验。
ClearerVoice-Studio
语音
工具
20个常见AI绘画工具大汇总(含免费版哦~)
AI绘画是指使用人工智能(Artificial Intelligence,AI)
技
术
生成或辅助创作绘画作品的过程。
文生图
让AI帮你读财报:Reportify让你看得清、聊得深
Reportify是一款帮助人们解读公司财报的AI
分
析
工具。
Reportify
读财报
数据库
主流向量数据库一览
推荐的计算两个向量之间距离推荐的算法为: 余弦相似度函数, 其表达式如下: 常见的向量数据库 向量检索是一个革命性的
技
术
,使得开发者和工程师可以将知识或数据向量化之后实现更有效的存储
向量数据库
Sora
快手版Sora「可灵」开放测试:生成超120s视频,更懂物理,复杂运动也能精准建模
它采用了Sora相似的
技
术
路线,结合多项自研
技
术
创新,生成的视频不仅运动幅度大且合理,还能模拟物理世界特性,具备强大的概念组合能力和想象力。
可灵
快手
文生视频
语音
语音识别的新拐点:OLMoASR 带来的机会
当我们说话时,机器能立即理解并执行——这不仅是
技
术
的突破,更是人机沟通方式的重塑。
OLMoASR
语音识别
大模型
视频大模型训练相关词条解释
它不仅能够根据文字指令创造出既逼真又充满想象力的场景,而且能生成长达1
分
钟的超长视频,不管是一镜到底还是
分
镜头切换模式,都能够保持角色及背景神一般的一致性和稳定性。
视频生成
sora
词条
<
...
15
16
17
18
19
20
21
22
23
24
...
>
1
2
4
5
6
7
8
9
100