首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 通义千问
· 国产视频制作之光-可灵:提示词大全整理
· 从专业ASR到统一音频LLM:七大顶尖模型的深度对比分析
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 和大模型相关的一些术语(持续更新中)
· ComfyUI 基础教程(一)环境部署和插件安装
· 铁锅炖blender+ComfyUI配置,更改模型地址
· ComfyUI官方使用手册【官网直译+关键补充】
· 赛博牛马,智谱 AI,悄悄出了一个 AI PPT
· 大模型评测新思路:弱智吧精华问题大全
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
RAG
构建
开
源
多模态RAG系统
在这个新的冒险中,我们将深入研究使用
开
源
大型语言多模态(LLMM)构建检索增强型生成(RAG)系统的过程。
RAG
大模型
搞了一个Dify
开
源
知识库
初衷:也是在机缘巧合下,感谢MAX和众多大佬的呼声支持下,临时组建了这么一个dify
开
源
交流社区
Dify
大模型
知识库
OpenAI
开
源
打败闭
源
?Meta即将推出
开
源
代码生成平台Code Llama,剑指OpenAI Codex
据科技外媒 The Information 援引消息人士的说法,Meta 的代码生成 AI 模型“Code Llama”为
开
源
项
目
,最快可能在本周推出。
开源模型
大模型
中国电信
开
源
星辰AI大模型:央企中首个完成LLM研发和
开
源
的选手诞生
没想到啊,
开
源
大模型家族里,居然挤进来一位特别的选手: 来自央企,身份为运营商。
开源大模型
电信
大模型
中文版
开
源
Llama 2同时有了语言、多模态大模型,完全可商用
可以说,AI 初创公司 LinkSoul.Al 的这些
开
源
项
目
让海外
开
源
大模型在国内的普及和推广速度与国际几乎保持了一致。
开源模型
大模型
苹果一次性
开
源
了8个大模型! 包含模型权重、训练日志和设置,OpenELM全面
开
源
不以
开
放性著称的苹果居然同时
开
源
了大模型的权重、训练和评估框架,涵盖训练日志、多个保存点和预训练设置。
OpenELM
大模型
大模型
MaskGCT:登上GitHub趋势榜榜首的TTS
开
源
大模型
MaskGCT已在香港中文大学(深圳)与上海人工智能实验室联合
开
发的
开
源
系统Amphion发布,Amphion今天登上了Github global trending榜首!
MaskGCT
声音克隆
MiniCPM 4.1
开
源
!代码、数学推理速度快了 3 倍!
MiniCPM 4.1 亮点一览 首个原生稀疏架构的深思考模型,通过可训练稀疏注意力创新,代码、数学推理等任务的推理速度比同尺寸
开
源
模型快 3 倍以上。
MiniCPM 4.1
开源模型
阿里
阿里巴巴语音实验室发布
开
源
语音处理框架ClearerVoice-Studio,支持语音增强、分离、
目
标说话人提取
Speech Enhancement)、语音分离(Speech Separation)和音视频扬声器提取(Audio-Video Speaker Extraction)功能,能够在嘈杂环境中清理音频、分离复杂声
源
并结合音频和视觉数据锁定
目
标发声者
ClearerVoice-Studio
语音
Falcon 180B
开
源
影响了谁?
短期的影响主要是技术层面,中长期看,对国内大模型厂商的小规格模型
开
源
+大规格模型商用的模式会有一定的冲击,因为客户多了一个基于
开
源
微调的选
项
; 但即便在Falcon180B模型上微调, 需要投入的软硬件资
源
和人力时间成本对于企业客户都是不小的
开
销
大模型
大模型
腾讯
开
源
混元AI绘画大模型
最近大厂的大模型竞争激烈,百度的文心一言主打闭
源
和付费路线,阿里的通义千问主打
开
源
免费路线,而腾讯的混元大模型,则不温不火。
腾讯
混元
文生图
书生·万卷:难得的中文
开
源
数据集
全球最大的AI
开
源
社区Huggingface上,已经有5万多的
开
源
数据集了,其中涉及中文的数据集只有区区可怜的151个。
大模型
视频
语音、视频转文字神器:
开
源
whisper介绍
Whisper模型的训练过程非常复杂,需要大量的计算资
源
和时间。
人工智能
大模型
wisper
数字人
腾讯
开
源
的数字人MuseTalk到底行不行?
MuseTaIk是由腾讯团队
开
发的先进技术,它是一个实时高质量的音频驱动唇部同步模型。
MuseTalk
数字人
音频
大模型
开
源
的大模型数据集
大模型的算法模型
开
源
越来越多,大模型工程化也越来越稳定。
开源模型
数据集
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100