首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· GenColor.ai
· 为你推荐开源项目:Meridian——专属个人情报站!
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· AI换脸工具:facefusion使用心得
· 变天了,AI可以一键生成中文海报了......
· 详解Stable Diffusion提示词prompt语法
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 大模型中的Top-k、Top-p、Temperature详细含义及解释
· 企业数字化转型的“阿里阿德涅之线”在哪?
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
大模型
从零
开
始了解
AI
大模型 - 概念篇:一文带你走进大模型世界
背景:ChatGPT - 或许是2022年末
开
始至今最热的新词之一,这个词汇如热浪一般席卷大街小巷,充斥朋友圈和各大网站,它的爆火程度简直让人瞠目结舌。
大模型
Llama 3突然来袭!
开
源
社区再次沸腾:GPT-4级别模型可以自由访问的时代到来
并且推出即为
开
源
SOTA: Meta官方数据显示,Llama 3 8B和70B版本在各自参数规模上超越一众对手。
meta
llama3
如何从零
开
始,打造一家
AI
驱动的公司?
很多读者找到我们,可能现在有好的创业方向和idea,作为普通个体,甚至没有任何编程基础,该如何从零
开
始打造一家
AI
驱动的公司?
大模型
打造公司
大模型
最强
开
源
大模型Llama 3,在扎克伯格设想中其实是这样的
视频中,扎克伯格不仅聊到了Llama 3模型,还聊到了
AI
技术创新、元宇宙、
开
源
问题等,可谓干货十足。
Llama
3
大语言模型
视频
GPT-4o实时语音方案提供商Livekit
开
源
voice agent:轻松处理音视频流
在本地计算机上
开
发的代理代码在部署到生产中的服务器时,可以扩展以支持数千个并发会话。
voice
agent
开源
音视频
阿里
开
源
版妙鸭相机来了,无限出个人写真图(阿里达摩院出品)
FaceChain支持在gradio的界面中使用模型训练和推理能力,也支持资深
开
发者使用python脚本进行训练推理。
妙鸭相机
大模型
最佳
开
源
文生图大模型可图:安装与批量出图的完整教程
Kolors可图是快手Kolors团队
开
发的基于潜在扩散的大规模文本到图像生成模型。
可图
kolors
数字人
数字人之声音克隆:无样本,1分钟样本完美克隆声音,
开
源
win cuda 介绍,下载我给你的一键包后点击go-webui.bat,直接启动 启动后界面如下: 首先从数据
开
始
数字人
声音克隆
GPT-SoVITS
视频
爆火「视频版ControlNet」
开
源
了!靠提示词精准换画风,全华人团队出品
目前,团队已将这一方法在GitHub上
开
源
。
ControlNet
ChatGLM
更快更好的chatglm3来了
ChatGLM3 是智谱
AI
和清华大学 KEG 实验室联合发布的新一代对话预训练模型。
开源模型
ChatGLM
详解 Diffusion (扩散) 模型
稳定扩散是 OpenAI Dalle.2 的
开
源
替代品。
Diffusion
开源模型
QWen1.5: 卓越模型之路
在此次Qwen1.5版本中,
开
源
了包括0.5B、1.8B、4B、7B、14B和72B在内的6个不同规模的Base和Chat模型,并一如既往地放出了各规模对应的量化模型。
Qwen1.5
开源模型
Agent
只需四步就能构建自己的Agent!达摩院新
开
源
框架小白也能用
开
发者们可以参考上述教程很容易搭建属于自己的智能体,ModelScope-Agent 依托魔搭社区,未来会适配更多新增的
开
源
大模型,推出更多应用。
大模型
F5-TTS:上海交大
开
源
超逼真声音克隆TTS,告别ElevenLabs,以后就用它了!实测真的很牛
音频克隆的
开
源
项目很多,但是每次项目里要用的时候,总还是惦记着11labs的api。
F5-TTS
音频克隆
SDXL
俄罗斯人
开
源
了最大的文生图模型:参数量12B,比SDXL大了3倍多!
在
开
源
Kandinsky 2.2之后,俄罗斯
AI
研究团队
AI
Forever又
开
源
了新的文生图模型Kandinsky-3,这个模型最特别之处时采用了一个超大的text encoder(参数量为8.6B)
Kandinsky-3
文生图
开源模型
<
...
8
9
10
11
12
13
14
15
16
17
...
>
1
2
4
5
6
7
8
9
100