首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 为你推荐开源项目:Meridian——专属个人情报站!
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· GenColor.ai
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· Stable Diffusion 30种采样器全解!
· RVC和SVC声音模型难找?推荐这个网站
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· 全新换脸工具ReActor,比roop更强!
· 关于AI声音生成的一切(语音+音乐+嘴型)
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
阿里
阿里推理模型来了!Marco-o1 发布即
开
源
阿里巴巴刚刚发布了一款全新的
开
源推理模型Marco-o1,它不仅专注于标准答案领域,更致力于解决
开
放性问题。
Marco-o1
推理模型
OCR
中文
开
源OCR框架对比及介绍
从
严格定义来看,学字符识别(Optical Character Recognition, OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。
OCR
Ollama 与 Dify:AI 应用
开
发的强强联合
介绍 随着大型语言模型(LLM)的快速发展,它们为 AI 应用
开
发提供了强大的功能和灵活性。
Ollama
Dify
大型语言模型
语音
十大
开
源语音识别项目
本文将为您介绍十个相关的
开
源项目(以github上星标数排名),其中大多数都支持中文。
语音识别
开源项目
数字人
开
源!数字人资源大集合!
从
单目图像恢复 3D 人体网格:一项调查。
数字人
开源
Sora
SD3 正式
开
源 Sora同源架构
这种架构设计使得系统的扩展性更强,能够处理多种类型的输入数据 支持生成视频、3D内容:Stable Diffusion 3.0发布时,将包含一套完整的工具,支持生成视频、3D以及更多类型的内容创作 模型参数量的增加:
从
之前的
SD3
绘画
混合专家模型 (MoE) 详解
让我们
开
始
吧!
MoE大模型
大模型
复旦
开
源中文医疗大模型,基于百川微调,模型和数据集都公
开
可以直接
从
Hugging Face上下载模型权重,或者根据
开
源的项目代码样例中的方式自动获取。
大模型
视频
超越Animate Anyone! 南加大&字节提出MagicPose,不需任何微调就可生成逼真的人类视频
南加州大学&字节提出MagicPose,一种新颖有效的方法,提供逼真的人类视频生成,实现生动的运动和面部表情传输,以及不需要任何微调的一致的野外
零
镜头生成。
MagicPose
视频
微软
微软最新模型Phi-3 Mini
开
源登场!小模型,大未来!
这样,你就能够
开
始
探索和使用各种AI模型,进行各类实验和项目了。
Phi-3
Mini
开源模型
微软
字节
开
源项目MimicTalk:快速打造逼真3D Talking Face的利器
结合高效的微调策略和上下文学习能力的人脸动作生成模型,成功地解决了这一问题NeRF技术允许模型在三维空间中重建物体的形状和外观,而MimicTalk在此基础上进行了优化,使其能够快速适应新的身份特征,
从
而实现个性化
MimicTalk
开源模型
Github
世界上最流行(github排名高)的
开
源移动机器人的操作系统ROS
开
源了!!
这款机器人的主要特点包括
开
源ROS软件、硬件
开
源、小尺寸、低价格、模块化驱动以及强大的扩展性。
ROS
机器人
开源模型
国内
开
源的低代码框架有哪些?
,深度集成java+.net core双技术引擎,具备易维护、便部署、高集成、高效率等多方面特性,面向企业项目提供
开
发服务,提供
开
发构建、
开
放连接、部署运维、在线运营的全生命周期能力。
大模型
语音
【TTS语音克隆
开
源最强王者】5款爆火
开
源模型(Fish、F5、GPT、CosyVoice、MaskGCT)效果对比,等你来评!
零
样本能力:F5-TTS在公共100K小时多语言数据集上训练,展示了高度自然和富有表现力的
零
样本能力,以及无缝的代码切换能力。
语音克隆
开源模型
腾讯
令人惊艳的
开
源图标生成AI模型:ChartLlama (南洋理&腾讯)
今天就介绍一个能够生成各类型图标的
开
源AI大模型:ChartLlama !
ChartLlama
开源模型
图标
<
...
8
9
10
11
12
13
14
15
16
17
...
>
1
2
4
5
6
7
8
9
100