首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 国产视频制作之光-可灵:提示词大全整理
· 数字人直播哪家强?百度、硅基、风平与闪剪四大AI数字人横向评测!
· 13个神级Chatgpt指令,助你小说丝滑过审
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· SDXL模型lora训练参数详细设置,显存占用22G,不用修脸原图直出
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· AI声音克隆 | 最全最简教程(权威版)
· 数字人之声音克隆:无样本,1分钟样本完美克隆声音,开源
· 微信中和 AI 进行对话
· Suno音乐新手指南(手把手完整版教程)
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
数字人
Threejs: 数字人生成金色动
态
粒子效果
昨天的文章提到通过修改数字人的材质做全息投影仪的动
态
效果,今天分享一下生成金色动
态
粒子人的代码,效果图如下: 效果中还包含多个粒子效果的动
态
转换,有了这个,再加上摄像头,就可以完全模拟亚运会的数字人效果了
Threejs
数字人
开源
GLM4 开源了!!!还有多模
态
【https://github.com/THUDM/GLM-4】 高级功能,一应俱全 多轮对话:GLM-4-9B-Chat 支持流畅的多轮对话
体
验。
智普
ChatGLM
多模态
阿里
体
验完阿里的EMO模型,我emo了
简单来说,EMO(Emote Portrait Alive)是一个AI肖像视频生成系统,能够通过输入单一的参考图像,生成具有一定表现力的面部标签和各种头部
姿
态
。
EMO
文生图
开源
构建开源多模
态
RAG系统
本质上,RAG通过允许模型从外部来源动
态
检索实时信息,增强了AI响应的特异性。
RAG
大模型
大模型
中文版开源Llama 2同时有了语言、多模
态
大模型,完全可商用
Llama 2 模型系列包含 70 亿、130 亿和 700 亿三种参数变
体
,相比上一代的训练数据增加了 40%,在包括推理、编码、精通性和知识测试等许多外部基准测试中展示出了优越的表现,且支持多个语种
开源模型
【提前
体
验GPT-5】吴恩达AI智能
体
工作流详细解读
这里的方法是针对一个智能
体
而言,吴恩达博士还提到,由此很容易让人联想到从一个智能
体
到多个不同功能智能
体
的扩展,这就是第四种设计模式的思想。
GPT-5
智能体
Agent
AI Agent / 智能
体
观察笔记(中)
每一个智能
体
的
身
份、职业和与其他人的关系,都包含在一个一段话的提示词之中。
大模型
对于AI,我们现阶段可以有的
态
度
如果想让他帮你做些更专业的更具
体
的更精准的,能为你所用的内容生成,你还真需要下点功夫去学习下如何与AI交流的自然语言编程。
文生图
LLM
LLM native策略的内部状
态
是否应该结构化 【2023Q3】
2、场景1:内部状
态
明确 如果业务的场景仍然是上述举例的订火车票,那么很明显内部状
态
是【明确】的。
大模型
XX来信: 智能
体
设计模式2:Reflection
智能
体
工作流不是让LLM直接生成最终输出,而是多次提示LLM,使其有机会逐步构建更高质量的输出。
Reflection
智能体
开源
来个优秀的开源人脸识别项目!
生物识别技术是一种利用人
体
自
身
特征进行
身
份认证的技术。
人脸识别
开源项目
Agent
Kimi+扣子Coze,我零门槛制作了一个好用的智能
体
Agent | 智能
体
开发
Kimi+扣子的合作: 1.对于扣子而言,如虎添翼扣子已经是国内智能
体
开发功能比较完善、生
态
比较丰富的平台了。
Kimi
扣子Coze
大模型
大模型
最强国产开源多模
态
大模型MiniCPM-V:可识别图片、视频,还可在端侧部署
MiniCPM-V是面向图文理解的端侧多模
态
大模型系列。
minicpm
面壁
大模型
炸裂!百川开源第1个7B多模
态
大模型 Baichuan-Omni | 能够同时分析图像/视频/音频/文本
突出多模
态
能力和交互
体
验的 GPT-4o 强调了其在实际应用中的关键作用,然而它缺乏一个高性能的开源对应物。
Baichuan-Omni
多模态大模型
被高估的Pika,被低估的多模
态
AI
例如,在医疗领域可以通过结合图像、录音和病历文本,提供更准确的诊断和治疗方案;在交通领域,结合图像和传感器数据,带来更智能、更安全的自动驾驶
体
验;在教育领域,将文本、声音、视频相结合,呈现更具互动性的教育内容
大模型
多模态
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100