首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· GLM-4-Voice 9B——实时多语言语音对话 AI——几分钟内即可在本地安装
· 开发语音产品时设计唤醒词和命令词的技巧
· 必看!ComfyUI故障应对指南,让您轻松应对每一个挑战
· GPU 性能(数据表)快速参考
· 关于AI声音生成的一切(语音+音乐+嘴型)
· Westlake - Omni:西湖心辰推出的全球首个开源的中文情感端 - 端语音交互大模型
· 理解 o3 及其技术分析
· Coze、Dify、FastGPT:哪款智能体平台最强?深度对比分析!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
微软最新模型Phi-3 Mini开源登场!小模型,大未来!
微软的生成式AI研究副总裁塞巴斯蒂安·布贝克指出,Phi-3 Mini 在成本方面有显著优势,可能仅为同类其他模型的十
分
之一左右。
Phi-3
Mini
开源模型
微软
大模型
11个情感刺激Prompt,高效提升AI大模型性能
; 该研究还总结了11个富有情感刺激的Prompt,可以有效触发以上三种理论的作用 1: 写下你的答案并给出一个0-1之间的自信度评
分
。
Prompt
大模型
ComfyUI
AA大佬新作:ComfyUI整合包,打造极简解决方案
确保你的电脑上安装了支持的GPU驱动和必要的软件环境,以便ComfyUI能够充
分
利用你的硬件资源。
comfyui
文生图
工作流程
AGI
和王小川聊再创业这一年:回应朱啸虎、谈中国AGI第三种可能
(本期你将听到以下内容,可拖动音频进度条选取对应段落收听感兴趣的部
分
) • 02:00 对《朱啸虎讲了一个中国现实主义AIGC故事》的读后感 • 04:15
王小川
中国大模型
一张照片秒生不同风格图像!小红书InstantID来了!
分
享就到这里啦,感兴趣的小伙伴们快去试试吧!
InstantID
文生图
Prompt
11个顶级的Prompts,用GPT学习的天花板
创造类比和隐喻简化复杂观念提示:“
分
享如何在[某主题]中创建类比和隐喻的例子,以简化复杂的观念,使它们更容易记忆和理解。”
GPT
Agent
为什么大佬都在说Agent是未来?换个角度来谈一谈
在当下移动互联网/AI1.0时代,我们利用内容自媒体平台和推荐技术完成了内容的生成和内容
分
发,但是当人在获取到信息或者知识后,仍然需要人去完成具体任务(哪怕是AI生成内容本身),这某种程度上是对用户真实需求的
Agent
大模型
开源
微软最新模型Phi-3 Mini开源登场!小模型,大未来!!
微软的生成式AI研究副总裁塞巴斯蒂安·布贝克指出,Phi-3 Mini 在成本方面有显著优势,可能仅为同类其他模型的十
分
之一左右。
Phi-3
Mini
人工智能
实测:本地跑llama3:70B需要什么配置
打开命令行,运行命令 ollama run llama3:70b 几
分
钟以后下载完毕,出现>>>提示符的时候就可以正常的跟70B模型交互了 下面放两张图,对比模型加载前后系统硬件占用情况的对比
llama
GPU内存
自动化神器Autolt:不再重复工作
这些函数是AutoIt Excel UDF提供的一部
分
,通过它们,你可以打开、操作和保存Excel文件。
RPA
自动
大模型
“实时”语音翻译!AI语音具有“情绪”!最强开源AI大模型来了
utm_content=technical_page 官网介绍: https://ai.meta.com/blog/seamless-communication/ 好了,今天的内容就
分
享到这里希望你们喜欢
大模型
开源模型
语音
医疗
惊艳!2.77亿参数锻造出Agent+GPT-4V模型组合,领航AI领航机器人、游戏、医疗革新,通用智能时代你准备好了吗?
结合经验丰富的护士提供的视频字幕和临床文档,模型在医疗任务中的表现得到了显著提升,特别是在视频字幕生成、视觉问答和RASS评
分
预测等方面。
Agent+GPT-4V
大模型
开源
F5-TTS:上海交大开源超逼真声音克隆TTS,告别ElevenLabs,以后就用它了!实测真的很牛
该技术允许模型更精确地模拟目标数据的
分
布,从而提高合成语音的自然性和准确性。
F5-TTS
音频克隆
清华
清华、面壁智能发布:主动式Agent 2.0
评估指标:使用奖励模型对预测任务进行二元
分
类,并与人类标注结果进行比较,计算召回率、精确度、准确度和F1-Score
Agent
2.0
大模型
视频
超越Animate Anyone! 南加大&字节提出MagicPose,不需任何微调就可生成逼真的人类视频
为此,我们提出了一种两阶段的训练策略,以
分
离人体动作和外观(例如面部表情、肤色和着装),包括对同一数据集的人舞姿势的外观控制块的预训练和对外观-姿势-联合控制块的精细调整。
MagicPose
视频
<
...
88
89
90
91
92
93
94
95
96
97
>
1
2
4
5
6
7
8
9
100