首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· 盘点字节跳动最新的AI应用
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· MiniCPM 4.1 开源!代码、数学推理速度快了 3 倍!
· 语音识别的新拐点:OLMoASR 带来的机会
· Trickle + Nano Banana,我给老婆 VibeCoding 了一个虚拟试衣间
· ChatGLM智谱清言
· Stable Diffusion ComfyUI 入门感受
· ComfyUI初学者指南
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Prompt
会议纪要类提示词大全-最全会议纪要prompt
我是一名教育
工
作
者,
工
作
内容包括但不限于教学
工
作
、教育管理、学生服务、师资培训、学术研究,要求会议模板全面有条理地罗列会议环节。
prompt
提示词
大模型
炸裂!百川开源第1个7B多模态大模型 Baichuan-Omni | 能够同时分析图像/视频/音频/文本
作
者的训练框架包括一个全面的
流
水线,包括构建全模态训练数据、多模态对齐预训练和多模态监督微调,特别注重增强全模态指令遵循能力。
Baichuan-Omni
多模态大模型
语音
国内厂商语音识别与Whisper评测:现状与概况对比
随着人
工
智能技术的飞速发展,语音识别已经成为了现代社会中一个重要的研究领域。
语音识别
Faster-Whisper
零一万物
零一万物API开放平台出场!通用Chat多模态通通开放,还有200K超长上下文版本
在前期的开发者邀测中,拥有阿里、美团等多家大厂
工
作
经历的知乎大佬@苏洋就利用Yi的API搭建出了一个翻译器应用。
零一万物
YI
李开复
换脸
换脸软件 FaceFusion 保姆级教程
在制
作
定制数字人时,有时候为了不侵权,会使用换脸软件将原素材的脸型进行替换,今天一个客户就提出了这样的需求,所以,这里我使用 FaceFusuion 这款软件来进行操
作
。
FaceFusion
教程
大模型
大模型应用发展的方向|代理 Agent 的兴起及其未来(下)
3.释放用户的双手,解放思想,从事探索性和创新性
工
作
,在前沿科学领域实现全部潜力。
大模型
Stable Diffusion
造梦师手记:腾讯加入Stable Diffusion的ControlNet模型开发,效果艳丽
ghostmix模型
作
者认为,应该尽可能的少做大模型,然后使用lora、ControlNet等微调
工
具来适配更多的场景。
Stable
Diffusion
Sora
解读OpenAI Sora文生视频技术原理
一、Spacetime Latent Patches 潜变量时空碎片, 建构视觉语言系统 在“ChatGPT是第一个真正意义的人
工
通用智能”中,笔者总结过大语言模型借助
sora
微软
2.7B能打Llama 2 70B,微软祭出「小语言模型」!96块A100 14天训出Phi-2,碾压谷歌Gemini nano
11月OpenAI先是用GPTs革了套壳GPT们的命,然后再不惜献祭董事会搏了一波天大的
流
量。
小语言模型
开源
有道开源的国产语音库EmotiVoice爆火了!具有情绪控制功能的语音合成引擎!
但是近期,网易有道AI算法团队也开源了一款国产TTS语音合成引擎EmotiVoice,刚上线仅一周时间就暴涨4200颗星,问鼎当周GitHub trending
流
行榜第一。
EmotiVoice
语音库
大模型
阿里云开源通义千问多模态大模型Qwen-VL,持续推动中国大模型生态建设
在主
流
的多模态任务评测和多模态聊天能力评测中,Qwen-VL取得了远超同等规模通用模型的表现。
大模型
生成式AI与大语言模型的区别
Dream Studio:这个生成式人
工
智能平台(也提供开源免费版本),使得想成为
作
曲家的人能够创造音乐。
生成式AI
大语言模型
区别
开源
从 GPT-4o 到 LiveKit:实时语音交互的开源实现
今天不讨论 GPT-4o 的炸裂或颠覆,而是探讨如何
作
为个人或独立开发者实现这项技术,以及它的应用场景。
GPT-4o
语音交互
AI面部增强器-Remini
好
工
具不嫌多,哪怕之前本号已经推荐过好几款图像处理
工
具,今天还是给大家再次带来一个图像处理神器-Remini。
Remini
面部增强
修复
文生图
大模型
从零开始了解AI大模型 - 概念篇:一文带你走进大模型世界
ChatGPT的惊世之举,让大家见识到通用人
工
智能的辉煌崛起,也让AI在文本创
作
、摘要提炼、多轮对话甚至代码生成等领域迈向了一个质的飞跃。
大模型
<
...
31
32
33
34
35
36
37
38
39
40
...
>
1
2
4
5
6
7
8
9
100