文章列表-AI魔法学院

文章列表

会议纪要类提示词大全-最全会议纪要prompt

我是一名教育工作者，工作内容包括但不限于教学工作、教育管理、学生服务、师资培训、学术研究，要求会议模板全面有条理地罗列会议环节。

prompt 提示词

炸裂！百川开源第1个7B多模态大模型 Baichuan-Omni | 能够同时分析图像/视频/音频/文本

作者的训练框架包括一个全面的流水线，包括构建全模态训练数据、多模态对齐预训练和多模态监督微调，特别注重增强全模态指令遵循能力。

Baichuan-Omni 多模态大模型

国内厂商语音识别与Whisper评测：现状与概况对比

随着人工智能技术的飞速发展，语音识别已经成为了现代社会中一个重要的研究领域。

语音识别 Faster-Whisper

零一万物API开放平台出场！通用Chat多模态通通开放，还有200K超长上下文版本

在前期的开发者邀测中，拥有阿里、美团等多家大厂工作经历的知乎大佬@苏洋就利用Yi的API搭建出了一个翻译器应用。

零一万物 YI 李开复

换脸软件 FaceFusion 保姆级教程

在制作定制数字人时，有时候为了不侵权，会使用换脸软件将原素材的脸型进行替换，今天一个客户就提出了这样的需求，所以，这里我使用 FaceFusuion 这款软件来进行操作。

FaceFusion 教程

大模型应用发展的方向｜代理 Agent 的兴起及其未来（下）

3.释放用户的双手，解放思想，从事探索性和创新性工作，在前沿科学领域实现全部潜力。

大模型

Stable Diffusion

造梦师手记：腾讯加入Stable Diffusion的ControlNet模型开发，效果艳丽

ghostmix模型作者认为，应该尽可能的少做大模型，然后使用lora、ControlNet等微调工具来适配更多的场景。

Stable Diffusion

解读OpenAI Sora文生视频技术原理

一、Spacetime Latent Patches 潜变量时空碎片, 建构视觉语言系统在“ChatGPT是第一个真正意义的人工通用智能”中，笔者总结过大语言模型借助

sora

2.7B能打Llama 2 70B，微软祭出「小语言模型」！96块A100 14天训出Phi-2，碾压谷歌Gemini nano

11月OpenAI先是用GPTs革了套壳GPT们的命，然后再不惜献祭董事会搏了一波天大的流量。

小语言模型

有道开源的国产语音库EmotiVoice爆火了！具有情绪控制功能的语音合成引擎！

但是近期，网易有道AI算法团队也开源了一款国产TTS语音合成引擎EmotiVoice，刚上线仅一周时间就暴涨4200颗星，问鼎当周GitHub trending流行榜第一。

EmotiVoice 语音库

阿里云开源通义千问多模态大模型Qwen-VL，持续推动中国大模型生态建设

在主流的多模态任务评测和多模态聊天能力评测中，Qwen-VL取得了远超同等规模通用模型的表现。

大模型

生成式AI与大语言模型的区别

Dream Studio：这个生成式人工智能平台（也提供开源免费版本），使得想成为作曲家的人能够创造音乐。

生成式AI 大语言模型区别

从 GPT-4o 到 LiveKit：实时语音交互的开源实现

今天不讨论 GPT-4o 的炸裂或颠覆，而是探讨如何作为个人或独立开发者实现这项技术，以及它的应用场景。

GPT-4o 语音交互

AI面部增强器-Remini

好工具不嫌多，哪怕之前本号已经推荐过好几款图像处理工具，今天还是给大家再次带来一个图像处理神器-Remini。

Remini 面部增强修复文生图

从零开始了解AI大模型 - 概念篇：一文带你走进大模型世界

ChatGPT的惊世之举，让大家见识到通用人工智能的辉煌崛起，也让AI在文本创作、摘要提炼、多轮对话甚至代码生成等领域迈向了一个质的飞跃。

大模型

<...31 32 33 343536 37 38 39 40 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1