文章列表-AI魔法学院

文章列表

数字人直播哪家强？中国数字人平台分析大全

另一类是应用广泛的数字人软件，主要用于直播和短视频等领域。

数字分身数字人

做自媒体消息闭塞很致命，巨好用的工具分享

文案、脚本辅助创作量子探险：最近发现的宝藏AI，主打长文本，很适合用来写长脚本、写小说豆包：字节旗下AI，功能很全，甚至还能根据需求生成图片和音乐，目前是免费滴

自媒体工具

这个数字人开源项目太牛了，非常全面的项目解决方案(含源码)

虚拟主播：通过Fay控制器及数字人模型，开发者能够创建虚拟主播来进行直播带货或视频内容制作。

Fay 开源项目数字人

构建开源多模态RAG系统

亲爱的冒险家，请考虑一下：当你听到某人的声音时，你能认出这个人，而当你看到他们时，你也知道他们是谁。

RAG 大模型

生成式AI与大语言模型的区别

例如，一个图像生成模型可能会在数百万张照片和绘画的数据集上进行训练，以学习构成各种视觉内容的模式和特征。

生成式AI 大语言模型区别

前半年，我看到的有趣的 AI 产品

它们不持久原因主要还是需求点本身低频或非刚需，噱头价值衰减。

AI工具

零一万物API开放平台出场！通用Chat多模态通通开放，还有200K超长上下文版本

3月，国内外模型公司动作频频。

零一万物 YI 李开复

【万字长文-进阶教程】一文带你从入门到精通ChatTTS, 手把手教你固定音色、设置语速、添加停顿词、口头语、笑声！！

音色一:男音色-铿锵有力效果展示这是我经过挑选后男音对应的数据供768维。

chattts tts 文生语音

我去，找到一个Github上非常优秀的AI项目，可控制鼠标、键盘，模拟人类操作，太丝滑，收藏～～～

通用目标：支持任意本地软件（如游戏、Office、图像/视频编辑工具）多模态输入：以截图为输入，支持键盘鼠标操作输出自主能力：内置“认知反思+技能更新”模块，能不断自我优化模块化设计

AI Agent 开源项目

中文版开源Llama 2同时有了语言、多模态大模型，完全可商用

LinkSoul.AI 开源的语音 - 语言多模态模型和视觉 - 语言多模态模型统一采用下图所示框架。

开源模型

掌握这10个AI 工具用1小时完成别人1周的工作

01 制作爆款内容：PredisAI Predis是一款适用于社交媒体的人工智能营销工具，可帮助制作引人入胜的视频和图像内容，并获得人工智能驱动的内容分析。

AI 工具

全球生成式 AI 应用全景图

、视频和3D模型等领域展现出了强大的能力。

大模型

【2023.10】看目前巨头的AI原生产品布局

在程序员输入时候，直接给出建议的方案，程序员可以快速选择采纳、切换方案或者无视。

大模型产品

大模型落地“诸神之战”，场景玩家先杀出重围了

在短视频时代，通过线上种草视频/图文为线下门店引流，已经是重要营销手段之一。

大模型文生图

大模型应用发展的方向｜代理 Agent 的兴起及其未来（上）

音频频谱图提供了音频信号频谱随时间变化的直观表示。

大模型

<...11 12 13 141516 17 18 19 20 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1