文章列表-AI魔法学院

文章列表

【2023.10】看目前巨头的AI原生产品布局

并不是狭义上理解的那种在具体场景给选择建议的类Github Copilot方式，而是更类似于之前吹的NLUI的感觉，只不过并不止于UI。

大模型产品

被高估的Pika，被低估的多模态AI

这次 Pika 1.0 输出的视频结果大体相符要求，但细节依然有明显缺陷，角色的手部构图“惨不忍睹”。

大模型多模态

45个 DALL-E 3 使用案例 (附提示词)

(Tall) 提示词：为[特定类型或主题，如 "时尚 "或 "技术"]设计具有视觉冲击力的杂志封面，以[特定主体，如 "身着夏季系列服装的模特 "或 "未来主义小工具"]为特色，辅以暗示[特定主要文章或专题

DALL-E 提示词文生图

【TTS语音克隆开源最强王者】5款爆火开源模型(Fish、F5、GPT、CosyVoice、MaskGCT)效果对比，等你来评!

TTS语音克隆项目 GPT-SoVITS模型介绍 GPT-SoVITS项目是TTS克隆领域内效果常年霸榜的模型之一，具有以下功能: 零样本文本到语音（TTS）: 输入 5 秒的声音样本，即刻体验文本到语音转换

语音克隆开源模型

Python入门与语法速查

Python基本语法标识符第一个字符必须是英文字母或下划线 _ 。

python 编程

【AI科技大创意】2024年人工智能10大趋势

游戏是满足我们基本生物原语的模拟：收集（口袋妖怪）、捕食者/猎物（标签）、养育（收养我）、探索（我的世界）。

人工智能趋势

OpenAI官方ChatGPT提示工程 - 最佳实践11篇（大合集）

随后，OpenAI官方又正式的发布了一份"GPT 最佳实践"指南，可以说是期盼已久。

ChatGPT 大模型

解玄：共相、道、基类与战略

不同思维体系下对同样的事物会有不同描述，比如共相属于狭义哲学或者佛学、道则更像大众和玄学用语、基类则属于程序员，但背后的话题都和名家的名实有点关系。

玄学科学

8个常用中文OCR数据集，附下载链接

对每个中文字符，数据集都标注了其真实字符、边界框和 6 个属性以指出其是否被遮挡、有复杂的背景、被扭曲、3D 凸出、艺术化，和手写体等。

OCR

比 Roop 和 Reactor 更像！IP Adapter 新模型为任何人做写真

; 引导系数：设置为7，这是一个平衡值，既能保证提示词的引导作用，又不至于过度影响图像的自然生成。

IP-Adapter 文生图

主流网络爬虫蜘蛛详解

必应集成了多个独特功能，包括每日首页美图，与 Windows 操作系统深度融合的超级搜索功能，以及崭新的搜索结果导航模式等。

爬虫蜘蛛详解

大模型评测新思路：弱智吧精华问题大全

本文的贡献可以总结如下：提出了一个高质量的中文指令调优数据集，专门用于与人类交互保持一致，并通过严格的过滤程序实现；探讨了各种数据源（包括社交媒体、百科全书和传统 NLP 任务）对模型性能的影响

弱智吧训练数据集

垂直领域大模型的一些思考及开源模型汇总

而对于ToB和ToG端来说，本地化部署、领域or行业内效果绝群、国产化无疑就成为了重要的考核指标。

垂直领域大模型开源模型汇总

解读wav2lip：探究语音驱动唇部动作的技术原理！

而且由于生成过程中存在伪影，GAN判别器更容易关注视觉伪影，从而忽略音频和口型的对应关系。

wav2lip 语音

完整ChatGLM3部署教程，支持手机和车载平台部署

ChatGLM3-6B 是 ChatGLM3 系列中的开源模型，在保留了前两代模型对话流畅、部署门槛低等众多优秀特性的基础上，ChatGLM3-6B 引入了如下特性：更强大的基础模型：ChatGLM3

ChatGLM3 大模型

<...49 50 51 525354 55 56 57 58 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1