文章列表-AI魔法学院

文章列表

用户意图对齐，无需人工标注，Zephyr-7B 超越 Llama2-Chat-70B

AIF (AI Feedback) 步骤: ① 响应生成和AI排序: - 从数据集中抽样得到一个提示，例如，“描述如何制作巧克力布朗尼”。

小型语言模型 Zephyr-7B

你的AI还在睡觉？33条Prompts让它瞬间变身超能力团队！

克服拖延（Overcome Procrastination） Prompt: "Design a step-by-step strategy to identify the roots of procrastination

提示词

解放AI生产力——为什么要使用ComfyUI

为了解决的这个问题，斯坦福的某个天才发明了controlnet，它可以通过不同的预处理方式，来控制图片的构成这是一张用3D建模做的图片：利用canny预处理，这张图片可以变成这样：在这个插件面世之前

文生图

世界上最流行（github排名高）的开源移动机器人的操作系统ROS开源了！！

端口连接器 § § 港口位置 § § ROBOTIS OP3 不再具有 3.5 毫米麦克风和音频插孔

ROS 机器人开源模型

RAG 领域的新宠：为什么 AI 圈都在谈论 Jina ColBERT？

ColBERT 基于 BERT 模型开发，师出名门斯坦福。

rag 大模型

胎教级SO-VITS-SVC使用教程：人工智能生成歌曲

/Win11/Mac/Ubuntu)上安装配置Python3.10开发环境 v3u.cn/a_id_200 so-vits-svc安装在你自定义的目录下使用Git命令克隆项目

音乐

两天star量破千：OpenAI的Whisper被蒸馏后，语音识别数倍加速

懂技术的小伙伴也可以寻找其他替代方案，比如语音转文字模型 Whisper、文字翻译 GPT、声音克隆 + 生成音频 so-vits-svc、生成符合音频的嘴型视频 GeneFace++dengdeng。

语音 HeyGen

腾讯开源混元AI绘画大模型

具体安装和使用：依赖关系和安装首先克隆存储库： git clone https://github.com/tencent/HunyuanDiT cd HunyuanDiT

腾讯混元文生图

技术爆炸！AI一图换脸新王者，Instant ID保姆级安装与使用测评

赛博朋克风格。

Instant ID 文生图

Stable Diffusion

【Stable Diffusion操作升级】Stable Diffusion 常用模型下载与说明

miniatureWorldStyle_v10:0.8> 小技巧如果你下载了一个模型，却不知道怎么安装，打开这个网站 https://spell.novelai.dev/ 把你下载的模型拖进去，立马就会帮你解析

文生图 SD

生成式AI与大语言模型的区别

随着各自市场价值数十亿美元，这两种现象正在医疗保健、电子商务（例如亚马逊）、房地产以及其他行业的未来中勾勒出一片光明的前景。

生成式AI 大语言模型区别

数字人直播哪家强？百度、硅基、风平与闪剪四大AI数字人横向评测！

另外，AI合成的声音还有一种更高级的存在，就是克隆自己的声音，用自己克隆的声音匹配自己的数字人模型，口型匹配度非常高，数字人更容易达到以假乱真的水平，刘润的数字人短视频作品就是例子，难以识别真假。

数字人数字分身

StableDiffusion升级版SDXL：一键运行包ComfyUI和18G模型分享！

另外，尝试了一下昨天的关键词"一个在火星上骑着白马的宇航员" ，出效果的稳定性感觉上没有1.0版机器人高，但是也能出类似的图片。

comfyui sdxl 文生图

阿里&字节发表VividTalk，只需单张照片即可根据音频生成栩栩如生的人物说话头像视频

为了进一步增强嘴唇运动和更准确地建模，我们还选择了与嘴唇相关的地标并将其转换为高斯图，这是一种更紧凑和有效的表示。

VividTalk 视频

截至2023年5月份业界支持中文大语言模型开源总结及商用协议分析

Vicuna模型是由多家研究机构合作开发的，包括UC Berkeley、CMU、斯坦福等。

大模型

<...20 21 22 232425 26 27 28 29 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1