文章列表-AI魔法学院

文章列表

聊聊 AIGC 一些拧巴的现状

但，大多数的社群和培训，都是在教你怎么使用 AI来创作。

开源模型

从零开始了解AI大模型 - 技术篇：万字深度好文人话说大模型技术

ChatGPT的惊世之举，让大家见识到通用人工智能的辉煌崛起，也让AI在文本创作、摘要提炼、多轮对话甚至代码生成等领域迈向了一个质的飞跃。

大模型

AI Comic Factory：AI(连环)漫画生成器

项目目前使用Llama-2 70b作为LLM，有三种选项：使用Inference API模型、使用Inference Endpoint URL、或自行修改代码以使用其他LLM系统。

生成式AI

AI变现异常值案例库，5种方向10个案例，副业项目灵感启发

”（用第一人称手机拍摄屏幕）讲AI今天又有多牛逼，又怎么怎么样了一定程度上引发观众焦虑，然后吸引关注东子的思考：这种视频类型和账号，是目前AI账号里流量最大的可以用来快速起号，结合自己或者别人的后端产品去变现

生成式AI

万字长文-大语言模型指令调优综述

Video-LLaMA (Zhang et al.， 2023b)是一个多模态框架，它增强了大型语言模型的理解视频中的视觉和听觉内容的能力。

大语言模型

Ollama还是vLLM？深度解析四大顶级LLM服务框架：性能、特性与技术选型指南

本文将深入探讨这四个杰出开源框架的工作原理、核心创新、性能优化策略、突出特性以及各自的最佳应用场景，帮助开发者选择最适合其项目需求的工具。

LLM 服务框架

OpenAI 开源语音识别 Whisper 的使用体验怎么样？

关于Buzz 　　Buzz 是一款基于 OpenAI 开源 Whisper 自动语音识别模型的软件工具，能够将音频或视频中的语音自动识别为带有时间戳的文本字幕。

生成式AI

17K star！30秒偷走你的声音，开源声音克隆工具

OpenVoice 是什么 OpenVoice 是由AI 创业公司 openshell 开源的一款声音克隆工具。

OpenVoice 声音克隆开源

免费文生图工具StableDiffusion喂饭级使用教程

www.bilibili.com/video/BV17d4y1C73R 星空一键整合包： https://www.bilibili.com/video/BV16j411A7BL 注：星空的东西很全，但是视频讲的不是很清楚

文生图 SD

中国大模型「顶流群聊」笔记

8 月 23 号，西溪论道参会者合影看得出来，阿里云作为算力基础设施层应该如何与这几个层面连接与共创，如何支持各个层面的创业者做好大模型用好大模型，这是张勇最关心的话题。

大语言模型

大模型应用中大部分人真正需要去关心的核心——Embedding

向量Embedding非常灵活，包括音频、视频、文本和图像都可以表示为向量Embedding。

大模型

开源免费离线语音识别神器whisper如何安装

whisper的日常用途 whisper的核心功能语音识别，对于学生党和工作党来说，可以帮助我们更快捷的将会议、讲座、课堂录音整理成文字稿；对于影视爱好者，可以将无字幕的资源自动生成字幕，不用再苦苦等待各大字幕组的字幕资源

wisper 翻译免费

投资人逃离大模型

依图科技：“天问”大模型是上海依图网络科技有限公司在2023年底首发的一款多模态大模型，是视频监控领域内第一个商用发布的大模型产品，基于先进的Transformer架构，具有会思考、可对话、能进化的三大特点

大模型

图片生成速度最高提升10倍！可以做到“实时”生成！清华推出LCM/LCM-LoRA！

近年来，随着SD和Midjourney的火热，文本到图像生成（Text-to-Image Generation）的研究取得了令人瞩目的进展，让我们能够用自然语言指导AI创造出各种各样的图像。

LCM/LCM-LoRA 文生图

将任意文本转换为知识图谱

这些信息通常存储在图形数据库中并可视化为图形结构，从而产生了知识“图形”一词。

知识图谱转换文本

<...26 27 28 293031 32 33 34 35 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1