首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 汇总1400+文献的神级“上下文工程”综述,治愈初学者的AI迷失症
· 深入探讨:Agent全自动写作长篇小说技术原理解析
· ComfyUI-基础图生图&基础图片缩放
· 数字人直播哪家强?中国数字人平台分析大全
· AI创作 |如何通过GPT进行漫画视频的故事改写
· PPT又又有新突破了!智谱AI代码流造PPT
· Ollama还是vLLM?深度解析四大顶级LLM服务框架:性能、特性与技术选型指南
· 把ChatGPT装进二次元手办,你来吗?AI桌面机器人众筹
· 多智能体开发框架怎么选型?京东 JoyAgent vs langchain LangGraph,两种Agent开发哲学的碰撞!
· 《特朗普爱上在白宫当保洁的我》拍好了,3个月赚了10个亿
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
万字长文-大语言模型指令调优综述
利用奖励模型
计
算策略梯度对第 1步调整后的模型进行优化。
大语言模型
视频
AI自动生成视频全流程干货
今天分享的是最近Get到的一个新技能,本来想给公司用AI制作视频的,然后参加了一个培训,
学
完了,但是我发现AI将文字生成视频的本质还是将现有的视频库的内容进行重组,并不能满足我们这个行业的要求,但是针对特定的一些
AI
视频
芯片拼接技术:英伟达新核弹,站在苹果的肩膀上
1+1=2的方法看似简单粗暴,背后却是一场在物理
学
边缘的冲锋与冒险。
芯片拼接
芯片拼接技术:英伟达新核弹,站在苹果的肩膀上!
1+1=2的方法看似简单粗暴,背后却是一场在物理
学
边缘的冲锋与冒险。
芯片拼接技术
OCR
【重磅推荐】PaddleOCR:超越人眼识别率的AI文字识别神器!
一、PaddleOCR基本原理 PaddleOCR基于百度自主研发的深度
学
习框架PaddlePaddle,采用卷积神经网络(CNN)和循环神经网络(RNN)等技术,实现对图像中文字的识别和转换。
PaddleOCR
文字识别
LLM
LLM native策略的内部状态是否应该结构化 【2023Q3】
那么就可以在内部为该场景设
计
一个需要填充的表格,包含如上信息。
大模型
大模型
大模型LLM基础|分词
例子: text = "我喜欢
学
习自然语言处理。"
开源模型
大模型
全球最强大模型一夜易主,GPT-4时代终结!Claude 3提前狙击GPT-5,3秒读懂万字论文理解力接近人类
它在多项AI系
统
常用评估标准,包括本科级别专业知识(MMLU)、研究生级别专家推理(GPQA)、基础数
学
(GSM8K),均取得领先业界LLM的性能。
claude
大模型
语音
解读wav2lip:探究语音驱动唇部动作的技术原理!
-口型同步:因为面部重建损失是基于整个图像
计
算的,而唇部区域只占整个图像的很小一部分(不到4%),因而无法聚焦唇部细节。
wav2lip
语音
Stable Diffusion
这篇深入浅出帖助你早日实现Stable diffusion自由
接下来,我将结合这个案例带你走进 Stable Diffusion 的世界,帮你系
统
性地了解并掌握这神奇AI绘画魔法。
AI图片
Flowith:革新你的工作方式,体验节点式 AI 的超流畅生产力
Flowith 的核心功能 · 节点式交互:Flowith 的创新之处在于它的节点式交互设
计
,
Flowith
GPT
生产力工具
工具
RAG 与 Finetuning,谁是提升 LLM 的最佳工具?
它结合了一个检索系
统
和一个法
学
硕士,前者从大型语料库中获取相关文档片段,后者使用这些片段中的信息生成答案。
训练
清华
图片生成速度最高提升10倍!可以做到“实时”生成!清华推出LCM/LCM-LoRA!
由于扩散过程需要多次迭代,每次迭代都要用到一个神经网络,所以SD模型的生成过程需要大量的
计
算资源和时间。
LCM/LCM-LoRA
文生图
LLM
更强的小型LLM:Zephyr-7B
量化意图对齐一直存在挑战,但最近的努力已经导致了像MT-Bench和AlpacaEval这样的基准测试的开发,这些基准测试专门设
计
用来评估这一方面。
Zephyr-7B
大语言模型
开源
爆火!腾讯开源PhotoMaker:高效地定制化生成任意风格的逼真人类照片!
这样的嵌入作为一个
统
一的ID表示,既可以全面封装同一输入ID的特征,又可以容纳不同ID的特征,便于后续集成。
PhotoMaker
文生图
<
...
37
38
39
40
41
42
43
44
45
46
...
>
1
2
4
5
6
7
8
9
100