首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· Ollama还是vLLM?深度解析四大顶级LLM服务框架:性能、特性与技术选型指南
· 几款开源的OCR识别项目,收藏备用
· 无需翻墙,可合法使用的8款国内AI大模型产品
· stable diffusion如何确保每张图的面部一致?
· PPT又又有新突破了!智谱AI代码流造PPT
· clone-voice:一键克隆声音,开源AI技术让声音创作更便捷、更个性化
· 从思维链(CoT),到思维树(ToT),再到思维图(GoT):用LLMs解决复杂问题!
· 胎教级SO-VITS-SVC使用教程:人工智能生成歌曲
· AI“同声传译”新进展!Google发布,无监督,语音识别:Translatotron 3!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
PhotoMaker:腾讯最新开源,根据照片生成该人物各种风格图片,项目可落地!
在进行风格化时,生成的面孔如果看起来太真实了,
调
整风格强度到 30-50,数字越大,ID 忠实度越低,但风格化能力会更好。
PhotoMaker
文生图
Sora
快手版Sora「可灵」开放测试:生成超120s视频,更懂物理,复杂运动也能精准建模
比如这个在公路上高速奔跑的老虎,不仅画面连贯,随镜头角度的变化合理,老虎四肢的动作协
调
,而且还把奔跑过程中躯干部分的抖动也展现得淋漓尽致。
可灵
快手
文生视频
ComfyUI
使用ComfyUI玩SDXL的正确打开方式
相比较而言,高级采样器会多一些
调
整参数,这些参数是我们今天要用到的。
文生图
ComfyUI
一文彻底搞懂多模态 - 多模态推理
· 智能体需要在环境中对自身所处状态进行
调
整和修复,最终做出对应的动作,以达到目标位置。
多模态推理
大模型
大模型
实测15款AI大模型实时新闻搜索能力:金融业资讯获取哪家强?
无结果 ✗ ★ 建议
调
整搜索条件
AI
大模型
Midjourney
神秘模型“小熊猫”一夜刷屏:排名超Flux、Midjourney,网友:一看就中国的
(一张图片,展示了一位金融顾问在现代办公室里与一对年轻夫妇讨论投资策略,强
调
财务规划和长期财富管理。)
red_panda
文生图
开源
阿里巴巴语音实验室发布开源语音处理框架ClearerVoice-Studio,支持语音增强、分离、目标说话人提取
此外,用户还能通过细
调
工具对模型进行个性化优化,以满足特定需求。
ClearerVoice-Studio
语音
中本聪的Web3之路
为了让Web3应用能够在不同国家或地区正常运行,并保护用户和投资者的权益,需要与相关部门进行沟通和协
调
,制定合理和适当的法律规则和标准。
token
比特币
加密货币
开源
国内开源的低代码框架有哪些?
Appsmith Appsmith 是一款开源的低代码框架,其主要用于帮助用户及团队更快、更协
调
地完成构建管理面板、内部工具和仪表板等,且允许拖放UI 组件来构建页面,用户可以通过Appsmith连接到任何
大模型
应用编排的未来是Pipeline,LlamaIndex开发预览版推出Query Pipeline,提升应用开发的灵活性
= p.run_multi({"llm": {"topic": "YC"}}) print(output_dict) 同时,为了更好地观察整个流程执行情况,llamaindex的DAG组件均支持回
调
设计
Query
Pipeline
大模型
Stable Diffusion
stable diffusion 远端跑图—— Api基础知识掌握
就已经接通了,是不是很简单~ 有好几个人和我反馈了,controlnet参数不生效,据初步分析是因为大家的controlnet版本更新到了1.1,而我写文章的时候用的是1.0,1.1这个版本api
调
用不再需要添加
文生图
api
大模型
人话聊AI大模型:AIGC如何助力营销的秘密(下)
对于大规模营销活动,或许会采用Copilot半自动模式,结合人工与AI的互动来进行
调
整,短期内不会完全转向Agent全自动模式。
大模型
大模型
MaskGCT:登上GitHub趋势榜榜首的TTS开源大模型
与以往使用k-means方法离散化语义特征相比,这种方法可能导致信息损失,从而影响高质量语音的重建或声学标记的精确预测,尤其是在音
调
丰富的语言中。
MaskGCT
声音克隆
ChatGPT
用ChatGPT快速完成论文全流程
这不仅是重申研究结果的地方,更是强
调
你的研究对学术界或实践领域带来的贡献和影响。
ChatGPT
写作
开源
7.1k Star!RAGFlow:最新开源OCR+深度文档理解的RAG引擎、大海捞针测试、降低幻觉、服务化API集成进业务!
• 多种文本模板可供选择 o 有理有据、最大程度降低幻觉(hallucination) o • 文本切片过程可视化,支持手动
调
整
OCR
RAG
开源
<
...
68
69
70
71
72
73
74
75
76
77
...
>
1
2
4
5
6
7
8
9
100