技术交流归档 - 酥酥的温柔乡

发布于 24 天前

37 热度无~ 技术交流

Entropy速递：冥想时，你的大脑经历了什么？

摘要

摘要思想种子框架引入了一种新颖的计算方法来模拟冥想状态下思维动态过程，将思想种子概念化为整合信息的动态注意力主体。该分层模型由嵌 …

发布于 2025-05-01

175 热度无~ 技术交流

CFG-Zero*：流匹配时代的新版 Classifier-Free Guidance

摘要

这个方法可以提升所有流匹配模型的生成质量，比如文生图模型 SD3, FLUX.1，以及视频生成模型 WAN-2.1。以下是 SD3 …

发布于 2025-04-22

111 热度无~ 技术交流

Sora is here

摘要

Bring your imagination to life with text,image,or video. Feature …

发布于 2025-04-20

44 热度无~ 技术交流

GPT-4o 图像生成漫谈：功能总结、多模态模型概述、原理猜测、未来畅想

摘要

前段时间，多模态模型 GPT-4o 推出了新版图像生成功能，又一次点燃了社区的 AI 创作热情。作为一款多模态模型，GPT-4o …

发布于 2025-04-19

89 热度无~ 技术交流

论文精读Block Diffusion:Interpolating Between Autoregressive and Diffusion Language Models

摘要

块离散去噪扩散语言模型（BD3-LMs）结合自回归模型和扩散模型的优势，解决了现有扩散模型生成长度受限、推理效率低和生成质 …

发布于 2025-04-01

105 热度无~ 技术交流

请勿阅读：愚人节自指悖论指南

摘要

导语 “请不要阅读这条消息”——哎呀，太晚了，你已经读了！恭喜你，你刚刚体验了自指悖论和愚人节恶作剧的完美结合。愚人节让你分不清 …

发布于 2025-03-31

111 热度无~ 技术交流

EmoEdit:Evoking Emotions through Image Manipulation

摘要

EmoEdit 由深圳大学可视计算研究中心黄惠教授课题组完成，第一作者为杨景媛助理教授。深圳大学可视计算研究中心（VCC）以计算机 …

发布于 2025-02-24

103 热度无~ 技术交流

扩散模型的推理时优化：分享近期几篇噪声搜索类论文

摘要

大语言模型（LLM）社区近期的一大热点研究课题是推理时扩展 (Inference-time scaling)，这一热点也逐渐传播到 …

发布于 2025-02-24

72 热度无~ 技术交流

一个有趣却撤稿 ICLR 2025 的工作：并非所有扩散模型噪声本质相同

摘要

自从 ChatGPT o1 在 2024 年 9 月发布后，人们逐渐把研究重点放在了推理时扩展 (Inference-time s …

发布于 2025-02-24

79 热度无~ 技术交流

一文比较 Kimi 和 deepseek 的两篇稀疏注意力机制论文

摘要

就在昨天，Kimi 和 Deepseek 分别发布了一篇论文，发布时间和论文主题内容都高度相似。我第一时间把两篇论文阅读完了，急忙 …

梦回温柔乡

Entropy速递：冥想时，你的大脑经历了什么？

CFG-Zero*：流匹配时代的新版 Classifier-Free Guidance

Sora is here

GPT-4o 图像生成漫谈：功能总结、多模态模型概述、原理猜测、未来畅想

论文精读Block Diffusion:Interpolating Between Autoregressive and Diffusion Language Models

请勿阅读：愚人节自指悖论指南

EmoEdit:Evoking Emotions through Image Manipulation

扩散模型的推理时优化：分享近期几篇噪声搜索类论文

一个有趣却撤稿 ICLR 2025 的工作：并非所有扩散模型噪声本质相同

一文比较 Kimi 和 deepseek 的两篇稀疏注意力机制论文