EN
www.qdxljd.com

《www.777888.gov.cn》清华朱军组&NVIDIA提出DDO:扩散/自回归模型训练新范式

文章一作郑凯文为清华大学三年级博士生,研究方向为深度生成模型,曾提出流式扩散模型最大似然估计改进技术 i-DODE,扩散模型高效采样器 DPM-Solver-v3,扩散桥模型采样器 DBIM 以及掩码式离散扩散模型采样器 FHS 等。 清华大学朱军教授团队与 NVIDIA Deep Imagination 研究组联合提出一种全新的视觉生成模型优化范式 —— 直接判别优化(DDO)。该方法将基于似然的生成模型(如扩散模型、自回归模型)隐式参数化为 GAN,从而设计出一种无需额外网络、训练高效的微调方法,并大幅突破传统最大似然训练的性能瓶颈。 近年来,扩散模型(Diffusion Models)和自回归模型(Autoregressive Models)在图像生成中占据主导地位,如 NVIDIA 的 EDM 系列扩散模型和字节跳动以 VAR 为代表的视觉自回归模型。相比 GAN(Generative Adversarial Networks)这类直接优化数据生成过程的隐式生成模型,扩散模型和自回归模型均属于基于似然的生成模型(Likelihood-Based Generative Model),它们显式估计数据的对数似然(log-likelihood),具有训练稳定、样本多样性强、容易规模化的特点 然而,这类模型广泛采用的最大似然估计(Maximum Likelihood Estimation, MLE)训练损失对应的是正向 KL 散度,会导致「mode covering」问题:模型倾向于覆盖所有数据模式而非聚焦主要分布,并且会在低估数据集中任何样本的似然时遭受严厉惩罚,从而使生成结果模糊或失真,在模型容量不足时限制了生成质量。例如,i-DODE 作为专注于似然的模型,虽然在密度估计任务上达到了最先进水平,但在 FID 等视觉质量指标下表现不佳。现有视觉生成模型也往往依赖引导(guidance)方法,如无需分类器的引导(Classifier-Free Guidance, CFG),来抑制低质量生成样本。 为解决 MLE 的局限性,文章考虑使用GAN 式判别的思想,在训练目标中引入反向 KL 散度的成分,强化模型在真实数据附近的密度,同时抑制错误区域,将模型分布由图(a):强调密度覆盖,微调为图(b):强调密度集中,从而提高生成保真度与有限模型容量下的生成质量。然而,直接使用 GAN 损失会引入额外的判别器网络与工程优化上的复杂性,尤其对于扩散/自回归模型这类需要迭代式多步生成的模型。 具体来说,DDO 引入待微调的目标模型和一个冻结的参考模型(均初始化为预训练模型),使用两个模型的对数似然比构造「隐式判别器」,得到可直接应用于扩散模型和自回归模型的 GAN 式优化目标: DDO 为扩散模型和自回归模型提供了即插即用的新训练目标,其微调后的模型和原模型具有完全相同的网络结构和采样方式,而在生成质量上大大增强 更重要的是,DDO无需修改网络结构、不增加推理成本,且与主流 CFG 等引导方法兼容,可叠加使用进一步提升性能。如在视觉自回归模型 VAR 上,微调后的模型通过控制 CFG 的强度,得到的FID-IS 曲线整体显著优于原模型 DDO 参数化的灵感来自于语言模型中的直接偏好优化(DPO, Direct Preference Optimization),但其目标从「成对的偏好对齐」扩展到了「分布对齐」,更为通用。DDO 虽然没有「奖励」的概念,但其中使用自生成样本作为负例的思想也与大语言模型中流行的 RL 算法如 GRPO 具有相似性,这允许模型从错误中反思学习。也就是说,GRPO 中负例的作用同样可以解释为使用 reverse KL 散度抑制 mode covering 趋势从而提升生成质量,这在数学推理等任务中具有重要意义。该思路有望扩展至多模态生成等任务,构建统一的对齐范式

《www.777888.gov.cn》
《www.777888.gov.cn》如今,Core Scientific也开始转型进军AI赛道。由于AI云服务供不应求,CoreWeave早在一年前就曾寻求通过Core Scientific迅速扩大产能。到了2025年,CoreWeave依旧坚持同一逻辑:继续抢占AI服务器云端租赁市场。当时的市场毕竟刚开始,做用户分层也算合理。想要便宜,时间紧迫度又不高,可以去美团优选次日达;反之,可以去闪电仓试试即时配送小时达。《www.777888.gov.cn》wow亚洲服有永久60级么此役,王钰栋继续先发,与队长弗兰克联袂锋线。但或许是踢在自己不擅长的位置,再加上被海港防守球员重点盯防照顾,王钰栋几乎全场隐身。对此,清华大学五道口金融安全中心研究员马天平向每经记者表示,特朗普政府不太可能真正对特斯拉或SpaceX“下死手”,双方更多的是商人思维下的利益博弈。但他同时强调,此次事件之后,即便双方关系出现缓和,也难以完全恢复到从前的状态。忻华则指出,鉴于特朗普的总统身份,如果其执意要对马斯克旗下企业采取不利措施,马斯克恐怕难以直接阻挠,届时或只能诉诸法律途径,如提起行政诉讼,或寻求国会中反特朗普派系的支持。
20250812 🌶 《www.777888.gov.cn》但5月以来,融资需求偏弱,房地产销售在小阳春后回落,物价放缓。经济仍延续“实际大于名义,供给强于需求,大企业优于中小企业”的格局,虽然宏观数据在筑底,但微观个体对经济复苏的体感不强。两个人轮流上24小时的班骂战迅速升级。特朗普威胁要取消马斯克公司的政府合同和补贴,称“这是省钱的简单办法,拜登怎么没想到!”马斯克不甘示弱,直接扔出重磅炸弹:“特朗普在爱泼斯坦文件中,这就是文件不公开的真正原因!”他甚至点赞了一条呼吁弹劾特朗普、让副总统万斯上位的帖子。
《www.777888.gov.cn》
📸 焦明月记者 刘岩峰 摄
20250812 🥵 《www.777888.gov.cn》李雪娇:在心理咨询行业,这被称为“双重关系”,是指咨询师与来访者之间除了专业的帮助关系之外,还存在其他社会、情感或利益上的联系,例如亲属关系、经济往来、宗教隶属或朋友圈重叠等。这类关系极易带来权力失衡与角色混淆,会直接损害来访者的信任感与心理安全,干扰咨询师的判断,甚至使专业关系变质为操控性依附。红桃17·c18起草80年前,中国人民经过长达14年的浴血奋战,取得了中国人民抗日战争的伟大胜利,宣告了世界反法西斯战争的完全胜利。这场艰苦卓绝的斗争,有力捍卫了国家主权和领土完整,也孕育出彪炳千秋的伟大抗战精神。这份于民族危亡之际迸发的精神伟力,永远激励着中国人民战胜前行道路上的任何艰难险阻,为实现中华民族伟大复兴的中国梦而顽强奋斗。
《www.777888.gov.cn》
📸 徐太平记者 陈贺峰 摄
💦 第三个打法是扶持优质商家,尤其是扶持那些有创新力、有稳定供给能力的商家。这其实是我们从去年12月份就开始的工作,去年双十一之后我们就开始这个“扶优”动作了,本质上我们希望让更多优质的供给去满足消费者的体验需求。从今年618的数据看,确实扶优这和动作是有效的,今年618破亿品牌数453,增长24%,结果证明头部商家、KA商家以及大量有创新力的新品牌都获得了很不错的增长。轮流和两个男人一起很容易染病吗
扫一扫在手机打开当前页