yusijin02's Blogs

My Page | GitHub | Cite

[论文笔记] 计算机视觉

[AAAI'24] [图像生成] T2I-Adapter: 强语义引导的图像扩散 (2024.01.09)

[ICCV'23] [视频生成] Tune-A-Video: Text2Video的新SOTA (2024.01.09)

[CVPR'24] [图像生成] RCG: 无条件引导的扩散生成模型 (2023.12.18)

[序列自回归通用大视觉模型] LVM: 纯视觉的通用大模型, CV的GPT时刻? (2023.12.13)

[ICLR'22] [ICCV'23] [视频理解] UniFormers: 使用多头关系聚合器 (MHRA) 的视频理解模型 (2023.12.13)

[视频理解] InternVideo: 语言引导的通用视频理解模型 (2023.12.13)

[ICCV'23] [语义分割] SAM: 分割万物, 自然图像语义分割的终结者? (2023.12.13)

[论文笔记] 医学类

[ICLR'24] [脑视觉解码] CLIP-MUSED: 跨被试图像脑解码 (2024.01.18)

[WACV'24] [脑视觉解码] DREAM: 仿生(人类视觉系统)的条件Diffusion用于图像重建 (2024.01.10)

[NIPS'23] [脑视觉解码] 视频解码的开山鼻祖? MindVideo! [Oral] (2023.12.22)

[NIPS'23] [视觉脑解码] 使用对比学习和跨模态互注意力预训练 fMRI Encoder 并进行图像重建. (2023.12.18)

[CVPR'22] [MRI脑肿瘤分割] Swin UNETR: 使用三维滑窗的三维分割模型 (2023.12.13)

[ICCV'23] [论文串烧] ICCV 2023 医学大模型 (2023.12.13)

[论文串烧] 用于医学图像语义分割的 Diffusion Models (2023.12.13)

[数学笔记] 一些有趣的数学概念

[离散概率论] DS 证据理论: 可能用于多模态的模态融合? (2023.12.13)