yusijin02's Blogs
[论文笔记] 计算机视觉
[AAAI'24] [图像生成] T2I-Adapter: 强语义引导的图像扩散 (2024.01.09)
[ICCV'23] [视频生成] Tune-A-Video: Text2Video的新SOTA (2024.01.09)
[CVPR'24] [图像生成] RCG: 无条件引导的扩散生成模型 (2023.12.18)
[序列自回归通用大视觉模型] LVM: 纯视觉的通用大模型, CV的GPT时刻? (2023.12.13)
[ICLR'22] [ICCV'23] [视频理解] UniFormers: 使用多头关系聚合器 (MHRA) 的视频理解模型 (2023.12.13)
[视频理解] InternVideo: 语言引导的通用视频理解模型 (2023.12.13)
[ICCV'23] [语义分割] SAM: 分割万物, 自然图像语义分割的终结者? (2023.12.13)
[论文笔记] 医学类
[ICLR'24] [脑视觉解码] CLIP-MUSED: 跨被试图像脑解码 (2024.01.18)
[WACV'24] [脑视觉解码] DREAM: 仿生(人类视觉系统)的条件Diffusion用于图像重建 (2024.01.10)
[NIPS'23] [脑视觉解码] 视频解码的开山鼻祖? MindVideo! [Oral] (2023.12.22)
[NIPS'23] [视觉脑解码] 使用对比学习和跨模态互注意力预训练 fMRI Encoder 并进行图像重建. (2023.12.18)
[CVPR'22] [MRI脑肿瘤分割] Swin UNETR: 使用三维滑窗的三维分割模型 (2023.12.13)
[ICCV'23] [论文串烧] ICCV 2023 医学大模型 (2023.12.13)
[论文串烧] 用于医学图像语义分割的 Diffusion Models (2023.12.13)
[数学笔记] 一些有趣的数学概念
[离散概率论] DS 证据理论: 可能用于多模态的模态融合? (2023.12.13)
yusijin02's Blogs
My Page
|
GitHub
|
Cite
[论文笔记]
计算机视觉
[AAAI'24]
[图像生成]
T2I-Adapter: 强语义引导的图像扩散
(2024.01.09)
[ICCV'23]
[视频生成]
Tune-A-Video: Text2Video的新SOTA
(2024.01.09)
[CVPR'24]
[图像生成]
RCG: 无条件引导的扩散生成模型
(2023.12.18)
[序列自回归通用大视觉模型]
LVM: 纯视觉的通用大模型, CV的GPT时刻?
(2023.12.13)
[ICLR'22] [ICCV'23]
[视频理解]
UniFormers: 使用多头关系聚合器 (MHRA) 的视频理解模型
(2023.12.13)
[视频理解]
InternVideo: 语言引导的通用视频理解模型
(2023.12.13)
[ICCV'23]
[语义分割]
SAM: 分割万物, 自然图像语义分割的终结者?
(2023.12.13)
[论文笔记]
医学类
[ICLR'24]
[脑视觉解码]
CLIP-MUSED: 跨被试图像脑解码
(2024.01.18)
[WACV'24]
[脑视觉解码]
DREAM: 仿生(人类视觉系统)的条件Diffusion用于图像重建
(2024.01.10)
[NIPS'23]
[脑视觉解码]
视频解码的开山鼻祖? MindVideo! [Oral]
(2023.12.22)
[NIPS'23]
[视觉脑解码]
使用对比学习和跨模态互注意力预训练 fMRI Encoder 并进行图像重建.
(2023.12.18)
[CVPR'22]
[MRI脑肿瘤分割]
Swin UNETR: 使用三维滑窗的三维分割模型
(2023.12.13)
[ICCV'23]
[论文串烧]
ICCV 2023 医学大模型
(2023.12.13)
[论文串烧]
用于医学图像语义分割的 Diffusion Models
(2023.12.13)
[数学笔记]
一些有趣的数学概念
[离散概率论]
DS 证据理论: 可能用于多模态的模态融合?
(2023.12.13)