Vis-Dec: 使用对比学习和跨模态互注意力预训练 fMRI Encoder, 并以之为条件为 LDM 生成图像

Author: Sijin Yu

标题: Contrast, Attend and Diffuse to Decode High-Resolution Images from Brain Activities 作者: Jingyuan Sun, Mingxiao Li, Zijiao Chen, Yunhao Zhang, Shaonan Wang, Marie-Francine Moens 机构: 鲁汶大学, 新加坡国立大学, 中国科学院 arXiv: https://arxiv.org/abs/2305.17214 GitHub: https://github.com/soinx0629/vis_dec_neurips/ Accepted: NeurIPS 2023

1. Abstract

2. Motivation & Contribution

2.1 Motivation

2.2 Contribution

3. Model

模型分为两个部分: fMRI 的表示学习 (fMRI Representation Learning, FRL) 和使用 LDM 重建视觉信号.

3.1 FRL 第一阶段: 预训练双对比掩码自动编码器 (Pre-training Double-Contrastive Masked Auto-Encoder, DC-MAE)

1

3.2 FRL 第二阶段: 使用互模态引导微调 (Tuning with Cross Modality Guidance)

2

3.3 使用 LDM 的图像生成

3

这个方法很经典, 略过.

4. Experiment

4.1 Dataset

4.2 横向对比

4

4.3 消融实验

5