[论文笔记] 开山鼻祖? 🧠 Mind-Video: 视频刺激人脑响应解码 🐱

Author: Sijin Yu

标题: Cinematic Mindscapes: High-quality Video Reconstruction from Brain Activity 作者: Zijiao Chen, Jiaxin Qing, Juan Helen Zhou 会议: NIPS 2023 (Oral) HomePage: https://www.mind-video.com/ arXiv: https://arxiv.org/abs/2305.11675 GitHub: https://github.com/jqin4749/MindVideo

0. Abstract

2. Motivation & Contribution

2.1 Motivation

2.2 Contribution

3. Model

1

MinD-Video 由两个模块组成: 一个 fMRI encoder, 一个 video generative model. 两个模块分开训练并一起微调.

3.1 fMRI encoder

3.1.1 fMRI 数据的预处理

如何定义 ROIs?

3.1.2 MBM 预训练

3.1.3 滑窗 fMRI 的时空注意力

血液动力学信号相对于视频刺激有一定的拖后, 如下图所示.

2

3.1.4 多模态对比学习

3.2 Video Generative Module

3.2.1 动态场景稀疏因果注意力

3.2.2 fMRI 的对抗引导

4. Experiment

4.1 Dataset

4.2 Implementation Details

4.3 Metrics

4.4 对比实验

3

4.5 消融实验

4

4.6 可解释性实验

5

4.7 一些定性的结果展示

6

7

8

9