Skip to main content
  1. PaperReading/
  2. Arxiv/

EMERGE: Integrating RAG for Improved Multimodal EHR Predictive Modeling

Arxiv LLM RAG Multimodal 2024

2406.00036 (arxiv.org)

引入LLM和外部知识库KG来产生定性认识,然后根据定量数据产生精准描述。

image-20240607003922539

  1. 使用LLM+规则从时序数据和病历文本中抽取实体,基于这些实体在KG中查询相关的知识,包括定义、描述、三元组
  2. 整合原始文本和检索到的知识,生成知识增强的文本
  3. 使用LM做文本嵌入,用GRU做时序数据编码,使用cross attention融合,并据此做出死亡和生存时间预测

RAG
#

时序数据知识检索
#

image-20240607004402396

对于时序数据,计算每个指标的均值和方差,偏离3倍标准差的认为是异常值,从而评估某个指标过低/过高;

如果某个指标出现在某个疾病的定义/描述中,则认为暗示这种疾病;

文本报告知识检索
#

image-20240607004630204

对于文本报告,使用LLM进行NER,并滤除不合法的实体(不在文本中,不是疾病名)

LLM NER Prompt
#

image-20240607004932692

文本生成 Prompt
#

image-20240607005600461

对于提取到的每一种疾病,检索相应节点的定义、描述、三元组,并使用LLM整合成文本。

多模态融合
#

image-20240607005731787

每个模态用cross attention聚合另一模态的信息,再拼接到一起

实验
#

对比实验
#

image-20240607013047944

消融实验
#

image-20240607011925033

时序数据占主导,文本和RAG能起到一定辅助作用

LM & LLM
#

功能 Tokens Params 推理方式
Clinical-LongFromer 文本嵌入 512-4096
BGE-M3 实体嵌入 8182
Qwen Chat 7B 实体抽取 8192 7B
DeepSeek Chat 文本生成 236B API