바이오 대표

[ Drug Pair Scoring ] "A Unified View of Relational Deep Learning for Drug Pair Scoring" 본문

Master dissertion

[ Drug Pair Scoring ] "A Unified View of Relational Deep Learning for Drug Pair Scoring"

바이오 대표 2022. 1. 21. 08:50

" A Unified View of Relational Deep Learning for Drug Pair Scoring "  논문을 읽고 정리한 글이다. 

 

해당 논문에서는 크게 아래와 같은 4가지 내용을 다룬다.

  1. drug-drug interaction, polypharmacy side effect, synergistic drug combination prediction tasks Formal Unification 
  2. 해당 Tasks 를 위한 ML design, architecture overview 
  3. Available Datasets과 자주 사용되는 evaluation metrics 
  4. 해당 ML을 이용한 applications 과 미래 활용성에 대한 discussion 

 

Abstract

최근 ML 이용해서 알아내고 싶은 task들로 [1] polypharmacy side effect identification [2] drug-drug interaction prediction  [3] combination therapy design task 가 있다. 이 논문에서는 해당 task을 위한 모델들을 비교 및 성능 확인을 위해 기준이 되는 definition을 세웠다. = Unified View 

 

Introduction

"drug pair scoring" 은 drugs sets와 해당 interest context 를 이용한 ML task 이다. 보통 [Incomplete drug pair DB,drug context, outcomes]을 이용해서 우리가 알지 못하는 unseen entries 를 예측하는데 활용할 수 있다. 

Drug-drug pair 과 해당 특징을 알고리듬을 이용하는 이유:

   1. 모든 drug-drug pair 을 비교하기에는 경우의 수가 너무 많다. (값도 비싸고 시간도 많이든다.)

   2. 특정 pair scoring task 는 사람 대상 시험으로만 가능하다. 

   3. 실험실 테스팅은 인적오류 가능성이 있다. 

 

Traditional Models

Supervised ML: handcrafted molecular features -> to predict the outcome of administering the drugs together

Unsupervised ML: diffuses the profile of the drug pair on a heterogeneous biological graph

                                 -> to find potential polypharmacy, synergy, or interaction indications

 

Deep Learning을 이용해서 언급한 모델들을 잘 fusion 및 extension 활용해서 drug pir scoring taks 를 할 수 있다. 

Step 1. Generate drug representations bsd on molecular structure/ heterogeneous graph.

Step 2. 만들어진 Representations에 biological 의미 부여(propagated in the biological graph) 및 aggregated.

Step 3. Drug-pair representations 가 형성되고, output은 drug context 의 확률값(probability score)이다.

 

 

Unified View / Definition

 

D drug set, C context set, y binary indicator 

 

S database set 

 

 

G(V,R,Ɛ) heterogeneous interaction graph with drug entities 

V and R drug entities, Ɛ typed edges 

 

Hd Neighbourhood encoder

 

 

Molecular encoder

 

Neighbourhood informed molecular encoder

 

 

 

Molecular representation combiner

 

Scoring head layer

 

 

Drug pair scoring loss and cost function