바이오 대표

[ Drug Development ] CheMBL DB & PubChem을 이용한 DRUG 후보 뽑아내기 본문

Drug

[ Drug Development ] CheMBL DB & PubChem을 이용한 DRUG 후보 뽑아내기

바이오 대표 2021. 10. 4. 22:28

 

## DB 데이터베이스와 ML 을 이용한 target 에 적합한 chemical compound (drugs) 찾기 

 

< Step1. Choose Target >

 

< Step2. Drug Candidates Database >

- CheMBL 

 

*chemical "SMILES" :  simplied molecular-input line entry system

                                       (molecule들의 구조 structure 을 컴퓨터가 인식하기 쉽고 문자열로 나타낸 것)

 

< Step3. Data preprocessing >

- Descriptors 이용 가능 

   ex) Lipinski descriptors 를 이용해서 먹는 약 (orally active drug)가 될 자격이 있는지 확인 가능 

         Lipinski descriptors 포함 항목 : molecular weight, logP, hydrogen donors & acceptors, rotational bonds

          rdkit.Chem.Descriptors or rdkit.Chem.Lipinski

 

자격 기준: Lipinski's rule of five or three  (https://en.wikipedia.org/wiki/Lipinski%27s_rule_of_five

 * logP : lipophilicity = lipo 지질/기름 , philic 좋아함 = 기름에 잘 녹음 = 물에 잘 안녹음 

             

 

<  Step4. Model Building >

 

+ Drug Repositioning : 이미 존재하는 약이 다른 치료에 더 적합하는 경우 찾는 것