일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- Bioinformatics
- ChIPseq
- PYTHON
- scRNAseq
- DataFrame
- drug development
- 싱글셀 분석
- single cell
- pandas
- 비타민 C
- single cell rnaseq
- CSS
- drug muggers
- Git
- EdgeR
- cellranger
- CUTandRUN
- js
- HTML
- single cell analysis
- python matplotlib
- Batch effect
- matplotlib
- ngs
- github
- MACS2
- julia
- javascript
- CUT&RUN
- scRNAseq analysis
- Today
- Total
바이오 대표
[Deep Tensor Factorization] Deep Tensor Factorization For Predicting Anticancer Drug Synergy_2020 본문
[Deep Tensor Factorization] Deep Tensor Factorization For Predicting Anticancer Drug Synergy_2020
바이오 대표 2021. 10. 21. 16:58
" Deep Tensor Factorization For Predicting Anticancer Drug Synergy " 논문을 읽고 정리한 글이다.
Abstract
Deep Tensor Factorization (DTF) 은 Tensor factorization + Deep Neural Network (DNN) 을 결합한 모델이다. Tensor factorization 을 이용해서 의미있는 요소를 뽑아내고 DNN을 이용해서 synergy 의 여부를 classify 한다. 다른 모델들 (deepsynergy, logistic regression models) 보다 성능이 뛰어날 뿐 아니라 synergy를 내는 새로운 drug combination을 예측 할 수 도 있다.
Physicochemical properties를 이용해서 해당 drug combination 이 synergy 를 만들어내는지 아닌지를 ML/ DL으로 구할 수 있다. 여기에 데이터의 구조를 multy-way array 즉 tensor 로 바꿔서 훈련시킬 수 있다. Tensor을 이용하면 rank* 특징을 이용해 tensor decomposition 을 하여 데이터의 complexity 를 줄일 수 있을 뿐 아니라 hidden patterns을 찾거나 classification을 수행 할 수도 있다. 가장 흔한 decomposition 방법은 CANDECOMP/PARAFAC (CP)이다. 이는 weighted leasest squres problem 으로 first order optimization을 이용한다. 좀더 최근 방법은 CP Weighted OPTimization (CP-WOPT) 로 higher order factorization 을 이용한다. CP-WOPT를 이용해서 데이터의 missing entries를 채울 수 있고 output 은 sequence of rank-one tensors / factor matrix [[A, B, C]]로 표현된다. 이는 추후 DNN모델을 훈련시킬 feature 데이터로 사용가능하다.
2021.10.19 - [Mater dissertion] - [Rank Decomposition] Rank of matrix개념, CP decomposition