일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- EdgeR
- single cell rnaseq
- Bioinformatics
- CSS
- CUT&RUN
- Batch effect
- CUTandRUN
- matplotlib
- MACS2
- pandas
- 비타민 C
- DataFrame
- PYTHON
- single cell analysis
- cellranger
- HTML
- js
- Git
- drug muggers
- drug development
- single cell
- julia
- scRNAseq
- ChIPseq
- scRNAseq analysis
- javascript
- github
- python matplotlib
- 싱글셀 분석
- ngs
- Today
- Total
목록Python (29)
바이오 대표
to .csv (ASCII) to .npy (binary) to .npz (compressed) Numpy arrary 를 csv 형태로 저장할 수 있는 방법에는 두가지가 있다. [1] pandas 이용해서 dataframe으로 변경 후 df.to_csv( ) [2] np.savetxt( ) [1] pandas 이용해서 dataframe으로 변경 후 df.to_csv( ) import pandas as pd # numpy array arr # numpy array to pandas dataframe df = pd.DataFrame(arr) df.to_csv("myArray.csv", index=Fase) [2] np.savetxt( ) import numpy as np np.savetxt("myArray..

Python 을 이용해서 Dataframe 의 특정 rows/ columns 을 뽑아내려고 할때 보통, df.iloc[ ] 이나 df.loc[ ] 을 많이 사용한다. iloc[row, column] : index 이용 # iloc : index location 이라 외움 굿 loc[row, column] : label 이용 예시) .iloc[rows, columns] .loc[rows, columns] # 아래 예시는 .loc[ ] 을 사용하였다. 그래서 data_.loc[0:5, :] 는 row name 이 0~5 이기때문에 index와 다르게 row index 5 도 포함 행/열이 아닌 특정 값을 뽑아내고 싶다면 원하는 행(..

목표: Disease_uniq 에 "ICD10_L" (from Disease)합치기 # Diesas_name 에 맞은 ICD10_L 만 찾아서 758 row 를 유지하면서 합치기 Merge, concat, join을 이용해도 다 중복적으로 합쳐지고 내가 원하는 모양이 나오지 않는다. 따라서 내가 알아낸 제일 쉬운 방법: 합치고 중복 지우기 [1] A.merge(B) [2] drop_duplicates(subset = [" "]) 따라서 해당 두 테이블을 합치기 위해서는 disease_all = disease_uniq.merge(disease) # how defalt = "inner" disease_all = disease_all.drop_duplicates(subset = ["Disease_index"]..

# 아래의 Dataframe 에서 중복되는 Row Drop df = df.drop(df[df.duplicated()].index) # by "Y" df = df.sort_values("Y") df = df.reset_index(drop=True) # 만약 drop=True 옵션을 넣어주지 않는다면 그전 index가 새로운 column으로 형성된다.