일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- DataFrame
- Bioinformatics
- github
- python matplotlib
- Git
- js
- drug development
- single cell rnaseq
- 싱글셀 분석
- 비타민 C
- pandas
- MACS2
- Batch effect
- drug muggers
- scRNAseq analysis
- CUTandRUN
- ChIPseq
- matplotlib
- javascript
- single cell
- CSS
- CUT&RUN
- ngs
- EdgeR
- PYTHON
- single cell analysis
- HTML
- cellranger
- scRNAseq
- julia
- Today
- Total
목록Python (29)
바이오 대표
to .csv (ASCII) to .npy (binary) to .npz (compressed) Numpy arrary 를 csv 형태로 저장할 수 있는 방법에는 두가지가 있다. [1] pandas 이용해서 dataframe으로 변경 후 df.to_csv( ) [2] np.savetxt( ) [1] pandas 이용해서 dataframe으로 변경 후 df.to_csv( ) import pandas as pd # numpy array arr # numpy array to pandas dataframe df = pd.DataFrame(arr) df.to_csv("myArray.csv", index=Fase) [2] np.savetxt( ) import numpy as np np.savetxt("myArray..
Python 을 이용해서 Dataframe 의 특정 rows/ columns 을 뽑아내려고 할때 보통, df.iloc[ ] 이나 df.loc[ ] 을 많이 사용한다. iloc[row, column] : index 이용 # iloc : index location 이라 외움 굿 loc[row, column] : label 이용 예시) .iloc[rows, columns] .loc[rows, columns] # 아래 예시는 .loc[ ] 을 사용하였다. 그래서 data_.loc[0:5, :] 는 row name 이 0~5 이기때문에 index와 다르게 row index 5 도 포함 행/열이 아닌 특정 값을 뽑아내고 싶다면 원하는 행(..
목표: Disease_uniq 에 "ICD10_L" (from Disease)합치기 # Diesas_name 에 맞은 ICD10_L 만 찾아서 758 row 를 유지하면서 합치기 Merge, concat, join을 이용해도 다 중복적으로 합쳐지고 내가 원하는 모양이 나오지 않는다. 따라서 내가 알아낸 제일 쉬운 방법: 합치고 중복 지우기 [1] A.merge(B) [2] drop_duplicates(subset = [" "]) 따라서 해당 두 테이블을 합치기 위해서는 disease_all = disease_uniq.merge(disease) # how defalt = "inner" disease_all = disease_all.drop_duplicates(subset = ["Disease_index"]..
# 아래의 Dataframe 에서 중복되는 Row Drop df = df.drop(df[df.duplicated()].index) # by "Y" df = df.sort_values("Y") df = df.reset_index(drop=True) # 만약 drop=True 옵션을 넣어주지 않는다면 그전 index가 새로운 column으로 형성된다.