일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- CSS
- cellranger
- drug muggers
- pandas
- ngs
- 비타민 C
- scRNAseq analysis
- Git
- single cell rnaseq
- matplotlib
- 싱글셀 분석
- julia
- ChIPseq
- github
- javascript
- drug development
- DataFrame
- CUTandRUN
- CUT&RUN
- single cell
- Batch effect
- EdgeR
- PYTHON
- js
- single cell analysis
- MACS2
- scRNAseq
- HTML
- python matplotlib
- Bioinformatics
- Today
- Total
목록PYTHON (14)
바이오 대표
df.to_list( ) df.values.tolist( ) # 하나의 Column 값을 List 로 변환하기 다음과 같은 Dataframe 에서 Drug_SMILE Column 의 데이터를 List 로 뽑아내고 싶다 하면, Dataframe.column_name.to_list() 혹은 Dataframe.column_name.values 을 아래와 같이 이용할 수 있다. # 여러개의 Columns 값을 List 로 변환하기 * to_list( ) 와 values.tolist( ) 차이: to_list 는 하나의 Column (Object) 값만 변환 가능하지만 values.tolist( ) 는 여러개의 columns도(values as arrays) 가능하다.
교차 검증 (Cross Validation) Machine Learning 모델을 학습시킬때, Train / Test set 으로 나누어 학습 및 성능 확인을 하는데 이때 너무 하나의 Train set 에 초점을 맞춰 과적합 (Overfitting) 을 불러 일으킬 수 있다. 이를 방지하기 위해 교차 검증 (Cross Validation) 을 사용할 수 있다. 이는 Train set 를 바꿔가며 훈련시켜 평균을 내어 과적합을 막을 수 있다. 아래 그림은 가장 기본적인 K-fold Cross validation 방법을 그림으로 묘사하였다. 예시 ) # X & y 를 KFold(n_split = ) 를 이용하여 Train/Test set 로 나눠 보겠다 여기서 Train: [2 3 4 5 6 7] Test:..
numpy 의 reshape 함수는 다음과 같이 사용된다 array.reshape(row, column) np.reshape(array, (row, column)) 1,2 차원에서의 변화 쉽게 1차원 배열을 생성하고 reshape 으로 재배열을 해보았다 첫번째는 array.reshape(row, column) 을 이용했고 , 두번째는 np.reshape(array, (row, column)) 를 이용했다. * reshape 에서 -1 은 정해진 행/열이 있으면 거기에 맞춰지는 열/행을 의미한다. 3 차원에서의 변화 1,2 차원에서의 재배열과 같다. 차원만 다르게 해주면 된다.
메모리 사이즈 Byte 1 bytes KB (Kilo Byte) 1000 (10^3) bytes MB (Mega Byte) 1,000,000 (10^6) bytes GB (Giga Byte) 1,000,000,000 (10^9) bytes TB (Tera Byte) 1,000,000,000,000 (10^12) bytes PB (Pete Byte) 1,000,000,000,000,000 (10^15) bytes List, Array, tensor, Dataframe 등 python 에서 사용되는 모든 Object 의 메모리 사이즈를 sys.getsizeof( ) 로 확인할 수있다. * 해당 function은 메모리에 실제로 올라가는 크기임으로, '' 와 같이 빈 문자열도 49bytes 를 차지한다.