바이오 대표

[ Python pandas] 작은 Dataframe에 더 큰 테이블에서 맞는 조건만 합치기 (= 합치고, 중복 제거) 본문

Python/dataframe (pandas)

[ Python pandas] 작은 Dataframe에 더 큰 테이블에서 맞는 조건만 합치기 (= 합치고, 중복 제거)

바이오 대표 2022. 1. 20. 08:00

 

목표:  Disease_uniq 에 "ICD10_L" (from Disease)합치기 

          # Diesas_name 에 맞은 ICD10_L 만 찾아서 758 row 를 유지하면서 합치기 

 

 Disease_uniq                                                                                             Disease

 

Merge, concat, join을 이용해도 다 중복적으로 합쳐지고 내가 원하는 모양이 나오지 않는다. 

따라서 내가 알아낸 제일 쉬운 방법: 합치고 중복 지우기 

[1] A.merge(B)

[2] drop_duplicates(subset = [" "])

 

따라서 해당 두 테이블을 합치기 위해서는 

disease_all = disease_uniq.merge(disease) # how defalt = "inner"
disease_all = disease_all.drop_duplicates(subset = ["Disease_index"])

 

# row index 를 정리할수도 있다   reset_index()

disease_all = disease_all.reset_index(drop=True)