[ Python pandas] 작은 Dataframe에 더 큰 테이블에서 맞는 조건만 합치기 (= 합치고, 중복 제거)

Notice

Recent Posts

Recent Comments

Tags more

Archives

관리 메뉴

바이오 대표

Python/dataframe (pandas)

바이오 대표 2022. 1. 20. 08:00

목표: Disease_uniq 에 "ICD10_L" (from Disease)합치기

# Diesas_name 에 맞은 ICD10_L 만 찾아서 758 row 를 유지하면서 합치기

Merge, concat, join을 이용해도 다 중복적으로 합쳐지고 내가 원하는 모양이 나오지 않는다.

따라서 내가 알아낸 제일 쉬운 방법: 합치고 중복 지우기

[1] A.merge(B)

[2] drop_duplicates(subset = [" "])

따라서 해당 두 테이블을 합치기 위해서는

disease_all = disease_uniq.merge(disease) # how defalt = "inner"
disease_all = disease_all.drop_duplicates(subset = ["Disease_index"])

# row index 를 정리할수도 있다 reset_index()

disease_all = disease_all.reset_index(drop=True)

[ Python pandas ] Dataframe 을 tensor (array) 로 변경하기 - df.values (0)	2022.02.07
[ Python pandas ] NaN 값이 포함되어있는 행 추출 - df.isna() (0)	2022.02.07
[ Python pandas ] 원하는 행, 열(iloc/loc), 값(iat/at) 추출 (0)	2022.02.05
[ Python pandas ] Dataframe row 제거 및 재배열 (drop(.index)), sort_values, reset_index) (0)	2022.01.12
[ Python pandas ] Dataframe 다루기 - unique, drop, fill, duplicate, merge (0)	2021.10.07

'Python/dataframe (pandas)' Related Articles