Форум сайта python.su
Как с найти дубликаты в dataframe по определенному столбцу? Метод, который я нашёл находит дубликаты, но первое упоминание не считается дубликатом, а мне нужно получить все записи.
Офлайн
import pandas as pd df = pd.DataFrame([[1, 2], [3, 4], [5, 6], [1, 4], [8, 2], [2, 1], [1, 2]], columns=['a', 'b']) for col in df.columns: print(col, list(zip(df[col], df.duplicated(subset=col, keep=False).values))) print(df[col][df.duplicated(keep=False, subset=col) == True])
Офлайн
noob_saibot
спасибо, работает)
Офлайн