Найти - Пользователи
Полная версия: Pandas найти дубликаты
Начало » Python для новичков » Pandas найти дубликаты
1
alexander4
Как с найти дубликаты в dataframe по определенному столбцу? Метод, который я нашёл находит дубликаты, но первое упоминание не считается дубликатом, а мне нужно получить все записи.
noob_saibot
 import pandas as pd
df = pd.DataFrame([[1, 2], [3, 4], [5, 6], [1, 4], [8, 2], [2, 1], [1, 2]], columns=['a', 'b'])
for col in df.columns:
    print(col, list(zip(df[col], df.duplicated(subset=col, keep=False).values)))
    print(df[col][df.duplicated(keep=False, subset=col) == True])

keep=False
alexander4
noob_saibot
спасибо, работает)
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB