Уведомления

Группа в Telegram: @pythonsu

#1 Дек. 1, 2021 22:19:58

shtabs-kapitan
Зарегистрирован: 2021-12-01
Сообщения: 5
Репутация: +  0  -
Профиль   Отправить e-mail  

Создание датафрейма из директории с файлами

Помогите, пожалуйста, написать код.
Есть группа папок с наименованием от 1 до 102 . В папках лежат картинки jpeg.
Как написать код чтобы создать датафрейм содержащий таблицу в которой в одном столбце наименование файлов во втором столбце название папки где лежат эти файлы. См.скриншот.

Прикреплённый файлы:
attachment Снимок.JPG (50,5 KБ)

Офлайн

#2 Дек. 1, 2021 23:21:16

py.user.next
От:
Зарегистрирован: 2010-04-29
Сообщения: 9875
Репутация: +  854  -
Профиль   Отправить e-mail  

Создание датафрейма из директории с файлами

Сначала получаешь список пар питоновскими средствами, а потом из этого списка пар делаешь pandas.DataFrame .

Можешь использовать os.listdir() как для получения списка директорий, так и для получения списка файлов в директории. Но os.listdir() не дифференцирует директории и файлы - для выдаваемых имён нельзя определить, имя файла это или имя директории (только применять там дополнительно os.path.isfile() и os.path.isdir(), что накладно).
Поэтому, скорее всего, тебе надо будет использовать os.walk().

Пример конвертирования списка пар в датафрейм

  
>>> import pandas
>>> 
>>> data = [('name1', 'value1'), ('name2', 'value2')]
>>> 
>>> df = pandas.DataFrame(data, columns=('file', 'directory'))
>>> df
    file directory
0  name1    value1
1  name2    value2
>>>
  
>>> import pandas
>>> 
>>> data = [
...     ('filename1.jpg', 'c:\\dir1\\dir1\\dir1'),
...     ('filename2.jpg', 'c:\\dir2\\dir2\\dir2')
... ]
>>> 
>>> df = pandas.DataFrame(data, columns=('file', 'directory'))
>>> df
            file          directory
0  filename1.jpg  c:\dir1\dir1\dir1
1  filename2.jpg  c:\dir2\dir2\dir2
>>>



Отредактировано py.user.next (Дек. 1, 2021 23:30:45)

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version