Форум сайта python.su
0
xml в котором всё слито
Прикреплённый файлы:
LM810225T81_150935forum2.XML (1,2 KБ)
Офлайн
0
фаил с известными дублями
f7a1b5d3-b91a-11e1-8a88-00155d11dc00
5e354034-b919-11e1-8a88-00155d11dc00
Прикреплённый файлы:
l.txt (76 байт)
Офлайн
857
widgДолжно быть два неслитый файла - это входящие файлы.
xml в котором всё слито
widgЭтот файл не нужен. Его даже делать не надо.
фаил с известными дублями
Отредактировано py.user.next (Дек. 6, 2015 07:23:22)
Офлайн
0
Из-за срочности дела, я уже всё в ручную перелопатил, но в будущем этот скрипт нужен будет.
Я оцениваю свои силы, знаю что я не смогу написать как надо, в мои силы только поправить скрипт под свои нужды, обычно гуглю, нахожу похожее, правлю и что то получается, но ничего накопать в этот раз не смог. если бы я где-то ещё смог попросить помощи, я готов недорого заплатить. Знаю что тут помогут!
Реальные файлы скинуть не могу т.к. это персональные данные.
Как правильно в XML по убирать дубли?
Офлайн
857
Короче, я тебе составлю эти два файла (из первого файла), только потом не говори, что скрипт неправильно работает.
widgТак реальные и не надо. Надо два примерных и точный результат, который должен из них получиться. Тогда можно скрипт написать и проверить, правильно ли он работает. А так придётся догадки строить. Опыт показывает, что когда задание полностью не известно, то и программы, которые пишутся по такому заданию, тоже неправильно работают (делают не то, что нужно). В итоге время и силы тратятся, а программы как не было, так и нет.
Реальные файлы скинуть не могу т.к. это персональные данные.
widgЭто тоже элементарно делается.
Как правильно в XML по убирать дубли?
Офлайн
0
Да правильно нужно в первом удалить только то, что есть и во втором сравнивая один атрибут
Офлайн
857
Офлайн
0
не то, нужно удалить из файла родителя зная его атрибут
проверить в массиве, сравнить, если он есть то удалить
Офлайн
857
Так а чем не устраивает получившийся файл?
Офлайн
0
вот что мне помогло
from xml.dom import minidom b = [line.rstrip('\n') for line in open('list.txt')] doc = minidom.parse("HM810225T81_1511244.XML") for element in doc.getElementsByTagName('PERS'): if element.getAttribute('ID_PAC') in b: element.parentNode.removeChild(element) f = open('HM810225T81_1511244+.XML', "w") f.write(doc.toxml()) f.close()
Офлайн