такой вопрос: я хочу построить классификатор (Naive Bayes). у меня ок. 50 тыс. примеров (с классами) для обучения, 1852 параметрoв в каждом, храню их в виде:
[({feat1: val1, feat2: val2, ...}, classA), ({feat1: val1, feat2: val2, ...}, classB), ...]Traceback (most recent call last):
File "add_values/add_values.py", line 39, in <module>
extract_features(features, get_token_set(for_set))
File "add_values/add_values.py", line 27, in extract_features
features[token]=(token in words[:-2])
MemoryError
Подскажите пожалуйста можно ли решить эту проблему не переписывая классификатор (он принимает в кач-ве аргумента данные именно в таком формате).
заранее спасибо!
P.S. кусок кода который дает ошибку
def extract_features(features_file, token_set): featureset=[] for line in features_file: features={} words=line.strip().split(" ") for token in token_set: features[token]=(token in words[:-2]) features["concept"]=words[-2] featureset.append((features, words[-1])) return featureset