Уведомления

Группа в Telegram: @pythonsu

#1 Фев. 29, 2016 13:29:21

Irina_n
Зарегистрирован: 2016-02-29
Сообщения: 1
Репутация: +  0  -
Профиль   Отправить e-mail  

гляньте pls в код, как убрать знаки препинания

привет! нужна помощь!

код взять из генсим, я удалила stopworts через NLTK.
помогите pls убрать знаки препинания.

огромное спасибо!

import logging
logging.basicConfig(format= ‘%(asctime)s : %(levelname)s : %(message)s’, level=logging.INFO)
import re
from gensim import corpora, models, similarities
from nltk.corpus import stopwords
from nltk.tokenize import word_tokenize

documents = [“Human machine, interface for lab abc, computer applications”,
“A survey: of user opinion - of computer system response time”]

stoplist = set(stopwords.words(“english”))
??????b = re.sub(ur'^*||\s(?$)(?u)', “ ”, documents)
texts = [
for document in documents]

dictionary = corpora.Dictionary(texts)
dictionary.save('/tmp/deerwester.dict') # store the dictionary, for future reference

new_doc = “Human computer interaction”
new_vec = dictionary.doc2bow(new_doc.lower().split())
corpus =
corpora.MmCorpus.serialize('/tmp/deerwester.mm', corpus) # store to disk, for later use

from pprint import pprint # pretty-printer

pprint(texts)
print(dictionary)
print(new_vec)
print(corpus)

Отредактировано Irina_n (Фев. 29, 2016 14:45:40)

Офлайн

#2 Фев. 29, 2016 23:21:28

JOHN_16
От: Россия, Петропавловск-Камчатск
Зарегистрирован: 2010-03-22
Сообщения: 3292
Репутация: +  221  -
Профиль   Отправить e-mail  

гляньте pls в код, как убрать знаки препинания

Код нужно оборачивать в теги code



_________________________________________________________________________________
полезный блог о python john16blog.blogspot.com

Офлайн

#3 Март 1, 2016 15:54:05

ZerG
Зарегистрирован: 2012-04-05
Сообщения: 2627
Репутация: +  61  -
Профиль   Отправить e-mail  

гляньте pls в код, как убрать знаки препинания

Кто понял что требуется сделать? 0_о



Влодение рускай арфаграфией - это как владение кунг-фу: настаящие мастира не преминяют ево бес ниабхадимости

Офлайн

#4 Март 1, 2016 17:05:52

ajib6ept
От: От: От: От: От: От: От: От:
Зарегистрирован: 2013-08-04
Сообщения: 297
Репутация: +  26  -
Профиль   Отправить e-mail  

гляньте pls в код, как убрать знаки препинания

ZerG
documents

Наверно из списка documents, надо удалить определенные стоп-слова, представленные в виде списка.
Стоп-слова он удалил, но не может из списка documents удалить знаки препинания.



_________________________
Python golden rule: Do not PEP 8 unto others; only PEP 8 thy self.
Don't let PEP 8 make you insanely intolerant of other people's code.

Офлайн

#5 Март 1, 2016 22:01:18

doza_and
От:
Зарегистрирован: 2010-08-15
Сообщения: 4138
Репутация: +  253  -
Профиль   Отправить e-mail  

гляньте pls в код, как убрать знаки препинания

ajib6ept
Стоп-слова он удалил
:) Вы невнимательно посмотрели не он а она.



Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version