Как мне прочитать текстовый файл в функцию анализа настроений в python?

Я новичок в python и пытаюсь работать над анализом настроений, используя библиотеку vadersentiment.

from vaderSentiment.vaderSentiment import SentimentIntensityAnalyzer

analyser = SentimentIntensityAnalyzer()

def print_sentiment_scores(sentence):
    snt = analyser.polarity_scores(sentence)
    print("{:-<40} {}".format(sentence, str(snt)))

print_sentiment_scores("I just got a call from my boss - does he realise it's Saturday?")

Мне только что звонил мой босс - он понимает, что сегодня суббота? {'отрицательный': 0.0, 'neu': 1.0, 'pos': 0.0, 'составной': 0.0}

Как видите, приложение запускается, но только если я вручную ввожу текст. Как мне заставить его читать файл MS Word с текстом или даже файл csv, чтобы дать мне окончательные оценки тональности всего текста в этом файле?


person Jay Taggert    schedule 20.08.2019    source источник
comment
Выберите формат файла и Google, как читать из этого файла в переменную в цикле. Ваш вопрос действительно не имеет ничего общего с анализом настроений, вы разобрались.   -  person Alex Hall    schedule 20.08.2019
comment
импортировать csv с помощью open('Before.csv', 'rb') как f: reader = csv.reader(f) your_list = list(reader) print(your_list) Traceback (последний последний вызов): File ‹ipython-input- 16-95dabded387f›, строка 4, в ‹module› your_list = list(reader) Ошибка: итератор должен возвращать строки, а не байты (вы открывали файл в текстовом режиме?)   -  person Jay Taggert    schedule 20.08.2019
comment
Похоже, вы скопировали старый код Python 2 из этого вопроса, который, как указывали другие, приводит к этой ошибке. Просто используйте r, а не rb, чтобы открыть в текстовом режиме.   -  person Alex Hall    schedule 20.08.2019
comment
Я использовал r '', но получил UnicodeDecodeError: кодек 'charmap' не может декодировать байт 0x9d в позиции 7528: сопоставление символов с ‹undefined›   -  person Jay Taggert    schedule 20.08.2019
comment
stackoverflow.com/questions/49562499/ попробуйте все три ответа.   -  person Alex Hall    schedule 20.08.2019
comment
хорошо, ошибка игнорирования сработала. и я смог распечатать свой csv, но когда я поместил этот кадр данных в свою функцию оценки настроений печати, я получаю AttributeError: объект «список» не имеет атрибута «разделить»   -  person Jay Taggert    schedule 20.08.2019
comment
Начните новый вопрос с минимально воспроизводимого примера и полной трассировкой.   -  person Alex Hall    schedule 20.08.2019
comment
Но тогда это также будет помечено как дубликат   -  person Jay Taggert    schedule 20.08.2019
comment
Он будет помечен как дубликат, если на конкретную проблему, с которой вы столкнулись, был дан ответ в другом месте, и в этом случае вы можете прочитать ответ там. Он не будет помечен как дубликат тех же вопросов, что и здесь, потому что ваша проблема изменилась. В частности, ваш первоначальный вопрос заключался в том, как мне читать из файла, и теперь, по крайней мере, у вас есть попытка кода и сообщение об ошибке, которое сильно отличается. Я не могу лично решить каждую из ваших ошибок.   -  person Alex Hall    schedule 20.08.2019
comment
stackoverflow.com/questions/57577132/ @AlexHall, пожалуйста, следите за новым вопросом   -  person Jay Taggert    schedule 20.08.2019