Я пытаюсь импортировать набор данных в RStudio, но я застрял с китайскими символами, поскольку они превращаются в беспорядочные коды. Вот код:
library(tidyverse)
df <- read_csv("中文,英文\n英文,德文")
df
# A tibble: 1 x 2
`\xd6\xd0\xce\xc4` `Ӣ\xce\xc4`
<chr> <chr>
1 "<U+04E2>\xce\xc4" "<U+00B5>\xc2\xce\xc4"
Когда я использую базовую функцию read.csv, она работает хорошо. Думаю, я должен сделать что-то не так с кодировкой. Но в read_csv нет опции кодировки, как мне это сделать?
read_csv
естьlocale
аргумент. Согласно документацииlocale The locale controls defaults that vary from place to place. The default locale is US-centric (like R), but you can use locale() to create your own locale that controls things like the default time zone, encoding, decimal mark, big mark, and day/month names
. - person akrun   schedule 29.10.2017readr
может читать альтернативные кодировки черезlocale
. Однако все функции чтения выдают строки, закодированные в UTF-8 в соответствии с документация по пакету - person Kevin Arseneau   schedule 29.10.2017Sys.setlocale(category="LC_ALL", locale = "English_United States.1252") read_csv("a,b\n坏,好") Sys.setlocale(category="LC_ALL", locale = "chinese") read_csv("a,b\n坏,好")
- person X.Jun   schedule 29.10.2017