У меня есть куча csv
файлов, которые я читаю в R и включаю в папку package/data в формате .rdata
. К сожалению, не-ASCII-символы в данных не проходят проверку. В пакете tools
есть две функции для проверки символов, отличных от ASCII (showNonASCII
и showNonASCIIfile
), но я не могу найти ни одной, чтобы удалить/очистить их.
Прежде чем я изучу другие инструменты UNIX, было бы здорово сделать все это в R, чтобы я мог поддерживать полный рабочий процесс от необработанных данных до конечного продукта. Существуют ли какие-либо существующие пакеты/функции, которые помогут мне избавиться от символов, отличных от ASCII?
read.csv()
принимает аргументencoding
, поэтому вы можете обрабатывать их, по крайней мере, в R? Какая конкретная проверка символов, отличных от ASCII, не выполняется, это в R (если да, опубликуйте его здесь) или во внешнем? - person smci   schedule 12.08.2016