корпус с выбранными файлами в каталоге

Я хочу прочитать один файл как один документ в корпусе, но не нашел никакого решения, я пробовал с

>fdat <- readLines(fname)
> reuters=suppressWarnings(Corpus(VectorSource(fdat),readerControl = list(language = "en")))
> reuters
A corpus with 139 text documents

Или можно ли выбрать некоторые выбранные файлы из каталога внутри корпуса

#reading all the files within directory
Corpus(DirSource("C:/test"), readerControl=list(language="eng", reader=readPlain))

например, я хочу читать «c:/test/abc.txt» и «c:/test/xyz.txt» только из каталога и каждого файла в виде документа. Любая помощь, спасибо.


person Aashu    schedule 21.01.2014    source источник


Ответы (1)


Используйте pattern для сопоставления имен файлов:

DirSource(directory=path_directory,pattern="abc.txt|xyz.txt")
person agstudy    schedule 21.01.2014