Я хочу сделать рекомендательную систему. У меня есть 17770 файлов txt, каждый из которых представляет собой метаданные фильма, содержащие идентификатор пользователя и рейтинг.
Мне не удается импортировать данные в RStudio.
Я искал много методов для импорта нескольких данных, но в итоге все методы не работали.
По крайней мере, я пробовал 3 кода:
folderPath <- "D:/3rd Term/DataAnalysis/finalProject/dataSet/trainData/"
file_list <- list.files(path=folderPath, pattern="*.txt")
dataSet <-
do.call("cbind",
lapply(file_list,
function(x)
read.table(paste(folderPath, x, sep=''),
header = TRUE,
stringsAsFactors = FALSE)))
========================================================================================
setwd("D:/3rd Term/DataAnalysis/finalProject/dataSet/trainData/")
files <-list.files()
data <- 0
for (f in files) {
tempData = scan( f, what="character", sep = "")
dataSet <- cbind(data,tempData)
}
=========================================================================================
list_of_files <- list.files(path = "D:/3rd Term/DataAnalysis/finalProject/dataSet/trainData/", recursive = TRUE,
pattern = "\\.txt$",
full.names = TRUE)
DT <- rbindlist(sapply(list_of_files, fread, simplify = FALSE),
use.names = TRUE, idcol = "FileName", fill = TRUE)
Я ожидаю, что файлы будут импортированы в виде фрейма данных. Я хочу использовать cbind, чтобы я мог объединить весь текст, а затем создать матрицу.
РЕДАКТИРОВАТЬ: Я забыл упомянуть, что каждый текстовый файл содержит идентификатор пользователя, рейтинг и дату (что не важно), которые имеют разделитель / разделитель запятой, например:
1488844,3,2005-09-06
822109,5,2005-05-13
885013,4,2005-10-19
30878,4,2005-12-26
machine-learning
илиrecommender-systems
- не спамите нерелевантные теги (удалены). - person desertnaut   schedule 16.09.2019