Использование файлов .data из репозитория UCI

В этой краткой статье мы узнаем, как использовать наборы данных из UCI, которые поставляются с файлом .data.
Загрузка данных из репозитория UCI:

Некоторые интересные наборы данных доступны бесплатно в репозитории UCI. Вы можете использовать его, чтобы отточить свои аналитические способности.

Для начала загрузим файл .data из репозитория Калифорнийского университета в Ирвине. Мы загрузим набор данных радужной оболочки глаза для этой статьи. Вы можете использовать ту же процедуру для загрузки любого набора данных.

Скачав его, вы можете открыть с помощью блокнотов или Microsoft Excel.

Теперь попробуем использовать его в блокноте jupyter. Сначала мы импортируем панд, а затем будем использовать read_csv () для чтения данных в фрейм данных.

Однако, поскольку мы не видим имена столбцов, теперь мы добавим имена столбцов. Для этого мы скопируем имена атрибутов из информации об атрибутах примерно так:

Теперь мы добавим имена столбцов в ваш DataFrame с помощью свойства .columns в DataFrame следующим образом:

Вот полный код из ноутбука jupyter, если вы хотите попробовать его самостоятельно.

Https://gist.github.com/da785d826e1c0f43b1ec4608c6528ccd.git

Использование файлов .data из репозитория UCI

Вопросы по теме