Получить случайную подвыборку из таблицы данных pyfits

У меня очень простой вопрос, но Google, похоже, не может мне помочь. Мне нужна подвыборка таблицы pyfits... просто удалите 90% строк или что-то в этом роде. Я прочитал таблицу с:

data_table = pyfits.getdata(base_dir + filename)

Мне нравится организация таблицы pyfits, где я обращаюсь к полю с помощью data_table.field(fieldname), поэтому я хотел бы сохранить структуру данных, но удалить строки.

carl 27.09.2017 источник

comment

Что бы это ни стоило, вам даже не нужно использовать .field(fieldname) — вы можете просто использовать синтаксис нижнего индекса, такой как data_table[fieldname] (где как data_table[x], где x — целое число, возвращает строку таблицы). Кроме того, в этом уникальном для pyfits нет ничего особенного — это просто прославленный numpy.recarray - Iguananaut 04.10.2017

Ответы (1)

arrow_upward
4
arrow_downward

Вы можете использовать numpy.random.choice для создания массива содержащий несколько случайных выборов из другого массива.

В вашем случае вам нужны строки "x" из вашего data_table. Вы не можете напрямую использовать choice в таблице, но вы можете использовать len своей таблицы для random.choice:

import numpy as np
rows_numbers_to_keep = np.random.choice(len(data_table), 2, replace=False)

И затем проиндексируйте свою таблицу:

subsample = data_table[rows_numbers_to_keep]

Например (я использую astropy, потому что PyFITS больше не разрабатывается и был перенесен на astropy.io.fits< /а>):

>>> data
FITS_rec([(1, 4, 7), (2, 5, 8), (3, 6, 9), (4, 7, 0)],
         dtype=(numpy.record, [('a', 'S21'), ('b', 'S21'), ('c', 'S21')]))

>>> data[np.random.choice(len(data), 2, replace=False)]  # keep 2 distinct rows
FITS_rec([(1, 4, 7), (4, 7, 0)],
         dtype=(numpy.record, [('a', 'S21'), ('b', 'S21'), ('c', 'S21')]))

Если вы хотите разрешить получение одной и той же строки несколько раз, вы можете вместо этого использовать replace=True.

MSeifert 27.09.2017

Вопросы по теме

Сбой междоменного HTTP-запроса в AngularJS
не могу создать каталог с помощью mkdir
Почему в моем запросе не работает функция Neo4j None?
несколько растровых изображений против рисунков - влияние на производительность и память
удаление элемента в конкретном связанном списке
MongoDB: последняя запись для каждой категории по метке времени
Невероятно, но порядок просмотра раскадровки не соблюдается для представлений контейнера, исправить?
Django REST Как правильно хешировать пароль
Передача NSString между классами
Ошибка Ajax: код ответа 200
Приложение WinRT зависает при вызове BitmapDecoder.CreateAsync(stream)
Ошибка в поле выбора OpenERP версии 7
установить паруса вручную на сервер ubuntu
подстановочный знак classpath в @PropertySource
Получить и удержать вызов в twilio
Столбец автозаполнения на основе данных другого столбца
Фильтрация в пандах: исключение строк, содержащих часть строки [дубликаты]
Получить значения заголовков в ASP.NET MVC
Почему опечатка в объявлении функции Haskell приводит к тому, что GHCi выдает ошибки вокруг ранее скомпилированного кода?
как перепривязать сетку данных Silverlight