Ошибка преобразования изображений PIL B&W в массивы Numpy

Я получаю странные ошибки, когда пытаюсь преобразовать черно-белое изображение PIL в массив numpy. Пример кода, с которым я работаю, приведен ниже.

    if image.mode != '1':
        image = image.convert('1') #convert to B&W
    data = np.array(image) #Have also tried np.asarray(image)
    n_lines = data.shape[0] #number of raster passes
    line_range = range(data.shape[1])
    for l in range(n_lines):
        # process one horizontal line of the image
        line = data[l]
        for n in line_range:
            if line[n] == 1:
                write_line_to(xl, z+scale*n, speed) #conversion to other program code
            elif line[n] == 0:
                run_to(xl, z+scale*n) #conversion to other program code

Я пробовал это, используя как массив, так и массив для преобразования, и получил разные ошибки. Если я использую массив, то данные, которые я получаю, не имеют ничего общего с тем, что я ввожу. Это выглядит как несколько очень сжатых частичных изображений, расположенных рядом, а оставшаяся часть пространства изображения заполнена черным цветом. Если я использую asarray, то весь python падает во время растрового шага (на случайной строке). Если я работаю с изображением в оттенках серого («L»), то ни для массива, ни для массива не возникает ни одна из этих ошибок.

Кто-нибудь знает, что я делаю неправильно? Есть ли что-то странное в том, как PIL кодирует черно-белые изображения, или что-то особенное, что мне нужно передать numpy, чтобы он правильно конвертировался?


person Elliot    schedule 03.05.2010    source источник
comment
Второстепенная проблема, которую мы только что обнаружили, заключается в том, что преобразование кажется дизерингом там, где мы хотим иметь сплошные линии.   -  person Elliot    schedule 04.05.2010
comment
В этом случае (дизеринг нежелателен), вероятно, имеет смысл сохранить изображения в оттенках серого (режим «L»/dtype np.uint8) и порог их с помощью numpy. Например. данные = np.массив (им); data = data › 127 должно нормально работать для изображений в градациях серого и вообще избегать сглаживания. Вы также можете пороговать вещи в PIL, но если вы все равно конвертируете в массивы numpy, это проще сделать с numpy. Во всяком случае, это только мои мысли... Удачи!   -  person Joe Kington    schedule 04.05.2010


Ответы (3)


Я считаю, что вы нашли ошибку в PIL! (или, возможно, в numpy, но я бы поспорил, что это на стороне PIL...)

Ответ @c выше дает один обходной путь (используйте im.getdata()), хотя я не уверен, почему numpy.asarry(image) для него segfaulting... (Может быть, старая версия PIL и/или numpy?) Это работает для меня, но производит тарабарщину на 1-битных изображениях PIL (и работает для всего остального, я часто использую его!).

Другим обходным путем является преобразование изображения BW обратно в оттенки серого (режим «L») перед преобразованием в массив numpy.

Преобразование изображения BW обратно в оттенки серого перед преобразованием в массив numpy кажется более быстрым, если важна скорость.

In [35]: %timeit np.array(im_bw.convert('L')).astype(np.uint8)
10000 loops, best of 3: 28 us per loop

In [36]: %timeit np.reshape(im_bw.getdata(), im_bw.size)
10000 loops, best of 3: 57.3 us per loop

В отдельном примечании, если вы изменяете содержимое массива на месте, обязательно используйте numpy.array вместо numpy.asarray, так как последний создаст массив из экземпляра изображения PIL без копирования памяти, таким образом возвращая чтение -только массив. Просто упомянул об этом, потому что я использую asarray() ниже...

Вот отдельный пример, который подтверждает ошибку...

import numpy as np
import Image

x = np.arange(256, dtype=np.uint8).reshape((16,16))
print 'Created array'
print x

im = Image.fromarray(x)
print 'Vales in grayscale PIL image using numpy.asarray <-- Works as expected'
print np.asarray(im)

print 'Converted to BW PIL image...'
im_bw = im.convert('1')

print 'Values in BW PIL image, using Image.getdata() <-- Works as expected'
print '  (Not a simple threshold due to dithering...)'
# Dividing by 255 to make the comparison easier
print np.reshape(im_bw.getdata(), (16, 16)) / 255 

print 'Values in BW PIL image using numpy.asarray() <-- Unexpected!'
print '   (Same occurs when using numpy.array() to copy and convert.)'
print np.asarray(im_bw).astype(np.uint8) 

print 'Workaround, convert back to type "L" before array conversion'
print np.array(im_bw.convert('L')).astype(np.uint8) / 255

Что выводит:

Created array
[[  0   1   2   3   4   5   6   7   8   9  10  11  12  13  14  15]
 [ 16  17  18  19  20  21  22  23  24  25  26  27  28  29  30  31]
 [ 32  33  34  35  36  37  38  39  40  41  42  43  44  45  46  47]
 [ 48  49  50  51  52  53  54  55  56  57  58  59  60  61  62  63]
 [ 64  65  66  67  68  69  70  71  72  73  74  75  76  77  78  79]
 [ 80  81  82  83  84  85  86  87  88  89  90  91  92  93  94  95]
 [ 96  97  98  99 100 101 102 103 104 105 106 107 108 109 110 111]
 [112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127]
 [128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143]
 [144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159]
 [160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175]
 [176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191]
 [192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207]
 [208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223]
 [224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239]
 [240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255]]

Vales in grayscale PIL image using numpy.asarray <-- Works as expected
[[  0   1   2   3   4   5   6   7   8   9  10  11  12  13  14  15]
 [ 16  17  18  19  20  21  22  23  24  25  26  27  28  29  30  31]
 [ 32  33  34  35  36  37  38  39  40  41  42  43  44  45  46  47]
 [ 48  49  50  51  52  53  54  55  56  57  58  59  60  61  62  63]
 [ 64  65  66  67  68  69  70  71  72  73  74  75  76  77  78  79]
 [ 80  81  82  83  84  85  86  87  88  89  90  91  92  93  94  95]
 [ 96  97  98  99 100 101 102 103 104 105 106 107 108 109 110 111]
 [112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127]
 [128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143]
 [144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159]
 [160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175]
 [176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191]
 [192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207]
 [208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223]
 [224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239]
 [240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255]]

Converted to BW PIL image...

Values in BW PIL image, using Image.getdata() <-- Works as expected
  (Not a simple threshold due to dithering...)
[[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0]
 [0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0]
 [0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0]
 [0 0 1 0 1 0 1 0 1 0 0 0 1 0 0 0]
 [0 1 0 0 0 0 0 0 0 0 1 0 0 1 0 1]
 [0 0 0 1 0 1 0 1 0 1 0 1 0 0 0 0]
 [1 0 1 0 1 0 1 0 1 0 0 0 1 1 0 1]
 [0 1 0 1 0 0 1 0 0 1 1 0 1 0 1 0]
 [1 0 1 0 1 0 1 1 0 1 0 1 0 1 0 1]
 [0 1 0 1 0 1 0 1 0 1 1 0 1 1 0 1]
 [1 1 0 1 1 1 1 0 1 1 0 1 1 0 1 1]
 [1 0 1 1 0 1 0 1 1 0 1 1 0 1 1 0]
 [1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1]
 [1 0 1 0 1 1 0 1 1 0 1 1 1 0 1 1]
 [1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1]
 [1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1]]

Values in BW PIL image using numpy.asarray() <-- Unexpected!
   (Same occurs when using numpy.array() to copy and convert.)
[[0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1]
 [1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1]
 [0 1 1 1 1 1 1 0 0 0 0 0 1 1 1 1]
 [1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1]
 [1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1]
 [1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1]
 [1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1]
 [1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1]
 [1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1]
 [1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1]
 [1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1]
 [1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1]
 [1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1]
 [1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1]
 [1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1]
 [1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1]]

Workaround, convert back to type "L" before array conversion
[[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0]
 [0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0]
 [0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0]
 [0 0 1 0 1 0 1 0 1 0 0 0 1 0 0 0]
 [0 1 0 0 0 0 0 0 0 0 1 0 0 1 0 1]
 [0 0 0 1 0 1 0 1 0 1 0 1 0 0 0 0]
 [1 0 1 0 1 0 1 0 1 0 0 0 1 1 0 1]
 [0 1 0 1 0 0 1 0 0 1 1 0 1 0 1 0]
 [1 0 1 0 1 0 1 1 0 1 0 1 0 1 0 1]
 [0 1 0 1 0 1 0 1 0 1 1 0 1 1 0 1]
 [1 1 0 1 1 1 1 0 1 1 0 1 1 0 1 1]
 [1 0 1 1 0 1 0 1 1 0 1 1 0 1 1 0]
 [1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1]
 [1 0 1 0 1 1 0 1 1 0 1 1 1 0 1 1]
 [1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1]
 [1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1]]
person Joe Kington    schedule 04.05.2010
comment
Я не думаю, что этот баг исчез. Я все еще получаю print(np.array(Image.new('1', (4, 2), color=1))) -> [[ True True False False] [False False False False]] на своем Raspberry Pi с Image.VERSION 1.1.7 и np.__version__ 1.13.3. Но что интересно, в Mac OS X я получаю правильный результат: [[ True True True True] [ True True True True]] с одинаковыми версиями обоих. - person Bill; 05.11.2017

Не уверен в этой строке:

data = numpy.array(image)

На самом деле, это дает мне segfault. Но я только что попробовал следующее, и он отлично работает:

import numpy
import Image

im = Image.open("some_photo.jpg")
im = im.convert("1")

pixels = im.getdata() # returns 1D list of pixels
n = len(pixels)
data = numpy.reshape(pixels, im.size) # turn into 2D numpy array

for row in data:
    # do your processing
    pass

# Check that the numpy array's data is good
im2 = Image.new("1", im.size)
im2.putdata(numpy.reshape(data, [n, 1]))
im2.show()
person user85461    schedule 04.05.2010
comment
Что-то странное с черно-белым преобразованием. Он неправильно регистрирует края. Поэтому вместо логотипа я получаю большой круг. - person Elliot; 04.05.2010

Какая у вас версия numpy? Я обнаружил, что после понижения версии numpy с 1.21 до 1.20 это сработало.

pip install numpy==1.20
person Jaeyoon Jeong    schedule 05.07.2021