Отображение YUV в OpenGL

У меня проблемы с отображением необработанного файла YUV в формате NV12.

Я могу отобразить выбранный кадр, но он по-прежнему в основном черно-белый с определенными оттенками розового и зеленого.

Вот как выглядит мой результат alt text

В любом случае, вот как работает моя программа. (Это делается в cocoa / objective-c, но мне нужен ваш экспертный совет по алгоритму программы, а не по синтаксису.)

Перед выполнением программы файл YUV сохраняется в двоичном файле с именем test.yuv. Файл имеет формат NV12, что означает, что сначала сохраняется план Y, а затем план UV чередуется. У меня нет проблем с извлечением файлов, потому что я много тестировал его.

Во время инициализации я создаю таблицу поиска, которая преобразует двоичные / 8 байтов / байт / символы в уважаемые значения Y, U, V с плавающей запятой.

Для плоскости Y это мой код

-(void)createLookupTableY //creates a lookup table for converting a single byte into a float between 0 and 1
{
    NSLog(@"YUVFrame: createLookupTableY");
    lookupTableY = new float [256];
    
    for (int i = 0; i < 256; i++)
    {
        lookupTableY[i] = (float) i /255;
        //NSLog(@"lookupTableY[%d]: %f",i,lookupTableY[i]);//prints out the value of each float
    }
}

Таблица поиска плоскости U

-(void)createLookupTableU //creates a lookup table for converting a single byte into a float between 0 and 1
{
    NSLog(@"YUVFrame: createLookupTableU");
    lookupTableU = new float [256];
    
    for (int i = 0; i < 256; i++)
    {
        lookupTableU[i] =  -0.436 + (float) i / 255* (0.436*2);
        NSLog(@"lookupTableU[%d]: %f",i,lookupTableU[i]);//prints out the value of each float
    }
}

И справочная таблица V

-(void)createLookupTableV //creates a lookup table for converting a single byte into a float between 0 and 1
{
    NSLog(@"YUVFrame: createLookupTableV");
    lookupTableV = new float [256];
    
    for (int i = 0; i < 256; i++)
    {
        lookupTableV[i] =  -0.615 + (float) i /255 * (0.615*2);
        NSLog(@"lookupTableV[%d]: %f",i,lookupTableV[i]);//prints out the value of each float
    }
}

после этого я извлекаю план Y и UV и сохраняю их в двух буферах, yBuffer и uvBuffer

на этом этапе я пытаюсь преобразовать данные YUV и сохранить их в буферный массив RGB, называемый frameImage

-(void)sortAndConvert//sort the extracted frame data into an array of float
{
    NSLog(@"YUVFrame: sortAndConvert");
    int frameImageCounter = 0;
    int pixelCounter = 0;
    for (int y = 0; y < YUV_HEIGHT; y++)//traverse through the frame's height
    {
        for ( int x = 0; x < YUV_WIDTH; x++)//traverse through the frame's width
        {
            
            float Y = lookupTableY [yBuffer [y*YUV_WIDTH + x] ];
            float U = lookupTableU [uvBuffer [ ((y / 2) * (YUV_WIDTH / 2) + (x/2)) * 2  ] ]; 
            float V = lookupTableV [uvBuffer [  ((y / 2) * (YUV_WIDTH / 2) + (x/2)) * 2 + 1] ];
        
            float RFormula = Y + 1.13983f * V;
            float GFormula = Y - 0.39465f * U - 0.58060f * V;
            float BFormula = Y + 2.03211f * U;
            
             frameImage [frameImageCounter++] = [self clampValue:RFormula];
             frameImage [frameImageCounter++] = [self clampValue:GFormula];
             frameImage [frameImageCounter++] = [self clampValue:BFormula];

        }
    }

}

затем я попытался нарисовать изображение в OpenGL

-(void)drawFrame:(int )x
{
    
    GLuint texture;
    
    glGenTextures(1, &texture);
    glBindTexture(GL_TEXTURE_2D, texture);
    glTexImage2D(GL_TEXTURE_2D, 0, GL_RGB, YUV_WIDTH, YUV_HEIGHT, 0, GL_RGB, GL_FLOAT, frameImage);
    
    glTexParameteri(GL_TEXTURE_2D, GL_TEXTURE_MIN_FILTER, GL_LINEAR);

    glEnable(GL_TEXTURE_2D);
    glBindTexture(GL_TEXTURE_2D, texture);
    glRotatef( 180.0f, 1.0f, 0.0f, 0.0f );

    glBegin( GL_QUADS );
    glTexCoord2d(0.0,0.0); glVertex2d(-1.0,-1.0);
    glTexCoord2d(1.0,0.0); glVertex2d(+1.0,-1.0);
    glTexCoord2d(1.0,1.0); glVertex2d(+1.0,+1.0);
    glTexCoord2d(0.0,1.0); glVertex2d(-1.0,+1.0);
    glEnd();
    
    glFlush();
}

так что в основном это моя программа в ореховой скорлупе. по сути, я читаю двоичные файлы YUV, храню все данные в буфере массива символов. Затем я переводю эти значения в их уважаемые значения с плавающей запятой YUV.

Вот где, я думаю, может быть ошибка: в таблице поиска Y я стандартизировал плоскость Y до [0,1], в плоскости U я стандартизировал значения между [-0,435,0,436], а в плоскости V я стандартизировал это bewteen [-0.615,0.615]. Я сделал это, потому что это диапазоны значений YUV согласно википедии.

А формула преобразования YUV в RGB - это та же формула из Википедии. Я также пробовал различные другие формулы, и это единственная формула, которая дает приблизительный вид кадра. Кто-нибудь может рискнуть догадаться, почему моя программа некорректно отображает данные кадра YUV. Я думаю, это как-то связано с моей техникой стандартизации, но мне кажется, что это нормально.

Я провел много проверок и на 100% уверен, что ошибка вызвана таблицей поиска. Я не думаю, что мои формулы настройки верны.

На заметку всем, кто это читает. Долгое время мой кадр не отображался должным образом, потому что я не мог правильно извлечь данные кадра.

Когда я впервые начал программировать, у меня создалось впечатление, что в клипе, состоящем, скажем, из 30 кадров, все данные 30 Y-плоскости сначала записываются в файл данных, а затем - данные UV-плоскости.

Методом проб и ошибок я обнаружил, что для файла данных YUV, в частности NV12, файл данных хранится следующим образом

Y(1) UV(1) Y(2) UV(2) ... ...

@nschmidt

Я изменил свой код на то, что вы предложили

float U = lookupTableU [uvBuffer [ (y * (YUV_WIDTH / 4) + (x/4)) * 2 ] ]
float V = lookupTableU [uvBuffer [ (y * (YUV_WIDTH / 4) + (x/4)) * 2 + 1] ]

и это результат, который я получаю alt text

вот строка печати с консоли. Я распечатываю значения Y, U, V и RGB, которые переводятся и сохраняются в массиве frameImage

YUV: [0.658824, -0.022227, -0.045824] RGBFinal: [0.606593,0.694201,0.613655]

YUV: [0,643137, -0,022227, -0,045824] RGBFinal: [0,590906,0,678514,0,597969]

YUV: [0.607843, -0.022227, -0.045824] RGBFinal: [0.555612,0.643220,0.562675]

YUV: [0.592157, -0.022227, -0.045824] RGBFinal: [0.539926,0.627534,0.546988]

YUV: [0.643137,0.025647,0.151941] RGBFinal: [0.816324,0.544799,0.695255]

YUV: [0.662745,0.025647,0.151941] RGBFinal: [0.835932,0.564406,0.714863]

YUV: [0.690196,0.025647,0.151941] RGBFinal: [0.863383,0.591857,0.742314]

Обновление от 13 июля 2009 г.

Проблема была наконец решена благодаря рекомендации nschmidt. Оказывается, мой файл YUV был на самом деле в формате YUV 4: 1: 1. Мне изначально сказали, что это в формате YUV NV12. В любом случае, я хотел бы поделиться с вами своими результатами.

Вот вывод

alt text

и мой код для декодирования выглядит следующим образом

        float Y = (float) yBuffer [y*YUV_WIDTH + x] ;
        float U = (float) uvBuffer [ ((y / 2) * (YUV_WIDTH  / 2) + (x/2))   ] ; 
        float V = (float) uvBuffer [  ((y / 2) * (YUV_WIDTH  / 2) + (x/2))  + UOffset] ;

        float RFormula = (1.164*(Y-16) + (1.596* (V - 128) ));
        float GFormula = ((1.164 * (Y - 16)) - (0.813 * ((V) - 128)) - (0.391 * ((U) - 128)));
        float BFormula = ((1.164 * (Y - 16)) + (2.018 * ((U) - 128)));


        frameImage [frameImageCounter] = (unsigned char)( (int)[self clampValue:RFormula]);
        frameImageCounter ++;
        frameImage [frameImageCounter] =  (unsigned char)((int)[self clampValue:GFormula]);
        frameImageCounter++;
        frameImage [frameImageCounter] = (unsigned char)((int) [self clampValue:BFormula]);
        frameImageCounter++;



GLuint texture;

glGenTextures(1, &texture);
glEnable(GL_TEXTURE_2D);

glBindTexture(GL_TEXTURE_2D, texture);
glTexParameteri(GL_TEXTURE_2D, GL_GENERATE_MIPMAP_SGIS, GL_TRUE);

glTexImage2D(GL_TEXTURE_2D, 0, GL_RGB, YUV_WIDTH, YUV_HEIGHT, 0, GL_RGB, GL_UNSIGNED_BYTE, frameImage);

//glTexParameteri(GL_TEXTURE_2D, GL_TEXTURE_MIN_FILTER, GL_LINEAR);
glTexParameteri(GL_TEXTURE_2D,GL_TEXTURE_WRAP_S,GL_CLAMP_TO_EDGE_SGIS);
glTexParameteri(GL_TEXTURE_2D,GL_TEXTURE_WRAP_T,GL_CLAMP_TO_EDGE_SGIS);
glTexParameteri(GL_TEXTURE_2D,GL_TEXTURE_MAG_FILTER,GL_LINEAR);
glTexParameteri(GL_TEXTURE_2D,GL_TEXTURE_MIN_FILTER,GL_LINEAR_MIPMAP_LINEAR);

glRotatef( 180.0f, 1.0f, 0.0f, 0.0f );

glBegin( GL_QUADS );
glTexCoord2d(0.0,0.0); glVertex2d(-1.0,-1.0);
glTexCoord2d(1.0,0.0); glVertex2d(+1.0,-1.0);
glTexCoord2d(1.0,1.0); glVertex2d(+1.0,+1.0);
glTexCoord2d(0.0,1.0); glVertex2d(-1.0,+1.0);
glEnd();

NSLog(@"YUVFrameView: drawRect complete");
glFlush();

по сути, я использовал NSData для извлечения необработанных файлов. хранится в буфере массива символов. Для преобразования YUV в RGB я использовал приведенную выше формулу, после чего зафиксировал значения до [0: 255]. затем я использовал 2DTexture в OpenGL для отображения.

Поэтому, если вы в будущем конвертируете YUV в RGB, используйте формулу, приведенную выше. Если вы используете формулу преобразования YUV в RGB из предыдущей публикации, вам необходимо отобразить текстуру в GL_Float из значений для RGB, зажатых между [0: 1]


person Community    schedule 09.07.2009    source источник
comment
Здравствуйте, можно ли поделиться полным примером кода?   -  person M P    schedule 17.04.2020


Ответы (3)


Следующая попытка :) Думаю, у тебя уф-буфер не чередуется. Похоже, что сначала идут значения U, а затем массив значений V. Изменение строк на

unsigned int voffset = YUV_HEIGHT * YUV_WIDTH / 2;
float U = lookupTableU [uvBuffer [ y * (YUV_WIDTH / 2) + x/2] ]; 
float V = lookupTableV [uvBuffer [ voffset + y * (YUV_WIDTH / 2) + x/2] ];

может указать, так ли это на самом деле.

person nschmidt    schedule 11.07.2009
comment
вау, я протестировал свою программу с вашей настройкой, и она наконец сработала. Большое спасибо, чувак. Оказывается, вы были правы, плоскости U&V не имеют чересстрочной развертки, как мне изначально сказали. большое спасибо нщмидт. Я оцениваю тебя выше - person ReachConnection; 13.07.2009
comment
нет проблем :). для записи первое предположение о формате 4: 1: 1 было на самом деле неверным. У вас формат 4: 2: 2. Настоящая проблема заключалась только в том, что ваши данные не чередовались. - person nschmidt; 14.07.2009
comment
@ReachConnection: Можете ли вы сказать мне, что [self clampValue: RFormula] делает эта функция? Я планирую использовать ваш код для получения UIImage от YUV422. - person subhash Amale; 14.04.2015

Я думаю, вы неправильно указываете значения U и V. Скорее, чем:

float U = lookupTableU [uvBuffer [ ((y / 2) * (x / 2) + (x/2)) * 2  ] ]; 
float V = lookupTableV [uvBuffer [  ((y / 2) * (x / 2) + (x/2)) * 2 + 1] ];

Это должно быть что-то вроде

float U = lookupTableU [uvBuffer [ ((y / 2) * (YUV_WIDTH / 2) + (x/2)) * 2  ] ]; 
float V = lookupTableV [uvBuffer [  ((y / 2) * (YUV_WIDTH / 2) + (x/2)) * 2 + 1] ];
person nschmidt    schedule 10.07.2009
comment
спасибо, я пропустил эту ошибку. однако я внес изменения, и отображаемая рамка по-прежнему в основном черно-белая, с розовыми и зелеными оттенками кое-где. - person ReachConnection; 10.07.2009

Картинка выглядит так, как будто у вас формат 4: 1: 1. Вы должны изменить свои строки на

float U = lookupTableU [uvBuffer [ (y * (YUV_WIDTH / 4) + (x/4)) * 2 ] ]
float V = lookupTableU [uvBuffer [ (y * (YUV_WIDTH / 4) + (x/4)) * 2 + 1] ]

Может быть, вы можете опубликовать результат, чтобы увидеть, что еще не так. Мне всегда трудно об этом думать. Намного проще подойти к этому итеративно.

person nschmidt    schedule 10.07.2009