Текстовое исключение неподдерживаемого документа

Я пытаюсь использовать boto3 для запуска запроса texttractDetect_document_text.

Я использую следующий код:

client = boto3.client('textract')
response = client.detect_document_text(
             Document={
            'Bytes': image_b64['document_b64']
        }
      )

Где image_b64['document_b64'] — код изображения base64, который я преобразовал, например, с помощью https://base64.guru/converter/encode/image.

Но я получаю следующую ошибку:

UnsupportedDocumentException

Что я делаю неправильно?

Gabriel Marcondes 30.06.2020 источник

Ответы (2)

arrow_upward
0
arrow_downward

По документу:

Если вы используете AWS SDK для вызова Amazon Textract, вам может не понадобиться кодировать base64 байты изображения, передаваемые с помощью поля Bytes.

Кодировка Base64 требуется только при прямом вызове REST API. При использовании Python или NodeJS SDK используйте собственные байты (двоичные байты).

theaws.blog 09.07.2020

arrow_upward
0
arrow_downward

Для дальнейшего использования я решил эту проблему, используя:

client = boto3.client('textract')
image_64_decode = base64.b64decode(image_b64['document_b64']) 
bytes = bytearray(image_64_decode)
response = client.detect_document_text(
    Document={
        'Bytes': bytes
    }
)

Gabriel Marcondes 23.08.2020

Текстовое исключение неподдерживаемого документа

Ответы (2)

Вопросы по теме