Индексирование текстовых документов службой поиска Azure

В документации Azure предлагается использовать большие двоичные объекты, чтобы иметь возможность индексировать такие документы, как MS Word, PDF и т. Д. У нас есть база данных Azure SQL Server, содержащая тысячи документов, хранящихся в поле таблицы nvarchar (MAX). Содержание каждой записи в базе данных представлено простым английским текстом. Фактически приложение конвертировало PDF / MS Word в простой текст и сохраняло его в базе данных.

У меня вопрос: можно ли индексировать хранимые «документы» в базе данных так же, как это делает Azure для больших двоичных объектов? Я знаю, как создать индексатор SQL Azure, но я хотел бы убедиться, что способ выполнения нижнего поиска для больших двоичных объектов будет таким же для документов, хранящихся в таблице базы данных.

Заранее спасибо!


person Arash    schedule 06.08.2016    source источник
comment
Просто любопытно - если вы храните документы PDF и Word в столбце с типом данных nvarchar (MAX), учитывая, что формат является двоичным, сохраняемое содержимое не является простым текстом. Правильно ли я понимаю?   -  person Gaurav Mantri    schedule 06.08.2016
comment
@GauravMantri Извините за путаницу. Я отредактировал вопрос, чтобы он был в правильном направлении.   -  person Arash    schedule 06.08.2016


Ответы (1)


В настоящее время это невозможно - извлечение документов может выполняться только для больших двоичных объектов, хранящихся в хранилище Azure.

person Eugene Shvets    schedule 06.08.2016