Индексирование текстовых документов службой поиска Azure

В документации Azure предлагается использовать большие двоичные объекты, чтобы иметь возможность индексировать такие документы, как MS Word, PDF и т. Д. У нас есть база данных Azure SQL Server, содержащая тысячи документов, хранящихся в поле таблицы nvarchar (MAX). Содержание каждой записи в базе данных представлено простым английским текстом. Фактически приложение конвертировало PDF / MS Word в простой текст и сохраняло его в базе данных.

У меня вопрос: можно ли индексировать хранимые «документы» в базе данных так же, как это делает Azure для больших двоичных объектов? Я знаю, как создать индексатор SQL Azure, но я хотел бы убедиться, что способ выполнения нижнего поиска для больших двоичных объектов будет таким же для документов, хранящихся в таблице базы данных.

Заранее спасибо!

Arash 06.08.2016 источник

comment

Просто любопытно - если вы храните документы PDF и Word в столбце с типом данных nvarchar (MAX), учитывая, что формат является двоичным, сохраняемое содержимое не является простым текстом. Правильно ли я понимаю? - Gaurav Mantri 06.08.2016

comment

@GauravMantri Извините за путаницу. Я отредактировал вопрос, чтобы он был в правильном направлении. - Arash 06.08.2016

Ответы (1)

arrow_upward
1
arrow_downward

В настоящее время это невозможно - извлечение документов может выполняться только для больших двоичных объектов, хранящихся в хранилище Azure.

Eugene Shvets 06.08.2016

Индексирование текстовых документов службой поиска Azure

Ответы (1)

Вопросы по теме