В чем разница между char, nchar, varchar и nvarchar в SQL Server?

Что подразумевается под nvarchar?

В чем разница между char, nchar, varchar и nvarchar в SQL Server?


person MrDatabase    schedule 06.10.2008    source источник


Ответы (12)


Просто чтобы прояснить ... или подвести итог ...

  • nchar и nvarchar могут хранить символы Unicode.
  • char и varchar не могут хранить символы Unicode.
  • char и nchar имеют фиксированную длину, что позволяет зарезервировать место для хранения для указанного вами количества символов, даже если вы не Я не использую все это пространство.
  • varchar и nvarchar имеют переменную длину, поэтому в них используются только пробелы для хранимых вами символов. Он не резервирует хранилище, например char или nchar.

nchar и nvarchar будут занимать вдвое больше места для хранения, поэтому может быть разумно использовать их только в том случае, если вам нужна поддержка Unicode.

person Brian Kim    schedule 06.10.2008
comment
char и varchar не предназначены для хранения Unicode, но с некоторыми дополнительными приемами кодирования и дополнительной логикой вы все равно можете неправильно использовать поле [var] char для хранения Unicode. - person Wim ten Brink; 02.11.2009
comment
Это зависит от сортировки, занимают ли версии n... в два раза больше места для хранения , как показывает мой ответ - person Martin Smith; 24.11.2011
comment
В чем преимущество резервирования хранилища? - person mlissner; 20.02.2013
comment
По последнему пункту: использование Unicode nchar и nvarchar в большинстве случаев по-прежнему лучше, лучшая сортировка, гибкость для пользователей, устраняет будущие проблемы совместимости. И, кстати, место для хранения не является проблемой в этом случае, так как использование сортировки без Unicode доставляет много хлопот, и скорость памяти будет продолжать уменьшаться в будущем. - person Jaison Varghese; 25.05.2013
comment
На самом деле ни char / varchar, ни nchar / nvarchar не могут хранить полный диапазон символов Unicode, поэтому неверно говорить, что один может хранить символы Unicode, а другой - нет. Фиксированная двухбайтовая кодировка на символ (SQL Server использует такую ​​кодировку, называемую UCS-2 для nchar и nvarchar) недостаточно велика, чтобы покрыть весь диапазон Unicode. См. Мой ответ для более подробной информации. - person PeterAllenWebb; 27.06.2013
comment
Однако для [n] varchar вы можете хранить строки фиксированной длины, если хотите, например, varchar (20). В чем разница между char (20) и varchar (20)? - person Ben Caine; 20.06.2014
comment
@BenCaine char (20) будет использовать 20 байтов (при условии 8-битной сортировки); varchar (20) будет использовать len (data) +2 байта, то есть 22 для 20 байтов данных, но только 12 для 10 байтов данных. Дополнительные два байта - это записи о длине. Если ваши данные всегда будут полной длины, используйте char, так как это экономит место и может быть быстрее. Пожалуйста, никогда не используйте varchar (1) или что-то меньшее, чем varchar (4). Один символ в формате varchar использует три байта, поэтому char (3) никогда не будет занимать больше места, чем varchar (3). - person Richard Gadsden; 03.07.2014
comment
@RichardGadsden Разве пустая строка varchar (3) не займет меньше места, чем пустая строка char (3)? 2 байта против 3 байта? - person andrewb; 23.09.2014
comment
@andrewb технически, но чаще у вас будет ноль, который в любом случае не является байтами. - person Richard Gadsden; 23.09.2014
comment
Единственный другой случай, который я хотел бы здесь сделать, это то, что при попытке перенести данные из программы (например, веб-API asp.net) на SQL-сервер, и у вас есть столбец, установленный для char, он позволит вам обновить или вставить любой текущий тип в него. Это неверно или все еще можно сказать, приведите строку к char. Пример: поле StateAbbrv char (2) на сервере и public string StateAbbrv {get;set;} в приложении. - person Edward; 22.03.2017

Все ответы на данный момент указывают, что varchar - однобайтный, nvarchar - двухбайтный. Первая часть этого на самом деле зависит от сопоставления, как показано ниже.

DECLARE @T TABLE
(
C1 VARCHAR(20) COLLATE Chinese_Traditional_Stroke_Order_100_CS_AS_KS_WS,
C2 NVARCHAR(20)COLLATE  Chinese_Traditional_Stroke_Order_100_CS_AS_KS_WS
)

INSERT INTO @T 
    VALUES (N'中华人民共和国',N'中华人民共和国'),
           (N'abc',N'abc');

SELECT C1,
       C2,
       LEN(C1)        AS [LEN(C1)],
       DATALENGTH(C1) AS [DATALENGTH(C1)],
       LEN(C2)        AS [LEN(C2)],
       DATALENGTH(C2) AS [DATALENGTH(C2)]
FROM   @T  

Возврат

введите описание изображения здесь

Обратите внимание, что символы и все еще не были представлены в версии VARCHAR и были незаметно заменены на ?.

На самом деле все еще нет китайских иероглифов, которые можно было бы представить одним байтом в этом сопоставлении. Единственные однобайтовые символы - это типичный западный набор ASCII.

Из-за этого возможна вставка из столбца nvarchar(X) в столбец varchar(X) сбой с ошибкой усечения (где X обозначает число, одинаковое в обоих случаях).

SQL Server 2012 добавляет параметры сортировки SC (дополнительные символы), которые поддерживают UTF-16. В этих сопоставлениях один символ nvarchar может занимать 2 или 4 байта.

person Martin Smith    schedule 23.11.2011
comment
Ответ, который я искал. Также, чтобы сэкономить время для таких, как я - неанглийский текст переводится как Китайская Народная Республика translate.google.com/#auto/ ru / - person Igand; 14.03.2018

nchar и char почти так же работают друг с другом, как nvarchar и varchar. Единственное различие между ними заключается в том, что nchar / nvarchar хранят символы Unicode (что необходимо, если вам требуется использование расширенных наборов символов), а varchar - нет.

Поскольку для символов Юникода требуется больше места для хранения, поля nchar / nvarchar занимают вдвое больше места (так, например, в более ранних версиях SQL Server максимальный размер поля nvarchar составляет 4000).

Этот вопрос дублирует этот.

person Luke Bennett    schedule 06.10.2008
comment
Вы забываете одну вещь: nchar использует фиксированную длину, поэтому nchar (10) всегда должен получать десять символов. И varchar (10) действительно является Unicode и принимает любое количество символов, до 10 символов. См. Также msdn.microsoft.com/en-us/library/ms186939.aspx < / а> - person Wim ten Brink; 02.11.2009

Просто чтобы добавить что-то еще: nchar - добавляет конечные пробелы к данным. nvarchar - не добавляет конечные пробелы к данным.

Итак, если вы собираетесь фильтровать свой набор данных по полю nchar, вы можете использовать RTRIM для удаления пробелов. Например. В поле nchar (10) с именем BRAND хранится слово NIKE. Он добавляет 6 пробелов справа от слова. Итак, при фильтрации выражение должно выглядеть так: RTRIM (Fields! BRAND.Value) = "NIKE"

Надеюсь, это поможет кому-то там, потому что я только что немного боролся с этим!

person Dimuthu    schedule 21.07.2011
comment
каждая опция добавляет конечное пространство в моем SQL Server ...: / - person Gustavo Contreiras; 01.09.2020

Моя попытка обобщить и исправить существующие ответы:

Во-первых, char и nchar всегда будут использовать фиксированный объем дискового пространства, даже если строка, которую нужно сохранить, меньше доступного пространства, тогда как varchar и nvarchar будут использовать только столько дискового пространства, сколько необходимо для хранения этой строки (плюс два байтов накладных расходов, предположительно для хранения длины строки). Так что помните, что «var» означает «переменная», как в пространстве переменных.

Второй важный момент, который необходимо понять, заключается в том, что nchar и nvarchar хранят строки с использованием ровно двух байтов на символ, тогда как char и varchar используют кодировку, определяемую кодовой страницей сопоставления, которая обычно должно быть ровно один байт на символ (хотя есть исключения, см. ниже). Используя два байта на символ, можно сохранить очень широкий диапазон символов, поэтому важно помнить, что nchar и nvarchar, как правило, являются гораздо лучшим выбором, когда вам нужна поддержка интернационализации, что вы, вероятно, сделаете.

Теперь о некоторых тонкостях.

Во-первых, столбцы nchar и nvarchar всегда хранят данные с использованием UCS-2. Это означает, что будет использоваться ровно два байта на символ, и любой символ Unicode в базовой многоязычной плоскости (BMP) может храниться в поле nchar или nvarchar. Однако нельзя сохранить любой символ Unicode. Например, согласно Википедии, кодовые точки египетских иероглифов находятся за пределами BMP. Следовательно, есть строки Unicode, которые могут быть представлены в UTF-8 и других истинных кодировках Unicode, которые не могут быть сохранены в поле SQL Server nchar или nvarchar, и среди них будут строки, написанные египетскими иероглифами. К счастью, ваши пользователи, вероятно, не пишут в этом сценарии, но об этом следует помнить!

Другой сбивающий с толку, но интересный момент, который подчеркнули другие плакаты, заключается в том, что поля char и varchar могут использовать два байта на символ для определенных символов, если этого требует кодовая страница сопоставления. (Мартин Смит приводит отличный пример, в котором он показывает, как Chinese_Traditional_Stroke_Order_100_CS_AS_KS_WS демонстрирует такое поведение. Проверьте это.)

ОБНОВЛЕНИЕ. Начиная с SQL Server 2012, наконец, появились кодовые страницы для UTF -16, например Latin1_General_100_CI_AS_SC, который действительно может охватывать весь диапазон Unicode.

person PeterAllenWebb    schedule 27.06.2013

  • char: символьные данные фиксированной длины с максимальной длиной 8000 символов.
  • nchar: данные Unicode фиксированной длины с максимальной длиной 4000 символов.
  • Char = длина 8 бит
  • NChar = длина 16 бит
person ss.    schedule 02.11.2009
comment
char не может иметь длину 8 бит. Он не должен хранить длину, и фиксированная длина может составлять до 8000 символов. - person John B. Lambe; 16.07.2019

nchar[(n)] (национальный символ)

  • Строковые данные в формате Unicode фиксированной длины.
  • n определяет длину строки и должно быть значением от 1 до 4 000.
  • Размер хранилища составляет два n байта.

nvarchar [(n | max)] (различаются национальные символы).

  • Строковые данные в формате Unicode переменной длины.
  • n определяет длину строки и может принимать значения от 1 до 4000.
  • max указывает, что максимальный размер хранилища составляет 2 ^ 31–1 байт (2 ГБ).
  • Размер хранилища в байтах в два раза превышает фактическую длину введенных данных + 2 байта.

char [(n)] (символ)

  • non-Unicode строковые данные фиксированной длины.
  • n определяет длину строки и должно быть от 1 до 8000.
  • Размер хранилища составляет n байт.

varchar [(n | max)] (меняются символы)

  • Строковые данные переменной длины не в Юникоде.
  • n определяет длину строки и может принимать значения от 1 до 8000.
  • max указывает, что максимальный размер хранилища составляет 2 ^ 31–1 байт (2 ГБ).
  • Размер хранилища - это фактическая длина введенных данных + 2 байта.
person Rasel    schedule 10.02.2015

nchar (10) - это строка Unicode фиксированной длины длиной 10. nvarchar (10) - строка Unicode переменной длины с максимальной длиной 10. Как правило, вы должны использовать первую строку, если все значения данных составляют 10 символов, а последнюю. если длина различается.

person Jason Kresowaty    schedule 06.10.2008
comment
Неправильное сравнение - вопрос касается nchar и varchar, а не nchar и nvarchar. - person Luke Bennett; 07.10.2008

Различия:

  1. n [var] char хранит Unicode, а [var] char хранит только однобайтовые символы.
  2. [n] char требует фиксированного количества символов точной длины, в то время как [n] varchar принимает переменное количество символов до определенной длины включительно.

Еще одно отличие - длина. И nchar, и nvarchar могут иметь длину до 4000 символов. И char и varchar могут иметь длину до 8000 символов. Но для SQL Server вы также можете использовать [n] varchar (max), который может обрабатывать до 2 147 483 648 символов. (Два гигабайта, 4-байтовое целое число со знаком.)

person Wim ten Brink    schedule 02.11.2009

nchar требуется больше места, чем nvarchar.

например,

Nchar (100) всегда будет хранить 100 символов, даже если вы введете только 5, оставшиеся 95 символов будут заполнены пробелами. Сохранение 5 символов в nvarchar (100) сэкономит 5 символов.

person Community    schedule 18.11.2008
comment
Не совсем так, поскольку вам необходимо заполнить char (100) до 100 символов. Вы можете использовать это, когда, например, храните телефонные номера в своей базе данных или номера заказов фиксированной длины. Поскольку длина поля фиксирована, у вас нет выбора, чтобы заполнить его до максимального количества символов. Но когда все ваши данные составляют 100 символов на запись, char (100) будет занимать меньше места, чем varchar (100), потому что ему не требуется указание длины: каждое значение будет ровно 100 символов. - person Wim ten Brink; 02.11.2009

  • nchar имеет фиксированную длину и может содержать символы Юникода. он использует два байта памяти для каждого символа.

  • varchar имеет переменную длину и не может содержать символы Юникода. он использует один байт для хранения каждого символа.

person Manu    schedule 06.10.2008
comment
Неправильный. Юникод может использовать от 1 до 4 байтов (как правило) для каждого символа. Кроме того, varchar может содержать юникод, но он не распознается как юникод. В результате varchar считается ненадежным для хранения в Юникоде. (Тем более, что есть риск, что код, обращающийся к полю, переведет его неправильно.) - person Wim ten Brink; 02.11.2009
comment
@Alex: Думаю, вы высказали свою точку зрения, но я все еще не согласен с вами. Вы говорите, что int МОЖЕТ содержать long, если long оказывается меньше 2 ^ 32. Это не только «ненадежно», это внутреннее ограничение, которое делает невозможным охват всего диапазона значений. - person Manu; 05.11.2009
comment
@ Мастерская Алекс: Неправильно. Юникод, закодированный как UCS-2 (который является кодировкой, используемой SQL Server), хранит каждый символ в ровно двух байтах, см. msdn.microsoft.com/en-us/library/bb330962%28v=sql.90%29.aspx: SQL Server stores Unicode in the UCS-2 encoding scheme... UCS-2 is a fixed-length encoding that represents all characters as a 16-bit value (2 bytes). SQL Server 2008 может использовать сжатие SCSU, но по-прежнему используется сжатие строк Unicode в кодировке UCS-2: msdn.microsoft.com/en-us/library/ee240835.aspx - person Remus Rusanu; 18.12.2010

NVARCHAR может хранить символы Юникода и занимает 2 байта на символ.

person Gustavo Rubio    schedule 06.10.2008
comment
НЕПРАВИЛЬНЫЙ! Unicode использует от 1 до 4 байтов на символ! Многие об этом забывают! Даже использование UTF-16 может привести к тому, что некоторые символы будут занимать 4 байта вместо 2, хотя общая длина будет 2 байта. Некоторые другие подформаты Unicode могут занимать даже более 4 байтов! - person Wim ten Brink; 02.11.2009
comment
@WimtenBrink - речь идет о SQL Server, а nvarchar всегда занимает 2 байта на символ. - person Martin Smith; 24.11.2011
comment
@Wim, вы правы, есть несколько кодировок Unicode, которые могут выдавать разное количество байтов. Но SQL Server не дает вам выбора в отношении кодировки Unicode. SQL Server до 2012 года использовал только UCS-2 шириной два байта, поэтому Мартин был прав в момент написания ответа. Как уже говорилось в других ответах выше, SQL Server 2012 теперь предоставляет UTF-16, поэтому два байта для многих символов (те, которые находятся в базовой многоязычной плоскости Unicode), четыре байта для других. - person Concrete Gannet; 07.02.2014