Oracle和MySQL不同编码格式下varchar所能存储的中文数量

理解占用多少字节的关键:明确字符(CHAR)和字节(BYTE)的关系

一个汉字在不同字符编码下所占字节不同:

UTF-8:一个汉字 = 3个字节-1个字符,一个英文 = 1个字节-1个字符

GBK: 一个汉字 = 2个字节-1个字符,一个英文 = 1个字节-1个字符



Oracle

VARCHAR2(100 CHAR)表示100个字符

  • UTF8一个中文占1个字符,所以能存100个汉字
  • GBK一个中文占用1个字节,所以能存100个汉字

VARCHAR2(100) 、VARCHAR2(100 BYTE)表示100个字节

  • UTF8一个中文占3个字节,所以能存33个汉字;
  • GBK一个中文占用2个字节,所以能存50个汉字
// oracle查询数据库编码格式。
SELECT * FROM v$nls_parameters WHERE PARAMETER='NLS_CHARACTERSET';
select userenv('language') from dual;

// 查看指定字符占用多少长度
select  lengthb('默辨xxx') from dual;



MySQL

4.1 及之前早期版本:

VARCHAR(100)表示100个字节

  • UTF8一个中文占3个字节,所以能存33个汉字;
  • GBK一个中文占用2个字节,所以能存50个汉字

5.0版本:

VARCHAR(100)表示100个字符

  • UTF8一个中文占1个字符,所以能存100个汉字
  • GBK一个中文占用1个字符,所以能存100个汉字