Oracle和MySQL不同编码格式下varchar所能存储的中文数量
理解占用多少字节的关键:明确字符(CHAR)和字节(BYTE)的关系
一个汉字在不同字符编码下所占字节不同:
UTF-8:一个汉字 = 3个字节-1个字符,一个英文 = 1个字节-1个字符
GBK: 一个汉字 = 2个字节-1个字符,一个英文 = 1个字节-1个字符
Oracle
VARCHAR2(100 CHAR)表示100个字符:
- UTF8一个中文占1个字符,所以能存100个汉字
- GBK一个中文占用1个字节,所以能存100个汉字
VARCHAR2(100) 、VARCHAR2(100 BYTE)表示100个字节:
- UTF8一个中文占3个字节,所以能存33个汉字;
- GBK一个中文占用2个字节,所以能存50个汉字
// oracle查询数据库编码格式。
SELECT * FROM v$nls_parameters WHERE PARAMETER='NLS_CHARACTERSET';
select userenv('language') from dual;
// 查看指定字符占用多少长度
select lengthb('默辨xxx') from dual;
MySQL
4.1 及之前早期版本:
VARCHAR(100)表示100个字节。
- UTF8一个中文占3个字节,所以能存33个汉字;
- GBK一个中文占用2个字节,所以能存50个汉字
5.0版本:
VARCHAR(100)表示100个字符。
- UTF8一个中文占1个字符,所以能存100个汉字
- GBK一个中文占用1个字符,所以能存100个汉字