OracleVarchar2长度及PHP长度判断

OStack程序员社区-中国程序员成长平台 › 门户 › 编程› PHP›PHP编程经验

原作者: [db:作者] 来自: [db:来源] 收藏邀请

oracle数据库相信大家都比较熟悉，数据库中有一种非常常用的数据类型：字符串型。

对应该类型，在oracle中有三种比较常用的类型：varchar2(byte)、varchar2(char)、nvarchar2()。

那么这三种类型到底有什么区别呢？

首先，我们要时刻记清：无论是varchar2还是nvarchar2，最大字节数都是4000。

varchar2(byte)：就是默认的表示方式，比如我们写成：varchar2(100)，就相当于varchar2(100 byte)，表示最大字节数是100，该字段最多能容纳100个字节，强调空间大小。由于我们描述的是字节，因此，保存汉字等字符时，就要小心了。如果你的数据库用的是GBK编码，那么一个汉字将占用2个字节，最多能存50个汉字，如果你的数据库用的是UTF8编码，那么一个汉字将占用3个字节，最多能存33个汉字。

varchar2(char)：表示最大字符数是100，该字段最多能容纳100个字符，强调个数。假设我们写成varchar2(100 char)，那么无论是数字、字母、汉字，都看成一个字符，最多写100个，当然，汉字越多，占用的空间越大，同样遵循上边的数据库编码原则。例如：存入一个汉字，底层占2或3个字节，存入一个字母，占1个字节，绝对不是某些文章所说1个字母或数字也占2或3个字节！

nvarchar2()：没有byte、char之分，类似于varchar2(char)，只不过nvarchar2()屏蔽了数据库编码，无论是何种编码，nvarchar2()中一个汉字都占两个字节。

一般的教程，也就到这了，可是如果再多一步思考，会发现一个致命问题。

实际应用中，很可能会出现这种写法：varchar2(1400 char)，我们主观的认为，这个字段最长不能超过1400个字符，这意味着我们可能会存入1399个字符，貌似很正确的样子。

但是，如果这1399个字符都是汉字，字符长度并没有超过1400，看起来一切正常，但实际上我们损失了一部分数据，为什么？

因为1399个汉字，按UTF8编码来说(99%的项目都是UTF8编码吧。。)，需要占用1399*3=4197个字节，而文章开篇就说，无论是什么char，最大长度就是4000字节，一个也不能多，因此多出来的197个字节，都会抹去，而整个过程中，无任何错误提示，你的数据就这样蒸发了！

所以，对于GBK编码的数据库而言，安全的写法为：varchar2(2000 char)、nvarchar2(2000)，对于UTF8编码的数据库而言，安全的写法为：varchar2(1333 char)、nvarchar2(2000)。

PHP

在PHP中，strlen与mb_strlen是求字符串长度的函数，但是对于一些初学者来说，如果不看手册，也许不太清楚其中的区别。
下面通过例子，讲解这两者之间的区别。

先看例子：


<?php  
//测试时文件的编码方式要是UTF8  
$str='中文a字1符';  
echo strlen($str).'<br>';//14  
echo mb_strlen($str,'utf8').'<br>';//6  
echo mb_strlen($str,'gbk').'<br>';//8  
echo mb_strlen($str,'gb2312').'<br>';//10  
?>

结果分析：在strlen计算时，对待一个UTF8的中文字符是3个长度，所以“中文a字1符”长度是3*4+2=14,在mb_strlen计算时，选定内码为UTF8，则会将一个中文字符当作长度1来计算，所以“中文a字1符”长度是6 .

利用这两个函数则可以联合计算出一个中英文混排的串的占位是多少（一个中文字符的占位是2，英文字符是1）

echo (strlen($str) + mb_strlen($str,'UTF8')) / 2;

例如 “中文a字1符” 的strlen($str)值是14，mb_strlen($str)值是6，则可以计算出“中文a字1符”的占位是10.

echo mb_internal_encoding();

PHP内置的字符串长度函数strlen无法正确处理中文字符串，它得到的只是字符串所占的字节数。对于GB2312的中文编码，strlen得到的值是汉字个数的2倍，而对于UTF-8编码的中文，就是3倍的差异了（在 UTF-8编码下，一个汉字占3个字节）。

采用mb_strlen函数可以较好地解决这个问题。mb_strlen的用法和 strlen类似，只不过它有第二个可选参数用于指定字符编码。例如得到UTF-8的字符串$str长度，可以用 mb_strlen($str,'UTF-8')。如果省略第二个参数，则会使用PHP的内部编码。内部编码可以通过 mb_internal_encoding()函数得到。

需要注意的是，mb_strlen并不是PHP核心函数，使用前需要确保在php.ini中加载了php_mbstring.dll，即确保“extension=php_mbstring.dll”这一行存在并且没有被注释掉，否则会出现未定义函数的问题。

鲜花

握手

雷人

路过

鸡蛋

该文章已有0人参与评论

请发表评论

全部评论

专题导读

More+

10-27 六六分期app的软件客服如何联系？(六六分期

11-06 可心卡盟:win10系统火狐flash插件崩溃怎么

11-06 亲亲特价:怎么删除回收站图标

11-06 济南大学虚拟社区:鲁大师节能降温的具体办

11-06 xlueops.exe:无线网络安装向导

11-06 女斗合众国:win7系统cf与主机连接不稳定怎

11-06 0xc000022-[cf烟雾头]cf怎么调烟雾头

11-06 qizideyouhuo:应用程序无法正常启动0xc0000

11-06 ipz-185:win7系统vcf文件怎么打开

11-06 傻哥蹦迪:win10系统s4怎么打开usb调试

11-06 八神浩树gtaste:回收站清空了怎么恢复

11-06 妖尾之黑色守护:win10系统电脑没有1440x900

11-06 校园至尊魔王小说:win7系统浏览网页时字体

11-06 女斗合众国:win10系统访问共享文件夹提示请

11-06 tokyo hot n0654:恢复win7系统默认字体一招

11-06 雨酷仙境:设置win7系统转移临时文件夹腾出

11-06 阿穆纳伊之杖:win7系统开始菜单在右边还原

11-06 tunespotting:win10系统火狐flash插件总是

11-06 甘尔葛分析师：计谋网站seo关键词暴涨有什

11-06 蔡贵霖: 计谋网站seo关键词暴涨有什么秘密

11-06 博益网首页:ao3网页版进入不了解决方法

11-06 漏斗子专栏: 网站数据分析小白易懂精华篇

11-06 见证双虹怎么做:win7系统开启telnet命令的

11-06 颾狐蝶蜋:系统资源不足无法完成请求的服务

11-06 国光中学校歌:提交网站到alexa查询详细步骤

11-06 西安有情天:静态网页和动态网页的区别

11-06 红木雅尚斋:外部链接构造对网站的好处

11-06 前官礼遇：防止域名劫持–增强域安全性的10

11-06 密传二转答案: 中文分词算法有哪些

11-06 金泉家园邮编:百度快照劫持的表现及应对方

http请求详解，防盗链技术_韩顺平PHP视频听课笔记发布时间：2022-07-10

phppearpecl的安装发布时间：2022-07-10

librespeed/speedtest: Self-hosted Speedt

1 CVE-2022-35905

An issue was discovered in Bentley MicroStation before 10.17.0.x and Bentley Vie

阅读：568|2022-07-29

2 oerpub/mathconverter: Converts from Asci

oerpub/mathconverter: Converts from AsciiMath, LaTeX, MathML to LaTeX, MathML

阅读：530|2022-08-12

3 krishnaik06/Machine-Learning-in-90-days

krishnaik06/Machine-Learning-in-90-days

阅读：1119|2022-08-18

4 armancodv/building-energy-model-matlab:

armancodv/building-energy-model-matlab: It is a small software which is develope

阅读：1167|2022-08-17

5 美元符号为什么是“$”

在美元的英文“dollar”里面明明没有字母“s”，为什么美元的符号($)是一条竖线穿过字

阅读：1120|2022-11-06

6 FGRibreau/import-tweets-to-mastodon: How

FGRibreau/import-tweets-to-mastodon: How to import tweets to mastodon (e.g. http

阅读：973|2022-08-17

7 tboronczyk/localization-middleware: PSR-

tboronczyk/localization-middleware: PSR-15 middleware to assist primarily with l

阅读：521|2022-08-16

8 blundell/release-android-library: Remote

blundell/release-android-library: Remote script to create a maven compatible rel

阅读：731|2022-08-15

9 长沙科技学院怎么样?是几本

长沙城南，有一所以“环保”为名的学校，从1979年创立以来，四易归属、五更其名。这

阅读：818|2022-11-06

10 heinrichreimer/material-intro: A simple

heinrichreimer/material-intro: A simple material design app intro with cool anim

阅读：427|2022-08-17

客服电话

电子邮件

OracleVarchar2长度及PHP长度判断

请发表评论

全部评论

上一篇：

下一篇：

dask/dask-ml: Scalable Machine Learning

imujjwalanand/Grokking-the-System-Design

macmade/Hot: Hot is macOS menu bar appli

hche11/Localizing-Visual-Sounds-the-Hard

zortax/MinecraftInjectionAPI: A simple A

librespeed/speedtest: Self-hosted Speedt

avehtari/BDA_m_demos: Bayesian Data Anal

四维彩超怎么看性别？四维看男孩女孩诀窍

CVE-2017-20139

medfreeman/markdown-it-toc-and-anchor: m

万里平台石家庄会场

关于我们

产品与服务

解决方案

139-2527-9053