• 设为首页
  • 点击收藏
  • 手机版
    手机扫一扫访问
    迪恩网络手机版
  • 关注官方公众号
    微信扫一扫关注
    公众号

我的go练手项目--使用go实现“删除sql里面的注释和字符串”功能 ...

原作者: [db:作者] 来自: [db:来源] 收藏 邀请

项目里面有一个需求,要对sql进行简单的语法分析

为了避免sql里面的字符串和注释对语法分析做干扰,我写了一个java函数,对sql进行修剪,删除里面字符串和注释,用空格代替
周末闲着没事,我用go重新实现了这个功能,感觉应该会有后来人可以用上

说明:
sql里面的注释有两种单行注释和多行注释,其中单行注释以--开头,以\n结尾,多行注释以/开头,以/结尾
sql字符串是以'开头,'结尾,但特别的地方是连续两个单引号是代表一个单引号而不是字符串结束标志

关键函数如下:

`
/**

  • 将字节数组里面注释和字符串,用空格替换 rangeBeg和rangeEnd是数组元素起始位置 左闭右开
    */
    func TrimSqlByteArray(sql []byte, rangeBeg int, rangeEnd int) []byte {
    sqlLength := rangeEnd - rangeBeg - 1;
    //删除注释或者字符串后 用空格填充 必免因删除导致粘连改变sql语义
    const chPad = ' '

    //结果切片,预分配空间为入参sql长度一半
    result := make([] byte, 0, sqlLength / 2)

    //本字符类型
    var charType int = NORMAL;
    for i := rangeBeg; i < rangeEnd; i++ {
    /*
    *utf8编码不影响判断
    //跳过非英文字符
    if sql[i] & 0x80 != 0 {
    //utf8编码:UTF-8是一种变长字节编码方式。对于某一个字符的UTF-8编码,如果只有一个字节则其最高二进制位为0;
    //如果是多字节,其第一个字节从最高位开始,连续的二进制位值为1的个数决定了其编码的位数,其余各字节均以10开头。
    //UTF-8最多可用到6个字节。 这里不考虑异常,因为go的字符串基本都是标准utf8编码
    i += getPreNotZeroCount(sql[i]) - 1
    continue;
    }
    */

      //本字符类型 预设为普通字符
      charType = NORMAL
      ch := sql[i]
    
      //下一个字符
      var chNext byte;
      chNext = getCharSafe(sql, rangeEnd, i + 1)
    
      //非有效sql内容结束位置
      endPos := 0
    
      if ch == '-' && chNext == '-' {
      	//单行注释
      	charType = LINE
      	//下标移到非有效字符的最后
      	endPos = seekToNext(sql, i + 2, rangeEnd, charType)
      } else if ch == '/' && chNext == '*' {
      	//多行注释
      	charType = MULTI
      	//下标移到非有效字符的最后
      	endPos = seekToNext(sql, i + 2, rangeEnd, charType)
      } else if ch == '\'' {
      	//字符串
      	charType = STRING
      	//下标移到非有效字符的最后
      	endPos = seekToNext(sql, i + 1, rangeEnd, charType)
      }
    
      //如果字符是非有效字符 则用空格代替 否则保持原样
      if charType == NORMAL {
      	result = append(result, ch)
      } else {
      	result = append(result, chPad)
      	i = endPos - 1
      }
    

    }

    return result;
    }

/**

  • 获取字符串或者注释的右边界位置(不包含)

  • rangeEnd是数组边界
    */
    func seekToNext(sql []byte, begPos int, rangeEnd int, charType int) int {

    result := begPos;

    switch charType {
    case MULTI:
    for ; result < rangeEnd; result++ {
    ch := sql[result]
    chNext := getCharSafe(sql, rangeEnd, result+ 1)

      	if ch == '*' && chNext == '/' {
      		result = result + 1;
      		break;
      	}
      }
    
      break
    

    case LINE:
    for ; result < rangeEnd; result++ {
    ch := sql[result]

      	if ch == '\n' {
      		break;
      	}
      }
    
      break
    

    case STRING:
    for ; result < rangeEnd; result++ {
    ch := sql[result]
    chNext := getCharSafe(sql, rangeEnd, result + 1)

      	//sql字符串里面连续的单引号被认为是' 则不是字符串结束标志
      	if ch == '\'' && chNext == '\'' {
      		result = result + 1;
      		continue;
      	} else if ch == '\'' {
      		break;
      	}
      }
    
      break
    

    default:
    break;
    }

    result++;

    return result;
    }
    `

完整代码及单元测试已上传 https://github.com/kingstarer/kingstarer.git


鲜花

握手

雷人

路过

鸡蛋
该文章已有0人参与评论

请发表评论

全部评论

专题导读
上一篇:
Go package(1) time 用法发布时间:2022-07-10
下一篇:
https://github.com/avelino/awesome-go清单发布时间:2022-07-10
热门推荐
热门话题
阅读排行榜

扫描微信二维码

查看手机版网站

随时了解更新最新资讯

139-2527-9053

在线客服(服务时间 9:00~18:00)

在线QQ客服
地址:深圳市南山区西丽大学城创智工业园
电邮:jeky_zhao#qq.com
移动电话:139-2527-9053

Powered by 互联科技 X3.4© 2001-2213 极客世界.|Sitemap