淘宝网的搜索关键字的编码与解码

淘宝网的搜索关键字的编码与解码-Java-JavaEye论坛很久之前发现淘宝网的搜索关键字在编码后有点可爱,小写英文字母+数字的组合。想去研究一下,但是后面好像没了回事似的。。记性不好然后这两天不知道为什么,突然间抽起条脑筋,跑去研究。。。。--------------------------开始分割线--------------------------在淘宝网上用关键字“gembler”搜索一下商品,得出以下URL:(留意上面这里:“m5sw2ytmmvza”)经过一轮天昏地暗、沙尘滚滚的分析、研究之后,得出以下结论:在Base64中,码表是由[A-Z,a-z,0-9,+,/,=(pad)]组成的。然后自己也弄个码表,由[a-z,2-7(这个2-7是在淘宝网上搜索了n次而得出的结论-------------------------------愚蠢分割线---------------------------------1819202122232425262728293031在Base64中,是将二进制连成一串,然后再按6位来分割,分割完后在前面补0,这个地球人都知道,不多说了。而我呢,哈哈,捣蛋一下,按5位来分割,如果刚好够分,那就爽了,但是,世事往往不如人意,位数不够,那咋办呢?看下面:)在Base64中,是用"="来解决的吧。现在呢,就是在前面补0,然后在后面再补0,其实就是前后补0,但是,按5位来分割,前面3个0是补定的了,后面的0就看上帝怎么安排了。举个小例子:字符串"aaa",(编码/加密)后是"mfqwc"转换后:二进制:0000110000000101000100000001011000000010去掉前3个0后:0110000101100001011000010合并后:0110000101100001011000010多了就算了,不要了(其实是在{编码/加密}的分割时候,在分剩的余数的后面补的0)。然后再将byte[]转回字符串OK!又见回"aaa"了。:)*有一点值得注意的是:UTF-8、GBK、GB18030一般都没什么问题,但是GB2312可能字符集不够丰富,繁体字在decode的时候成问号了。搞了半天,“可视化编辑器”的JavaCode不好使,骨干代码在回帖里贴出................(完整的代码,有兴趣的同志们请见附件!)--------------------------结束分割线--------------------------。。。整理好了,整个人都铺满了灰尘.......PS:不知道淘宝网的思路是不是这样声明:JavaEye文章版权属于作者,受法律保护。没有作者书面许可不得转载。贴上部分代码片段编码:privatestaticStringencode(byte[]keyBytes){if(keyBytes==null||keyBytes.length<1){}*00101010110100110010110110100011*00101010110100110010110110100011StringBuildermergrd=newStringBuilder();for(inti=0;i<keyBytes.length;i++){FormatUtil.formatBinary(keyBytes[i],mergrd);}*00101010110100110010110110100011*00101010110100110010110110100011*|*(这个11为余下的位)intgroupCount=mergrd.length()/FIVE_BIT;intlastCount=mergrd.length()%FIVE_BIT;}StringBuildersbEncoded=newStringBuilder();intforMax=groupCount*FIVE_BIT;for(inti=0;i<forMax;i+=FIVE_BIT){*如果结束点比已合并的二进制码串的长度要大,if(end>mergrd.length()){*如果结束点比已合并的二进制码串的长度要大,*已合并的二进制码串的长度,等价于(i+lastCount).并且重设标记。end=(i+lastCount);}StringstrFiveBit=mergrd.substring(i,end);intintFiveBit=Integer.parseInt(strFiveBit,BINARY);*如果结束点比已合并的二进制码串的长度要大,*需要左移操作,假设余下的二进制位为:11,*那么需要从后面补0,左移操作后为(000)11(000)intFiveBit<<=(FIVE_BIT-lastCount);}sbEncoded.append(CODEC_TABLE.charAt(intFiveBit));}returnsbEncoded.toString();}解码:publicstaticStringdecode(Stringcode,StringcharacterSet){if(code==null||code.length()<1){}StringBuildersbBinarys=newStringBuilder();for(inti=0;i<code.length();i++){intindex=getCodecTableIndex(code.charAt(i));StringindexBinary=Integer.toBinaryString(index);FormatUtil.formatBinary(indexBinary,sbBinarys,FIVE_BIT);}*扔掉的余数是在(编码/加密)的分割时候,在分剩的余数的后面补的0byte[]binarys=newbyte[sbBinarys.length()/EIGHT_BIT];for(inti=0,j=0;i<binarys.length;i++){Strings...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

笔杆子文秘
机构认证
内容提供者

为您提供优质文档,供您参考!

确认删除?