访问编码后的中文URL返回404错误的解决方法

网络编程 2024/11/20 佚名

3 2 1

昨天做一个项目，其中有一个需求是每一张图片对应一小段文字对图片的说明，普通的做法是新建一个表然后把图片名与说明文字都记录到数据库内。仔细考虑后感觉这个应用不要数据库也能完成，我实现的方案是把说明文字URLENCODE后当做文件名，这样当我读取文件的时候再把文件名URLDECODE就可以后驱图片的文字说明了。

可是通过浏览器访问图片时却提示找不到文件，如有一张图片的说明文字为“琼台博客”，URLENCODE后生成的文件名如下

复制代码代码如下:
%E7%90%BC%E5%8F%B0%E5%8D%9A%E5%AE%A2.jpg

于是我通过浏览器访问图片，提示找不到

仔细看了一下，发现浏览器访问的时候自动把文件名给转回中文了

火狐

chrome

Safari

IE与Safari从地址栏上没有看出转为汉字，但也同样都提示找不到文件。但我感觉应该是它请求的时候也都自动转了，只不过地址栏上的没有显示转换后的。从Nginx的访问记录看访问图片时的请求情况

复制代码代码如下:
192.168.6.30 - - [12/Oct/2012:10:09:44 +0800] "GET /%E7%90%BC%E5%8F%B0%E5%8D%9A%E5%AE%A2.jpg HTTP/1.1" 404 199 "-" "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0)"

请求URL处理没发现什么异常，最后通过反复研究编码后的文件名，发现都是由百分号与字母数字组成，我感觉应该是浏览器在遇到百分号时可能会做些其它转换处理了，所以导致浏览器访问URLENCODE后的文件提示找不到。

于是我把所有URLENCODE后的文件名里的百分号都用下划线替换

复制代码代码如下:
%E7%90%BC%E5%8F%B0%E5%8D%9A%E5%AE%A2.jpg

替换为

复制代码代码如下:
_E7_90_BC_E5_8F_B0_E5_8D_9A_E5_AE_A2.jpg

重新使用浏览器访问，问题解决