空格变成问号

nercon

2020-03-06

全角空格导入数据库后变成问号，是因为插入的字符的类型和字段的类型不匹配造成的。

可以修改字段类型text改为ntext。

2.在插入数据库之前进行转换

byte[] space = new byte[]{0xc2,0xa0};
string UTFSpace = Encoding.GetEncoding("UTF-8").GetString(space);
HtmlStr = HtmlStr.Replace(UTFSpace," ");

用 HtmlDecode（）去解码后，“ ”不是被解码为半角的空格（ASCII码0x20）而是变成半角问号“?”（ASCII码0x3F）。而且奇怪的是，只有每行前面的空格才会出问题，如果前面后面有汉字的话，空格就还是空格。但是更加奇怪的是，如果直接在HtmlDecode()的后面直接加上trim()的话，这个问号会被去掉。而正常的情况下，问号是不会被去掉的，只有空格才会被去掉。

发生这个问题的时候，我是在把解码后的内容写入数据库，因此一直都以为是sqlserver与应用程序之间的字符集问题或者编码方式问题。搞了N久，最后才发现在送进SqlServer之前，内容就已经是问号了。

查了很久，也找不到这个问题如何解决。因此，只能使用山寨解决方法了：

1、在Decode之前替换为空格。

2、在Decode之后直接加 Trim()

显而易见的，这个不是一个好办法：在显示到浏览器的时候，空格就不见了

最近认真去查了一下这个问题，发现问题的关键，是编码方式：如果使用的Encoding是UTF-8的话，就会发生这种情况。

问题的根源，在于UTF-8这种编码里面，存在一个特殊的字符，其编码是“0xC2 0xA0”，转换成字符的时候，表现为一个空格，跟一般的半角空格（ASCII 0x20）一样，唯一的不同是它的宽度不会被压缩，因此比较多的被用于网页排版（如首行缩进之类）。而其他的编码方式如GB2312、Unicode之类并没有这样的字符，因此如果简单地进行编码转换，生成地GB2312/Unocode字符串中，这个字符就会被替换成为问号（ASCII ox3F）。此时如果进行写库、写文件之类，就会把问号直接写入了。当然此时会有一种山寨方式：直接替换问号为空格。可是这种方法，会把原本真正的问号也枪毙掉。

使用UTF-8进行HTMLDecode的时候，对于语句开头的（），就会被自动转换成为这个特殊的空格，可能是判断为放在开头的空格，一定是用来排版的。在转换为其他编码之前，这个特殊的空格受到的待遇与普通的半角空格是一致的，甚至也会被trim()去掉。

因此，碰到这个问题的原因有两种：一种是在UTF-8编码下进行了转换，产生了这个字符；还有一种就是网页中直接采用了这个字符进行排版。

知道了具体原因，就有正规的解决方法了。方法就是：在得到UTF-8字符串之后，先进行一个替换，把这个特殊的空格替换为普通的空格，如果是HTML串，建议替换为（）。C#代码如下：

byte[] space = new byte[]{0xc2,0xa0};
string UTFSpace = Encoding.GetEncoding("UTF-8").GetString(space);
HtmlStr = HtmlStr.Replace(UTFSpace," ");
这样做，就不会把串里面本来应该有的问号错误的替换为空格。也不会看到讨厌的问号，能保存原来字符串的真面目了。
需要强调的是，替换之前不能进行编码转换，一定要继续使用UTF-8编码。如果已经转换成其他编码，那么错误就已经不可逆转了。没有办法再区分这个错误的问号和正常的问号之间的差别了。

html空格字符

安科网

空格变成问号

nercon

nercon

相关推荐

[转]HTML空格转义字符

VBA Trim CleanString 删除空白（空格）字符

demo13-空格标签

HTML空白汉字占位符&#12288;

HTML的学习

HTML常用转义符号+ISO Latin-1字符集大全

textarea中输入多个空格或者换行时只显示一个空格的解决办法

table 表头永远置顶

HTML中的& nbsp; & ensp; & emsp;等6种空格标记

HTML中空格的实现方法详解

由一个项目需求引发的 - textarea中的换行和空格

html格式标签

JSP输出HTML时产生的大量空格和换行的去除方法

css 中点,井号,逗号,空格,冒号用法

JS去除字符串的空格和html标记

关于textarea自动生成N多空格的问题

javascript去除前后空格的正则方法

你会用JS动态给html添加空格吗？我教你~

js中的正则

人民币符号在html的显示方法

nercon