原来还有这么有趣的故事
标 题: [IAQ] C/C++ 中的 Trigraph
发信站: 水木社区 (Tue Apr 17 20:10:15 2007), 站内
[Note: IAQ 的意思是 Infrequently Answered Questions. — end note]
C/C++ 为了照顾老一辈无产阶级革命家,
他们的条件极其艰苦,
键盘上缺了很多键,
无法输入下面九个字符:
# \ ^ [ ] { } | ~
因此推出了 trigraph,
简单的讲就是把上面的每个字符用其他三个字符来代替,
替换的规则如下:
#: ??=
\: ??/
^: ??’
[: ??(
]: ??)
{: ??<
}: ??>
|: ??!
~: ??-
比如说,下面这个 C++ 程序:
#include <iostream>
int main() {
std::cout << “[]” << std::endl;
}
可以改写成这样:
??=include <iostream>
int main() ??<
std::cout << “??(??)” << std::endl;
??>
将 trigraph 替换成对应的字符发生在预处理之前,
因此 trigraph 可以在源码中的任何位置都可以用,
包括字符串内,函数体开头,预处理指令等。
有人说,如果那我就是用一个字符串常量,其中包含了 “??=” 怎么办?
比如说就是要打印两个问号接一个等号,怎么办?
很简单,把它拆开写, 为了打印出 “??=”,我们把它拆成 “??” “=” 即可,
因为 C/C++ 在处理字符串字面值的时候,会把相邻的多个字符串字面值合并成一个,
而这个合并操作发生在 trigraph 替换之后,
下面的程序就可以正确的打印出两个问号和一个等号:
#include <iostream>
int main() {
std::cout << “??” “=” << std::endl;
}
实测中,
VC 8 不给任何提示将 trigraph 替换成对应字符,
GCC 4.0.3 则要求加上编译参数 -trigraphs 才会做相应转换。
虽然 GCC 的做法是不符合标准的,但是更加安全。
更详细的情况可以参考标准 2.3。