|
windows开发环境下用VC++6.0 对unicode 、utf-8、 gb2312 三种编码格式之间的转换方法: #include <iostream> #include <string> #include <Windows.h> using namespace std;
void unicodeToUTF8(const wstring &src, string& result) { int n = WideCharToMultiByte( CP_UTF8, 0, src.c_str(), -1, 0, 0, 0, 0 ); result.resize(n); ::WideCharToMultiByte( CP_UTF8, 0, src.c_str(), -1, (char*)result.c_str(), result.length(), 0, 0 ); }
void unicodeToGB2312(const wstring& wstr , string& result) { int n = WideCharToMultiByte( CP_ACP, 0, wstr.c_str(), -1, 0, 0, 0, 0 ); result.resize(n); ::WideCharToMultiByte(CP_ACP, 0, wstr.c_str(), -1, (char*)result.c_str(), n, 0, 0 ); }
void utf8ToUnicode(const string& src, wstring& result) { int n = MultiByteToWideChar( CP_UTF8, 0, src.c_str(), -1, NULL, 0 ); result.resize(n); ::MultiByteToWideChar( CP_UTF8, 0, src.c_str(), -1, (LPWSTR)result.c_str(), result.length()); }
void gb2312ToUnicode(const string& src, wstring& result) { int n = MultiByteToWideChar( CP_ACP, 0, src.c_str(), -1, NULL, 0 ); result.resize(n); ::MultiByteToWideChar( CP_ACP, 0, src.c_str(), -1, (LPWSTR)result.c_str(), result.length()); }
void printByte(string str) { int i=0; for (i=0; i<str.length(); i++) { printf("%X ",(unsigned char)str.at(i)); } printf("\n"); }
void wprintByte(wstring str) { int i=0; for (i=0; i<str.length()*sizeof(wchar_t); i++) { printf("%X ",*((unsigned char*)str.c_str()+i)); } printf("\n"); }
int main() { string strText = "AB汉字"; string strUTF8; wstring wstrUnicode; string strGB2312;
gb2312ToUnicode(strText, wstrUnicode); printf("Unicode="); wprintByte(wstrUnicode);
unicodeToUTF8(wstrUnicode, strUTF8); printf("UTF-8 ="); printByte(strUTF8); utf8ToUnicode(strUTF8,wstrUnicode); printf("Unicode="); wprintByte(wstrUnicode); unicodeToGB2312(wstrUnicode,strGB2312); printf("GB2312 ="); printByte(strGB2312);
return 0; }
这里用“AB汉字”这样一个字符串做测试,它的ASCII编码为为41 42 BA BA D7 D6 输出结果:
|