<menu id="w8yyk"><menu id="w8yyk"></menu></menu>
  • <dd id="w8yyk"><nav id="w8yyk"></nav></dd>
    <menu id="w8yyk"></menu>
    <menu id="w8yyk"><code id="w8yyk"></code></menu>
    <menu id="w8yyk"></menu>
    <xmp id="w8yyk">
    <xmp id="w8yyk"><nav id="w8yyk"></nav>
  • 網站首頁 > 物聯資訊 > 技術分享

    有關UNICODE、ANSI字符集和相關字符串操作

    2016-09-28 00:00:00 廣州睿豐德信息科技有限公司 閱讀
    睿豐德科技 專注RFID識別技術和條碼識別技術與管理軟件的集成項目。質量追溯系統、MES系統、金蝶與條碼系統對接、用友與條碼系統對接

    Q UNICODE字符串如何顯示
    A
    如果程序定義了_UNICODE宏直接用
    WCHAR *str=L"unicodestring";
    TextOut(0,0,str);
    否則就需要轉換類型
    #include <comdef.h>
    WCHAR *str=L"unicodestring";
    bstr_t str1=str;
    TextOut(0,0,(char*)str1);
    Q 如何實現ANSI和UNICODE的相互轉換
    A
    將ANSI轉換到Unicode
    (1)通過L這個宏來實現,例如: CLSIDFromProgID( L"MAPI.Folder",&clsid);
    (2)通過MultiByteToWideChar函數實現轉換,例如:
    char *szProgID = "MAPI.Folder";
    WCHAR szWideProgID[128];
    CLSID clsid;
    long lLen = MultiByteToWideChar(CP_ACP,0,szProgID,strlen(szProgID),szWideProgID,sizeof (szWideProgID));
    szWideProgID[lLen] = ''\0'';
    (3)通過A2W宏來實現,例如:
    USES_CONVERSION;
    CLSIDFromProgID( A2W(szProgID),&clsid);
    將Unicode轉換到ANSI
    (1)使用WideCharToMultiByte,例如:
    // 假設已經有了一個Unicode 串 wszSomeString...
    char szANSIString [MAX_PATH];
    WideCharToMultiByte ( CP_ACP, WC_COMPOSITECHECK, wszSomeString, -1, szANSIString, sizeof(szANSIString), NULL, NULL );
    (2)使用W2A宏來實現,例如:
    USES_CONVERSION;
    pTemp=W2A(wszSomeString);
    注意在轉換時可能存在的問題:
    因為ANSI轉UNICODE,如果使用A2W或MultiByteToWideChar(第一個參數是CP_ACP)的話,是根據系統默認的轉碼表,把轉入的ANSI字符串看作Multi-Bytes字符串處理的,如果是中文(中文windows默認就是中文),一個大于0x87的byte可能和下一 byte一起被看作一個漢字,然后根據漢字的Unicode編碼轉換為相同的Unicode漢字,如果找不到相應的編碼,一般就用一個默認的字符來取代它(一般是問號“?”),由此看,如果隨便把一段數據給他轉,轉化很復雜而且極可能不可逆,而且你加密過的ANSI碼是相當混亂的有很多〉0x87的 byte,轉換就變得不可逆了。
    建議自己直接就這樣寫:
    CHAR lpANSI[COUNT];
    WCHAR lpUnicode[COUNT];
    int i = 0;
    while(lpANSI[i] != ''\0'' ) {
    lpUnicode[i] = (WCHAR)lpANSI[i];
    }
    lpUnicode[i] = L''\0'';
    然后按相同的方法轉回來,因為對于0~0x87的ANSI字符串,對應的Unicode碼就是相同的16位值,至于其他的,你的字符串反正加了密,沒必要轉換成顯示出來是一樣的字符,就按同樣的方法處理了,其實如果中間的字符串不用顯示或別的,直接reutrn (LPWSTR)lpANSI;過去也可以, 反正接受的時候自己清楚就可以了。
    Q 如何讓程序支持UNICODE
    A
    NT 系統的內核是unicode代碼,通常vc分創建的工程默認都是ansi代碼(可以兼容win9x),在nt下ansi程式在調用windows API的時系統實際又進行了一次ansi到unicode的代碼轉化,如MoveWindowA實際上又調用MoveWindowW.如果以我們的程序不考慮win9x(早晚是明日黃花)的話,直接用unicode編譯,那么程式的代碼執行效率一定能增色不少.具體:
    (0).在vc編譯選項上,在vc7.0以上在工程的屬性頁中的“字符集”選上"使用 Unicode 字符集"即可,在vc6.0下可能麻煩一點,得先把vc運行庫的unicode版本復制到vc路徑下,一般都是和xxx.lib的ansi對應 xxxU.lib,默認裝vc時是不會裝的,將工程屬性
    (0).1.改語言定義:
    在project settings的"C++"頁中的"preprocessor definitions"中改_MBCS為_UNICODE
    (0).2.改入口函數:
    在"link"頁中的"project Options"加入/entry:"wWinMainCRTStartup"即可.
    (1)在代碼上,處理字符中的多用TCHAR.H中的宏,如strcpy用_tcscpy代替,用TCHAR代char,
    用TCHAR m_mystr[]=_T("xxxx")代替 char m_mystr[]="xxxx";
    (2)注意調試UNICODE程序時,需要在安裝時VC選擇所有選項,否則會缺少動態庫和相應的.lib文件
    Q 如何取得一個既包含單字節字符又包含雙字節字符的字符串的字符個數?
    A
    可以調用Microsoft Visual C++的運行期庫包含函數_mbslen來操作多字節(既包括單字節也包括雙字節)字符串。
    調用strlen函數,無法真正了解字符串中究竟有多少字符,它只能告訴你到達結尾的0之前有多少個字節。
    Q 如何對DBCS(雙字節字符集)字符串進行操作?
    A
    函數 描述
    PTSTR CharNext ( LPCTSTR ); 返回字符串中下一個字符的地址
    PTSTR CharPrev ( LPCTSTR, LPCTSTR ); 返回字符串中上一個字符的地址
    BOOL IsDBCSLeadByte( BYTE ); 如果該字節是DBCS字符的第一個字節,則返回非0值
    Q 為什么要使用Unicode?
    A
    (1) 可以很容易地在不同語言之間進行數據交換。
    (2) 使你能夠分配支持所有語言的單個二進制.exe文件或DLL文件。
    (3) 提高應用程序的運行效率。
    Windows 2000是使用Unicode從頭進行開發的,如果調用任何一個Windows函數并給它傳遞一個ANSI字符串,那么系統首先要將字符串轉換成 Unicode,然后將Unicode字符串傳遞給操作系統。如果希望函數返回ANSI字符串,系統就會首先將Unicode字符串轉換成ANSI字符串,然后將結果返回給你的應用程序。進行這些字符串的轉換需要占用系統的時間和內存。通過從頭開始用Unicode來開發應用程序,就能夠使你的應用程序更加有效地運行。
    Windows CE 本身就是使用Unicode的一種操作系統,完全不支持ANSI Windows函數
    Windows 98 只支持ANSI,只能為ANSI開發應用程序。
    Microsoft公司將COM從16位Windows轉換成Win32時,公司決定需要字符串的所有COM接口方法都只能接受Unicode字符串。
    Q 如何編寫Unicode源代碼?
    A
    Microsoft 公司為Unicode設計了WindowsAPI,這樣,可以盡量減少代碼的影響。實際上,可以編寫單個源代碼文件,以便使用或者不使用Unicode來對它進行編譯。只需要定義兩個宏(UNICODE和_UNICODE),就可以修改然后重新編譯該源文件。
    _UNICODE宏用于C運行期頭文件,而UNICODE宏則用于Windows頭文件。當編譯源代碼模塊時,通常必須同時定義這兩個宏。
    Q Windows定義的Unicode數據類型有哪些?
    A
    數據類型 說明
    WCHAR Unicode字符
    PWSTR 指向Unicode字符串的指針
    PCWSTR 指向一個恒定的Unicode字符串的指針
    對應的ANSI數據類型為CHAR,LPSTR和LPCSTR。
    ANSI/Unicode通用數據類型為TCHAR,PTSTR,LPCTSTR。
    Q 如何對Unicode進行操作?
    A
    字符集 特性 實例
    ANSI 操作函數以str開頭 strcpy
    Unicode 操作函數以wcs開頭 wcscpy
    MBCS 操作函數以_mbs開頭 _mbscpy
    ANSI/Unicode 操作函數以_tcs開頭 _tcscpy(C運行期庫)
    ANSI/Unicode 操作函數以lstr開頭 lstrcpy(Windows函數)
    所有新的和未過時的函數在Windows2000中都同時擁有ANSI和Unicode兩個版本。ANSI版本函數結尾以A表示;Unicode版本函數結尾以W表示。Windows會如下定義:
    #ifdef UNICODE
    #define CreateWindowEx CreateWindowExW
    #else
    #define CreateWindowEx CreateWindowExA
    #endif // !UNICODE  

    Q 如何表示Unicode字符串常量?
    A
    字符集 實例
    ANSI “string”
    Unicode L“string”
    ANSI/Unicode T(“string”)或_TEXT(“string”)if( szError[0] == _TEXT(‘J’) ){ }
    Q 為什么應當盡量使用操作系統函數?
    A
    這將有助于稍稍提高應用程序的運行性能,因為操作系統字符串函數常常被大型應用程序比如操作系統的外殼進程Explorer.exe所使用。由于這些函數使用得很多,因此,在應用程序運行時,它們可能已經被裝入RAM。
    如:StrCat,StrChr,StrCmp和StrCpy等。
    Q 如何編寫符合ANSI和Unicode的應用程序?
    A
    (1) 將文本串視為字符數組,而不是chars數組或字節數組。
    (2) 將通用數據類型(如TCHAR和PTSTR)用于文本字符和字符串。
    (3) 將顯式數據類型(如BYTE和PBYTE)用于字節、字節指針和數據緩存。
    (4) 將TEXT宏用于原義字符和字符串。
    (5) 執行全局性替換(例如用PTSTR替換PSTR)。
    (6) 修改字符串運算問題。例如函數通常希望在字符中傳遞一個緩存的大小,而不是字節。這意味著不應該傳遞sizeof(szBuffer),而應該傳遞(sizeof(szBuffer)/sizeof(TCHAR)。另外,如果需要為字符串分配一個內存塊,并且擁有該字符串中的字符數目,那么請記住要按字節來分配內存。這就是說,應該調用
    malloc(nCharacters *sizeof(TCHAR)),而不是調用malloc(nCharacters)。
    Q 如何對字符串進行有選擇的比較?
    A
    通過調用CompareString來實現。

    標志 含義
    NORM_IGNORECASE 忽略字母的大小寫
    NORM_IGNOREKANATYPE 不區分平假名與片假名字符
    NORM_IGNORENONSPACE 忽略無間隔字符
    NORM_IGNORESYMBOLS 忽略符號
    NORM_IGNOREWIDTH 不區分單字節字符與作為雙字節字符的同一個字符
    SORT_STRINGSORT 將標點符號作為普通符號來處理
    Q 如何判斷一個文本文件是ANSI還是Unicode?
    A
    判斷如果文本文件的開頭兩個字節是0xFF和0xFE,那么就是Unicode,否則是ANSI。
    Q 如何判斷一段字符串是ANSI還是Unicode?
    A
    用IsTextUnicode進行判斷。IsTextUnicode使用一系列統計方法和定性方法,以便猜測緩存的內容。由于這不是一種確切的科學方法,因此 IsTextUnicode有可能返回不正確的結果。
    Q 如何在Unicode與ANSI之間轉換字符串?
    A
    Windows函數MultiByteToWideChar用于將多字節字符串轉換成寬字符串;函數WideCharToMultiByte將寬字符串轉換成等價的多字節字符串。
    Q 如何得到漢字的Unicode編碼
    A
    #include "comdef.h"
    char *str1="你好";
    _bstr_t str=str1;
    WCHAR *str2=str;
    str2就是你要的UNICODE碼
    Q 如何實現#21592#24037#36873#25321這種編碼與漢字之間的轉換?
    A
    CString str="#21592#24037#36873#25321";
    str+=''#'';
    CString str1="";
    WCHAR str2[5]={0,0,0,0,0};
    int j=0;
    do
    {
    str1=str.Left(str.Find(''#'',1));
    str=str.Mid(str.Find(''#'',1));
    WCHAR i=0;
    sscanf(str1,"#%d",&i);
    str2[j]=i;
    j++;
    }while(str1!="");
    _bstr_t str3=str2;
    char *str4=str3;
    Q 如何解決char* to bstr 和bstr to char *的問題
    A
    參考下面的函數完成
    void charString()
    {
    char *l_sz;
    l_sz=new char[20];
    strcpy(l_sz,"hello world12你好!");
    CString l_cstring(l_sz);
    BSTR l_cBstr;
    l_cBstr=l_cstring.AllocSysString();
    CString l_cstring2(l_cBstr);
    delete []l_sz;
    cout<<"l_cstring:"<<l_cstring<<endl;
    cout<<"l_cstring:"<<l_cstring2<<endl;
    l_cstring2+="aaaa";
    char *l_sz1;
    l_sz1=l_cstring2.GetBuffer(l_cstring2.GetLength());
    cout<<"l_sz:"<<l_sz1<<endl;

    另外一篇:

    UNICODE環境設置

    在安裝Visual Studio時,在選擇VC++時需要加入unicode選項,保證相關的庫文件可以拷貝到system32下。

    UNICODE編譯設置:

    C/C++, Preprocessor difinitions 去除_MBCS,加_UNICODE,UNICODE

    在ProjectSetting/link/output 中設置Entry為wWinMainCRTStartup

    反之為MBCS(ANSI)編譯。

    Unicode :寬字節字符集

    1. 如何取得一個既包含單字節字符又包含雙字節字符的字符串的字符個數?

    可以調用Microsoft Visual C++的運行期庫包含函數_mbslen來操作多字節(既包括單字節也包括雙字節)字符串。

    調用strlen函數,無法真正了解字符串中究竟有多少字符,它只能告訴你到達結尾的0之前有多少個字節。

    2. 如何對DBCS(雙字節字符集)字符串進行操作?

    函數 描述

    PTSTR CharNext ( LPCTSTR ); 返回字符串中下一個字符的地址

    PTSTR CharPrev ( LPCTSTR, LPCTSTR ); 返回字符串中上一個字符的地址

    BOOL IsDBCSLeadByte( BYTE ); 如果該字節是DBCS字符的第一個字節,則返回非0值

    3. 為什幺要使用Unicode

    (1) 可以很容易地在不同語言之間進行數據交換。

    (2) 使你能夠分配支持所有語言的單個二進制.exe文件或DLL文件。

    (3) 提高應用程序的運行效率。

    Windows 2000是使用Unicode從頭進行開發的,如果調用任何一個Windows函數并給它傳遞一個ANSI字符串,那幺系統首先要將字符串轉換成 Unicode,然后將Unicode字符串傳遞給操作系統。如果希望函數返回ANSI字符串,系統就會首先將Unicode字符串轉換成ANSI字符串,然后將結果返回給你的應用程序。進行這些字符串的轉換需要占用系統的時間和內存。通過從頭開始用Unicode來開發應用程序,就能夠使你的應用程序更加有效地運行。

    Windows CE 本身就是使用Unicode的一種操作系統,完全不支持ANSI Windows函數

    Windows 98 只支持ANSI,只能為ANSI開發應用程序。

    Microsoft公司將COM從16位Windows轉換成Win32時,公司決定需要字符串的所有COM接口方法都只能接受Unicode字符串。

    4. 如何編寫Unicode源代碼?

    Microsoft公司為Unicode設計了WindowsAPI,這樣,可以盡量減少代碼的影響。實際上,可以編寫單個源代碼文件,以便使用或者不使用Unicode來對它進行編譯。只需要定義兩個宏(UNICODE_UNICODE),就可以修改然后重新編譯該源文件。

    _UNICODE宏用于C運行期頭文件,而UNICODE宏則用于Windows頭文件。當編譯源代碼模塊時,通常必須同時定義這兩個宏。

    5. Windows定義的Unicode數據類型有哪些?

    數據類型 說明

    WCHAR Unicode字符

    PWSTR 指向Unicode字符串的指針

    PCWSTR 指向一個恒定的Unicode字符串的指針

    對應的ANSI數據類型為CHAR,LPSTR和LPCSTR。

    ANSI/Unicode通用數據類型為TCHAR,PTSTR,LPCTSTR。

    6. 如何對Unicode進行操作?

    字符集 特性 實例

    ANSI 操作函數以str開頭 strcpy

    Unicode 操作函數以wcs開頭 wcscpy

    MBCS 操作函數以_mbs開頭 _mbscpy

    ANSI/Unicode 操作函數以_tcs開頭 _tcscpy(C運行期庫)

    ANSI/Unicode 操作函數以lstr開頭 lstrcpy(Windows函數)

    所有新的和未過時的函數在Windows2000中都同時擁有ANSI和Unicode兩個版本。ANSI版本函數結尾以A表示;Unicode版本函數結尾以W表示。Windows會如下定義:

    #ifdef UNICODE

    #define CreateWindowEx CreateWindowExW

    #else

    #define CreateWindowEx CreateWindowExA

    #endif // !UNICODE

    7. 如何表示Unicode字符串常量?

    字符集 實例

    ANSI “string”

    Unicode L“string”

    ANSI/Unicode T(“string”)或_TEXT(“string”)if( szError[0] == _TEXT(‘J’) ){ }

    8. 為什幺應當盡量使用操作系統函數?

    這將有助于稍稍提高應用程序的運行性能,因為操作系統字符串函數常常被大型應用程序比如操作系統的外殼進程Explorer.exe所使用。由于這些函數使用得很多,因此,在應用程序運行時,它們可能已經被裝入RAM。

    如:StrCat,StrChr,StrCmp和StrCpy等。

    9. 如何編寫符合ANSIUnicode的應用程序?

    (1) 將文本串視為字符數組,而不是chars數組或字節數組。

    (2) 將通用數據類型(如TCHAR和PTSTR)用于文本字符和字符串。

    (3) 將顯式數據類型(如BYTE和PBYTE)用于字節、字節指針和數據緩存。

    (4) 將TEXT宏用于原義字符和字符串。

    (5) 執行全局性替換(例如用PTSTR替換PSTR)。

    (6)修改字符串運算問題。例如函數通常希望在字符中傳遞一個緩存的大小,而不是字節。這意味著不應該傳遞sizeof(szBuffer),而應該傳遞(sizeof(szBuffer)/sizeof(TCHAR)。另外,如果需要為字符串分配一個內存塊,并且擁有該字符串中的字符數目,那幺請記住要按字節來分配內存。這就是說,應該調用

    malloc(nCharacters *sizeof(TCHAR)),而不是調用malloc(nCharacters)。

    10. 如何對字符串進行有選擇的比較?

    通過調用CompareString來實現。

    標志 含義

    NORM_IGNORECASE 忽略字母的大小寫

    NORM_IGNOREKANATYPE 不區分平假名與片假名字符

    NORM_IGNORENONSPACE 忽略無間隔字符

    NORM_IGNORESYMBOLS 忽略符號

    NORM_IGNOREWIDTH 不區分單字節字符與作為雙字節字符的同一個字符

    SORT_STRINGSORT 將標點符號作為普通符號來處理

    11. 如何判斷一個文本文件是ANSI還是Unicode

    判斷如果文本文件的開頭兩個字節是0xFF和0xFE,那幺就是Unicode,否則是ANSI。

    12. 如何判斷一段字符串是ANSI還是Unicode

    用IsTextUnicode進行判斷。IsTextUnicode使用一系列統計方法和定性方法,以便猜測緩存的內容。由于這不是一種確切的科學方法,因此 IsTextUnicode有可能返回不正確的結果。

    13. 如何在UnicodeANSI之間轉換字符串?

    Windows函數MultiByteToWideChar用于將多字節字符串轉換成寬字符串;函數WideCharToMultiByte將寬字符串轉換成等價的多字節字符串。

    14. UnicodeDBCS之間的區別

    Unicode 使用(特別在C程序設計語言環境里)“寬字符集”。「Unicode中的每個字符都是16位寬而不是8位寬。」在Unicode中,沒有單單使用8位數值的意義存在。相比之下,在“雙位組字符集”中我們仍然處理8位數值。有些位組自身定義字符,而某些位組則顯示需要和另一個位組共同定義一個字符。

    處理DBCS字符串非常雜亂,但是處理Unicode文字則像處理有秩序的文字。您也許會高興地知道前128個Unicode字符(16位代碼從 0x0000到0x007F)就是ASCII字符,而接下來的128個Unicode字符(代碼從0x0080到0x00FF)是ISO 8859-1對ASCII的擴展。Unicode中不同部分的字符都同樣基于現有的標準。這是為了便于轉換。希臘字母表使用從0x0370到0x03FF 的代碼,斯拉夫語使用從0x0400到0x04FF的代碼,美國使用從0x0530到0x058F的代碼,希伯來語使用從0x0590到0x05FF的代碼。中國、日本和韓國的象形文字(總稱為CJK)占用了從0x3000到0x9FFF的代碼。Unicode的最大好處是這里只有一個字符集,沒有一點含糊。

    15.衍生標準

    Unicode是一個標準。UTF-8是其概念上的子集,UTF-8是具體的編碼標準。而UNICODE是所有想達到世界統一編碼標準的標準。UTF-8標準就是Unicode(ISO10646)標準的一種變形方式,

    UTF的全稱是:Unicode/UCS Transformation Format,其實有兩種UTF,一種是UTF-8,一種是UTF-16,

    不過UTF-16使用較少,其對應關系如下:

    在Unicode中編碼為 0000 - 007F 的 UTF-8 中編碼形式為: 0xxxxxxx

    在Unicode中編碼為 0080 - 07FF 的 UTF-8 中編碼形式為: 110xxxxx 10xxxxxx

    在Unicode中編碼為 0000 - 007F 的 UTF-8 中編碼形式為: 1110xxxx 10xxxxxx 10xxxxxx

    utf- 8是unicode的一個新的編碼標準,其實unicode有過好幾個標準.我們知道一直以來使用的unicode字符內碼都是16位,它實際上還不能把全世界的所有字符編在一個平面系統,比如中國的藏文等小語種,所以utf-8擴展到了32位,也就是說理論在utf-8中可容納二的三十二次方個字符. UNICODE的思想就是想把所有的字符統一編碼,實現一個統一的標準.big5、gb都是獨立的字符集,這也叫做遠東字符集,把它拿到德文版的 WINDOWS上可能將會引起字符編碼的沖突....早期的WINDOWS默認的字符集是ANSI.notepad中輸入的漢字是本地編碼,但在 NT/2000內部是可以直接支持UNICODE的。notepad.exe在WIN95和98中都是ANSI字符,在NT中則是 UNICODE.ANSI和UNICODE可以方便的實現對應映射,也就是轉換 ASCII是8位范圍內的字符集,對于范圍之外的字符如漢字它是無法表達的。unicode是16位范圍內的字符集,對于不同地區的字符分區分配,unicode是多個IT巨頭共同制定的字符編碼標準。如果在unicode環境下比如WINDOWS NT上,一個字符占兩字節16位,而在ANSI環境下如WINDOWS98下一個字符占一個字節8位.Unicode字符是16位寬,最多允許 65,535字符,數據類型被稱為WCHAR。

    對于已有的ANSI字符,

    unicode簡單的將其擴展為16位:比如ANSI"A"=0x43,則對應的UNICODE為

    "A"= 0x0043

    而ASCII用七存放128個字符,ASCII是一個真正的美國標準,所以它不能滿足其他國家的需要,例如斯拉夫語的字母和漢字于是出現了Windows ANSI字符集,是一種擴展的ASCII碼,用8位存放字符,低128位仍然存放原來的ASCII碼,

    而高128位加入了希臘字母等

    if def UNICODE

     TCHAR = wchar

    else

     TCHAR = char

    你需要在Project\Settings\C/C++\Preprocesser definitions中添加UNICODE和_UNICODE

    UINCODE,_UNICODE 都要定義。不定義_UNICODE的話,用SetText(HWND,LPCTSTR),將被解釋為SetTextA(HWND,LPTSTR),這時 API將把你給的Unicode字符串看作ANSI字符串,顯示亂碼。因為windows API是已經編譯好存在于dll中的,由于不管UNICODE還是ANSI字符串,都被看作一段buffer,如"0B A3 00 35 24 3C 00 00"如果按ANSI讀,因為ANSI字串是以''\0''結束的,所以只能讀到兩字節"0B A3 \0",如果按UNICODE讀,將完整的讀到''\0\0''結束。

    由于UNICODE沒有額外的指示位,所以系統必須知道你提供的字串是哪種格式。此外,UNICODE好象是ANSI C++規定的,_UNICODE是windows SDK提供的。如果不編寫windows程序,可以只定義UNICODE。

    開發過程:

    圍繞著文件讀寫、字符串處理展開。文件主要有兩種:.txt和.ini文件

    1.    在unicode和非unicode環境下字符串做不同處理的,那么需要參考以上9,10兩條,以適應不同環境得字符串處理要求。

    對文件讀寫也一樣。只要調用相關接口函數時,參數中的字符串前都加上_TEXT等相關宏。如果寫成的那個文件需要是unicode格式保存的,那么在創建文件時需要加入一個字節頭。

    CFilefile;

        WCHARszwBuffer[128];  

        WCHAR *pszUnicode = L"Unicode string\n"; // unicode string

        CHAR *pszAnsi = "Ansi string\n"; // ansi string

        WORDwSignature = 0xFEFF;

        file.Open(TEXT("Test.txt"), CFile::modeCreate|CFile::modeWrite);

        file.Write(&wSignature, 2);

         file.Write(pszUnicode, ls

    trlenW(pszUnicode) * sizeof(WCHAR));

        // explicitly use lstrlenW function

        MultiByteToWideChar(CP_ACP, 0, pszAnsi, -1, szwBuffer, 128);

        file.Write(szwBuffer, lstrlenW(szwBuffer) * sizeof(WCHAR));

        file.Close();

    //以上這段代碼在unicode和非unicode環境下都有效。這里顯式的指明用Unicode來進行操作。

    2.    在非unicode環境下,缺省調用的都是ANSI格式的字符串,此時TCHAR轉換為CHAR類型的,除非顯式定義WCHAR。所以在這個環境下,如果讀取unicode文件,那么首先需要移動2個字節,然后讀取得字符串需要用MultiByteToWideChar來轉換,轉換后字符串信息才代表 unicode數據。

    3.    在 unicode環境下,缺省調用得都是unicode格式得字符串,也就是寬字符,此時TCHAR轉換為WCHAR,相關得API函數也都調用寬字符類型的函數。此時讀取unicode文件也和上面一樣,但是讀取得數據是WCHAR的,如果要轉換成ANSI格式,需要調用 WideCharToMultiByte。如果讀取ANSI的,則不用移動兩個字節,直接讀取然后視需要轉換即可。


    某些語言(如韓語)必須在unicode環境下才能顯示,這種情況下,在非unicode環境下開發,就算用字符串函數轉換也不能達到顯示文字的目的,因為此時調用得API函數是用ANSI的(雖然底層都是用UNICODE處理但是處理結果是按照程序員調用的API來顯示的)。所以必須用unicode來開發。

    RFID管理系統集成商 RFID中間件 條碼系統中間層 物聯網軟件集成
    最近免费观看高清韩国日本大全