blc_mchar.h

blc_mchar.h 에는 각종 인코딩의 멀티바이트 문자를 처리하기 위한 클래스와 전역 함수들이 포함되어 있습니다.

이 문서에서는 blc_mchar.h에 포함된 구성요소들에 대해 설명합니다. 아래에 설명할 요소들은 모두 namespace blc::ustr 내부에 선언되어 있습니다(인코딩 타입들은 namespace blc::ustr::encoding 내부에 선언되어 있습니다).

전역 상수

constexpr uint32_t kReplacementCharacter
현재 인코딩으로 해석이 불가능한 문자를 대체하는데 사용되는 문자(U+FFFD)입니다. 코드 페이지에 이 문자가 없는 경우에는 물음표('?')를 대신 사용합니다.

올바르지 않은 문자 처리 함수자

struct NoCheck final
현재 인코딩으로 해석할 수 없는 문자를 만나면 아무 일도 하지 않습니다. 기본 동작으로 이 함수자가 설정되어 있습니다. 다음은 멤버 함수 목록입니다.
- void operator ()(bool) const
  bool 타입 매개변수의 값이 false(현재 인코딩으로 해석할 수 없는 문자를 만났을 때)이든, true이든 아무런 동작을 수행하지 않습니다.
struct AssertCheck final
현재 인코딩으로 해석할 수 없는 문자를 만나면, <cassert> 헤더에 선언된 매크로 함수 assert를 이용해 처리합니다. 다음은 멤버 함수 목록입니다.
- void operator ()(bool is_valid) const
  is_valid가 false(현재 인코딩으로 해석할 수 없는 문자를 만났을 때)이면, 함수 body에 있는 assert 매크로 함수가 실패합니다.
struct ExceptionCheck final
현재 인코딩으로 해석할 수 없는 문자를 만나면, std::logic_error 타입의 예외를 던집니다. 다음은 멤버 함수 목록입니다.
- ExceptionCheck(...)
  생성자 입니다. 생성자는 총 다섯 개의 오버로딩 버전이 제공됩니다. 복사 생성이나 이동 생성은 가능하지만, 복사 대입이나 이동 대입은 금지(삭제된 함수)되어 있습니다.
  //-----------------------------------------------------------------------------
  
  // 1
  
  ExceptionCheck();
  
  // 기본 생성자 입니다. std::logic_error의 생성자로 넘겨줄 문자열을
  
  // "Invalid character"로 설정합니다.
  
  //-----------------------------------------------------------------------------
  
  // 2
  
  ExceptionCheck(const std::string& msg);
  
  // 문자열 msg를, private 멤버 문자열 객체 msg_에 복사하여 생성합니다.
  
  //-----------------------------------------------------------------------------
  
  // 3
  
  ExceptionCheck(std::string&& msg) noexcept;
  
  // 문자열 msg를, private 멤버 문자열 msg_에 이동하여 생성합니다.
  
  //-----------------------------------------------------------------------------
  
  // 4
  
  ExceptionCheck(const ExceptionCheck&);
  
  // 복사 생성자 입니다. 기본 동작(= default)을 수행합니다.
  
  //-----------------------------------------------------------------------------
  
  // 5
  
  ExceptionCheck(ExceptionCheck&&) noexcept;
  
  // 이동 생성자 입니다. 기본 동작(= default)을 수행합니다.
- ~ExceptionCheck()
  소멸자 입니다. 기본 동작(= default)을 수행합니다.
- void operator ()(bool is_valid) const
  is_valid가 false(현재 인코딩으로 해석할 수 없는 문자를 만났을 때)이면, std::logic_error 타입의 예외를 던집니다. 이 때 생성자에서 받아둔 문자열을 std::logic_error의 생성자로 넘겨줍니다.
class InvalidCharCounter final
현재 인코딩으로 해석할 수 없는 문자를 만날 때마다 그 개수를 셉니다. 다음은 멤버 함수 목록입니다.
- InvalidCharCounter(size_t& count) noexcept
  카운트에 사용할 size_t 타입 변수의 참조자를 받는 생성자 입니다. 기본 생성자는 제공되지 않습니다.
- void operator ()(bool is_valid) const
  is_valid가 false(현재 인코딩으로 해석할 수 없는 문자를 만났을 때)이면 참조하고 있는 외부의 size_t 타입 변수 값을 1만큼 증가시킵니다.
class CheckCharFuncType final
올바르지 않은 문자 처리 함수자들을 담아두고 실행시켜주는 함수자 클래스 입니다. 이 함수자 클래스는 항상 null이 아님을 보장합니다(기본 동작: struct NoCheck). 다음은 멤버 함수 목록입니다.
- CheckCharFuncType(...)
  생성자 입니다. 생성자는 생성자 템플릿을 포함하여 총 세 개의 오버로딩 버전이 제공됩니다. 복사 생성은 허용되나, 복사 대입은 허용되지 않습니다.
  //-----------------------------------------------------------------------------
  
  // 1
  
  CheckCharFuncType();
  
  // 기본 생성자 입니다. 기본 생성자를 통해 생성한 CheckCharFuncType 객체를
  
  // 실행하면, 기본 동작인 NoCheck가 실행됩니다.
  
  //-----------------------------------------------------------------------------
  
  // 2
  
  CheckCharFuncType(const CheckCharFuncType&);
  
  // 복사 생성자 입니다. 기본 동작(= default)을 수행합니다.
  
  //-----------------------------------------------------------------------------
  
  // 3
  
  template <typename FuncType_>
  
  CheckCharFuncType(FuncType_ check_func);
  
  // NoCheck를 포함한 다른 오류 문자 처리 함수자들을 받아
  
  // 생성하는 생성자 템플릿 입니다.
  
  // 다른 함수자를 받아 생성한 CheckCharFuncType 객체를 실행하면,
  
  // 받아둔 함수자가 실행됩니다.
- void operator ()(bool is_valid) const
  is_valid가 false(현재 인코딩으로 해석할 수 없는 문자를 만났을 때)이면, 생성자에서 받아둔 오류 문자 처리 함수자 객체를 실행합니다.

template class Mchar final

멀티바이트 문자 하나를 처리하는 클래스 템플릿 입니다. 템플릿 매개변수로 멀티바이트 문자의 인코딩 타입(인코딩 단위전략)을 지정할 수 있습니다. 전체 선언문은 다음과 같습니다.

template <
typename EncodingType_,
typename = std::enable_if_t<encoding::IsEncodingType<std::decay_t<EncodingType_>>::value>
>
class Mchar;
// EncodingType_(인코딩 단위전략)으로
// Mchar 클래스가 사용할 인코딩 타입을
// 지정할 수 있습니다.
// enable_if_t는 EncodingType_이 올바른
// 인코딩 단위전략인지 검사합니다.

BLC에서 기본 제공되는 인코딩 단위전략은 다음과 같습니다.

blc::ustr::encoding::DefaultEncoding
blc::ustr::encoding::UTF8과 동일합니다. 즉, BLC에서는 기본 인코딩으로 UTF-8이 사용됩니다.
blc::ustr::encoding::UTF8
UTF-8 입니다.
blc::ustr::encoding::UTF16BE
UTF-16 빅 엔디안 입니다.
blc::ustr::encoding::UTF16LE
UTF-16 리틀 엔디안 입니다.
blc::ustr::encoding::UTF32BE
UTF-32 빅 엔디안 입니다.
blc::ustr::encoding::UTF32LE
UTF-32 리틀 엔디안 입니다.
blc::ustr::encoding::CP949
CP949 입니다. 이 인코딩 타입을 사용하려면 "blc/ustr/encoding/blc_cp949_t.h" 헤더를 포함해야 합니다.
이 인코딩 타입은 유니코드 계열 이외의 인코딩을 적용한 예제로 만든 것입니다. 유니코드와 CP949 맵핑 데이터 전체를 소스코드("blc/ustr/encoding/blc_cp949_table.cpp")에 그대로 집어 넣어 만들었기 때문에 실사용하는데 문제가 있을 수 있습니다. 문제가 생기는 경우, BLC 라이브러리에서 아래의 세 파일을 프로젝트에서 제외하고 사용하세요.
1. blc/ustr/encoding/blc_cp949_t.h
2. blc/ustr/encoding/blc_cp949_table.h
3. blc/ustr/encoding/blc_cp949_table.cpp

using 선언된 타입
- TableType
  현재 인코딩의 코드 페이지와 유니코드의 맵핑 정보를 담은 타입의 별칭입니다.
- EncodingImplType
  현재 인코딩 타입에서, 인코딩과 디코딩을 하는 함수들을 멤버로 갖는 타입의 별칭입니다.
- EncodingType
  Mchar 클래스 템플릿의 타입인수, EncodingType_(인코딩 단위전략)의 별칭입니다.
- CharType
  가장 작은 문자 타입의 별칭입니다. BLC에서는 char 타입과 같습니다.
- SizeType
  멀티바이트 문자의 바이트 수를 표현하는 타입의 별칭입니다.
멤버 함수
- Mchar(...)
  생성자 입니다. 생성자 템플릿 두 가지를 포함하여, 총 다섯 개의 오버로딩 버전이 제공됩니다.
  //-----------------------------------------------------------------------------
  
  // 1
  
  Mchar() noexcept;
  
  // 기본 생성자 입니다. 널 문자('\0') 로 초기화 합니다.
  
  //-----------------------------------------------------------------------------
  
  // 2
  
  explicit Mchar(uint32_t unicode);
  
  // 유니코드값을 받아 해당 문자로 초기화 하는 생성자 입니다.
  
  // 현재 인코딩 단위전략의 코드 페이지가 표현할 수 없는
  
  // 문자인 경우 무효한 문자로 초기화 됩니다.
  
  //-----------------------------------------------------------------------------
  
  // 3
  
  template <
  
  typename CharType_,
  
  typename = std::enable_if_t<IsCharacter<CharType_>::value>
  
  >
  
  explicit Mchar(const CharType_* c);
  
  // 문자 타입 포인터를 받아, 해당 포인터가 가리키는
  
  // 멀티바이트 문자로 초기화 하는 생성자 입니다.
  
  // char, char16_t, char32_t 타입의 포인터를
  
  // 가리지 않고 받습니다.
  
  // 단, char16_t는 무조건 UTF-16 리틀 엔디안으로,
  
  // char32_t는 무조건 UTF-32 리틀 엔디안으로 간주합니다
  
  // (초기화 전에 사용중인 인코딩 단위전략에 맞게 인코딩을 변환한 후 초기화 합니다).
  
  // char 타입의 경우 현재 사용중인 인코딩 단위전략이 표현하는
  
  // 인코딩으로 해석합니다.
  
  //-----------------------------------------------------------------------------
  
  // 4
  
  Mchar(const Mchar& rhs) noexcept;
  
  // 복사 생성자 입니다. rhs가 담은 문자를 그대로 this에 복사하여 담습니다.
  
  //-----------------------------------------------------------------------------
  
  // 5
  
  template <typename EncodingT_>
  
  Mchar(const Mchar<EncodingT_>& rhs);
  
  // 서로 다른 인코딩 단위전략을 사용하는 Mchar 객체 rhs가 담은 문자를
  
  // 복사하여 담는 생성자 입니다.
  
  // 이 생성자가 호출될 때 자동으로 rhs가 담는 문자의 인코딩이
  
  // this의 인코딩으로 변환된 후 this에 담깁니다.
  
  // rhs가 담는 문자가, this가 사용중인 인코딩 단위전략의
  
  // 코드 페이지에 없는 문자인 경우, 무효한 문자로 초기화 됩니다.
  
  //-----------------------------------------------------------------------------
  
  // 예제
  
  #include "blc/ustr/blc_mchar.h"
  
  using namespace blc::ustr;
  
  using namespace blc::ustr::encoding;
  
  int main()
  
  {
  
  // 기본생성자는 널 문자로 초기화 됩니다.
  
  Mchar<UTF8> mch1;
  
  // 한글 '냥' 이라는 문자의 유니코드를 받아 생성합니다.
  
  Mchar<UTF8> mch2(U'냥');
  
  // const char* 포인터가 가리키는 멀티바이트 문자를
  
  // 받아 생성합니다. 이 경우, 해당 포인터가 가리키는
  
  // 문자열의 인코딩과 단위전략으로 사용된 인코딩(UTF-8)이
  
  // 서로 일치해야 합니다.
  
  Mchar<UTF8> mch3(u8"냥");
  
  // const char16_t* 포인터가 가리키는 멀티바이트 문자를
  
  // 받아 생성합니다. 이 경우, 해당 포인터가 가리키는 멀티바이트
  
  // 문자의 인코딩이 UTF-16 리틀엔디안이라고 가정합니다.
  
  // this를 생성하면서 인코딩 단위전략에 맞는 인코딩으로
  
  // 변환 후 초기화 됩니다.
  
  Mchar<UTF8> mch4(u"냥");
  
  // const char32_t* 포인터가 가리키는 멀티바이트 문자를
  
  // 받아 생성합니다. 해당 포인터가 가리키는 멀티바이트 문자의
  
  // 인코딩이 UTF-32 리틀엔디안이라고 가정하는것 외에는
  
  // 바로 위의 const char16_t*를 받는 생성자의 경우와
  
  // 동일합니다.
  
  Mchar<UTF8> mch5(U"냥");
  
  // 다른 인코딩 단위전략을 사용하는 Mchar 객체로부터
  
  // 문자를 받아 생성합니다. 아래의 경우 UTF-8 인코딩의
  
  // 멀티바이트 문자를 UTF-16 빅 엔디안으로 변환한 후,
  
  // mch6에 담습니다.
  
  Mchar<UTF16BE> mch6(mch5);
  
  return 0;
  
  }
  Mchar 객체는 이동 연산이 복사 연산에 비해 효율적이지 않으므로, 별도의 이동 연산은 제공되지 않습니다.
- Mchar& operator =(...) &
  대입 연산자 입니다. 템플릿 버전 두 개를 포함해 총 네 가지의 오버로딩 버전이 제공됩니다.
  //-----------------------------------------------------------------------------
  
  // 1
  
  Mchar& operator =(const Mchar& rhs) & noexcept;
  
  // 복사 대입연산자 입니다. rhs가 갖는 멀티바이트 문자를
  
  // this에 그대로 복사하여 대입합니다.
  
  //-----------------------------------------------------------------------------
  
  // 2
  
  template <typename EncodingT_>
  
  Mchar& operator =(const Mchar<EncodingT_>& rhs) &;
  
  // 서로 다른 인코딩 단위전략을 사용하는, rhs가 갖는 멀티바이트 문자를
  
  // this에 대입하는 대입 연산자 입니다.
  
  // 이 대입 연산자가 호출될 때 자동으로 rhs가 담는 문자의 인코딩이
  
  // this의 인코딩으로 변환된 후 this에 대입됩니다.
  
  // rhs가 담는 문자가, this가 사용중인 인코딩 단위전략의
  
  // 코드 페이지에 없는 문자인 경우, 무효한 문자가 대입됩니다.
  
  //-----------------------------------------------------------------------------
  
  // 3
  
  Mchar& operator =(uint32_t unicode) &;
  
  // 유니코드값을 받아 대입하는 대입 연산자 입니다.
  
  // 현재 인코딩 단위전략의 코드 페이지가 표현할 수 없는
  
  // 문자인 경우 무효한 문자가 대입됩니다.
  
  //-----------------------------------------------------------------------------
  
  // 4
  
  template <typename CharType_>
  
  std::enable_if_t<IsCharacter<CharType_>::value, Mchar&>
  
  operator =(const CharType_* c) &;
  
  // 문자 타입 표인터를 받아, 해당 포인터가 가리키는
  
  // 멀티바이트 문자를 대입받는 대입 연산자 입니다.
  
  // char, char16_t, char32_t 타입의 포인터를
  
  // 가리지 않고 받습니다.
  
  // 단, char16_t는 무조건 UTF-16 리틀 엔디안으로,
  
  // char32_t는 무조건 UTF-32 리틀 엔디안으로 간주합니다
  
  // (대입 전에 사용중인 인코딩 단위전략에 맞게 인코딩을 변환한 후 대입 합니다).
  
  // char 타입의 경우 현재 사용중인 인코딩 단위전략이 표현하는
  
  // 인코딩으로 해석합니다.
  
  //-----------------------------------------------------------------------------
  
  // 예제
  
  #include "blc/ustr/blc_mchar.h"
  
  using namespace blc::ustr;
  
  using namespace blc::ustr::encoding;
  
  int main()
  
  {
  
  Mchar<UTF8> utf8;
  
  Mchar<UTF16LE> utf16le;
  
  // 한글 '냥' 이라는 문자의 유니코드를 대입받습니다.
  
  utf8 = U'냥';
  
  // 다른 인코딩 단위전략을 사용하는 Mchar 객체로부터
  
  // 문자를 대입받습니다. 아래의 경우 UTF-8 인코딩의
  
  // 멀티바이트 문자를 UTF-16 리틀엔디안으로 변환한 후,
  
  // utf16le에 담습니다.
  
  utf16le = utf8;
  
  // const char* 포인터가 가리키는 멀티바이트 문자를
  
  // 대입받습니다. 이 경우, 해당 포인터가 가리키는
  
  // 문자열의 인코딩과 단위전략으로 사용된 인코딩(UTF-8)이
  
  // 서로 일치해야 합니다.
  
  utf8 = u8"냥";
  
  // const char16_t* 포인터가 가리키는 멀티바이트 문자를
  
  // 대입받습니다. 이 경우, 해당 포인터가 가리키는 멀티바이트
  
  // 문자의 인코딩이 UTF-16 리틀엔디안이라고 가정합니다.
  
  // this에 대입되면서 인코딩 단위전략에 맞는 인코딩으로
  
  // 변환 후 대입됩니다.
  
  utf8 = u"냥";
  
  // const char32_t* 포인터가 가리키는 멀티바이트 문자를
  
  // 대입받습니다. 해당 포인터가 가리키는 멀티바이트 문자의
  
  // 인코딩이 UTF-32 리틀엔디안이라고 가정하는 것 외에는
  
  // 바로 위의 const char16_t*를 받는 대입연산자의 경우와
  
  // 동일합니다.
  
  utf8 = U"냥";
  
  return 0;
  
  }
  Mchar 객체는 이동 연산이 복사 연산에 비해 효율적이지 않으므로, 별도의 이동 연산은 제공되지 않습니다.
- uint32_t GetUnicode() const
  Mchar 객체가 담고 있는 멀티바이트 문자의 유니코드 값을 구하여 반환합니다. Mchar 객체가 담고 있는 문자가 무효한 문자인 경우, 모든 비트가 1인 uint32_t 타입의 값(blc::ustr::encoding::kInvalidCharacter)을 반환합니다. 사용중인 인코딩 단위전략이 유니코드 계열인 경우에는 GetCode 함수와 동일한 작업을 수행합니다.
- SizeType SetUnicode(uint32_t unicode)
  Mchar 객체에, 유니코드값이 나타내는 문자를 멀티바이트로 인코딩(사용중인 인코딩 단위전략에 따라)하여 대입받습니다. 멀티바이트로 인코딩된 바이트 길이를 반환합니다. 예를 들어 UTF-8 인코딩 단위전략을 사용중일 때, 영어 알파벳은 1 바이트로 인코딩 되므로 1을 반환, 한글 음절 문자의 경우 3바이트로 인코딩 되므로 3을 반환합니다. 사용중인 인코딩 단위전략이 유니코드 계열인 경우에는 SetCode 함수와 동일한 작업을 수행합니다.
- uint32_t GetCode() const
  Mchar 객체가 담고 있는 멀티바이트 문자의, 현재 사용중인 인코딩 단위전략의 코드페이지에서의 코드 값을 구하여 반환합니다. Mchar 객체가 담고 있는 문자가 무효한 경우, 모든 비트가 1인 uint32_t 타입의 값(blc::ustr::encoding::kInvalidCharacter)을 반환합니다. 사용중인 인코딩 단위전략이 유니코드 계열인 경우에는 GetUnicode 함수와 동일한 작업을 수행합니다.
- SizeType SetCode(uint32_t code)
  현재 사용중인 인코딩 단위전략의 코드페이지에서 코드값이 나타내는 문자를 대입받습니다. 멀티바이트로 인코딩된 바이트 길이를 반환합니다. 예를 들어 UTF-8 인코딩 단위전략을 사용중일 때, 영어 알파벳은 1 바이트로 간주되므로 1을 반환, 한글 음절 문자의 경우 3바이트로 인코딩 되므로 3을 반환합니다. 사용중인 인코딩 단위전략이 유니코드 계열인 경우에는 SetUnicode 함수와 동일한 작업을 수행합니다.
- SizeType SetBom()
  Mchar 객체에 BOM(Byte Order Mark)문자를 대입합니다. 만일 CP949와 같이 BOM이 없는 인코딩의 경우에는 무효한 문자가 대입됩니다.
- template <typename CharType_>
  SizeType SetChar(const CharType_* c)
  문자 타입 포인터를 받아, 해당 포인터가 가리키는 멀티바이트 문자를 대입받는 함수입니다. char, char16_t, char32_t 타입의 포인터를 가리지 않고 받습니다. 단 char16_t는 무조건 UTF-16 리틀엔디안으로, char32_t는 무조건 UTF-32 리틀엔디안으로 간주합니다(대입 전에 사용중인 인코딩 단위전략에 맞게 인코딩을 변환한 후 대입 합니다). char 타입의 경우 현재 사용중인 인코딩 단위전략이 표현하는 인코딩으로 해석합니다. 다음은 예제 코드입니다.
  #include "blc/ustr/blc_mchar.h"
  
  using namespace blc::ustr;
  
  using namespace blc::ustr::encoding;
  
  int main()
  
  {
  
  Mchar<UTF8> utf8;
  
  // const char* 포인터가 가리키는 멀티바이트 문자를
  
  // 대입받습니다. 이 경우, 해당 포인터가 가리키는
  
  // 문자열의 인코딩과 단위전략으로 사용된 인코딩(UTF-8)이
  
  // 서로 일치해야 합니다.
  
  utf8.SetChar(u8"냥");
  
  // const char16_t* 포인터가 가리키는 멀티바이트 문자를
  
  // 대입받습니다. 이 경우, 해당 포인터가 가리키는 멀티바이트
  
  // 문자의 인코딩이 UTF-16 리틀엔디안이라고 가정합니다.
  
  // this에 대입되면서 인코딩 단위전략에 맞는 인코딩으로
  
  // 변환 후 대입됩니다.
  
  utf8.SetChar(u"냥");
  
  // const char32_t* 포인터가 가리키는 멀티바이트 문자를
  
  // 대입받습니다. 해당 포인터가 가리키는 멀티바이트 문자의
  
  // 인코딩이 UTF-32 리틀엔디안이라고 가정하는 것 외에는
  
  // 바로 위의 const char16_t*를 받는 대입연산자의 경우와
  
  // 동일합니다.
  
  utf8.SetChar(U"냥");
  
  return 0;
  
  }
- bool IsBom() const
  Mchar 객체에 담긴 문자가 BOM(Byte Order Mark) 문자이면 true를, 그렇지 않으면 false를 반환합니다.
- bool IsValid() const noexcept
  Mchar 객체에 담긴 문자가 정상적인 문자인 경우 true를, 무효한 문자인 경우 false를 반환합니다.
- template <int kN = 1>
  SizeType size() const
  Mchar 객체에 담긴 멀티바이트 문자가 차지하는 크기를 반환합니다. 템플릿 비타입 인수 kN을 통해 문자 타입의 크기를 설정할 수 있습니다. 예를 들어 BMP 바깥 문자 U+01D11E('𝄞') 를 담고 있는 Mchar 객체(UTF-8 인코딩 단위전략 사용)에 대해 size<1>()을 호출한 결과는 4(표현에 1 바이트 크기인 char 변수 4개가 필요)가 됩니다. 마찬가지의 경우에 size<2>()을 호출한 결과는 2(표현에 2바이트 크기인 char16_t 변수 2개가 필요)가 되며, size<4>()의 결과는 항상 1이 됩니다(모든 문자는 char32_t 타입 변수 하나로 표현 가능하므로). 다른 예로 한글 음절 문자의 경우로 생각해 보면, size<1>()의 호출 결과는 3, size<2>()의 호출 결과와 size<4>()의 호출 결과는 1이 됩니다.
- SizeType length() const
  이 함수는 size<1>()의 호출 결과와 항상 동일합니다.
- template <typename EncodingT_>
  int Compare(const Mchar<EncodingT_>& rhs) const
  this와 rhs가 담고있는 문자의 유니코드를 각각 구해 비교합니다. this가 담고 있는 문자의 유니코드값이 rhs가 담고 있는 문자의 유니코드 값보다 크면 1, 작으면 -1, 같으면 0을 반환합니다.
- template <typename EncodingT_>
  int operator <(const Mchar<EncodingT_>& rhs) const
  this와 rhs가 담고있는 문자의 유니코드를 각각 구해 비교합니다. this가 담고 있는 문자의 유니코드값이 rhs가 담고 있는 문자의 유니코드 값보다 작으면 true, 크거나 같으면 false를 반환합니다.
- template <typename EncodingT_>
  int operator >(const Mchar<EncodingT_>& rhs) const
  this와 rhs가 담고있는 문자의 유니코드를 각각 구해 비교합니다. this가 담고 있는 문자의 유니코드값이 rhs가 담고 있는 문자의 유니코드 값보다 크면 true, 작거나 같으면 false를 반환합니다.
- template <typename EncodingT_>
  int operator <=(const Mchar<EncodingT_>& rhs) const
  this와 rhs가 담고있는 문자의 유니코드를 각각 구해 비교합니다. this가 담고 있는 문자의 유니코드값이 rhs가 담고 있는 문자의 유니코드 값보다 작거나 같으면 true, 크면 false를 반환합니다.
- template <typename EncodingT_>
  int operator >=(const Mchar<EncodingT_>& rhs) const
  this와 rhs가 담고있는 문자의 유니코드를 각각 구해 비교합니다. this가 담고 있는 문자의 유니코드값이 rhs가 담고 있는 문자의 유니코드 값보다 크거나 같으면 true, 작으면 false를 반환합니다.
- template <typename EncodingT_>
  int operator ==(const Mchar<EncodingT_>& rhs) const
  this와 rhs가 담고있는 문자의 유니코드를 각각 구해 비교합니다. this가 담고 있는 문자의 유니코드값이 rhs가 담고 있는 문자의 유니코드 값과 같으면 true, 다르면 false를 반환합니다.
- template <typename EncodingT_>
  int operator !=(const Mchar<EncodingT_>& rhs) const
  this와 rhs가 담고있는 문자의 유니코드를 각각 구해 비교합니다. this가 담고 있는 문자의 유니코드값이 rhs가 담고 있는 문자의 유니코드 값과 다르면 true, 같으면 false를 반환합니다.
- template <StrType_>
  StrType_&& StringAppend(StrType_&& str) const
  표준 문자열 객체(std::string, std::u16string, std::u32string, std::wstring 등)의 뒤에, Mchar 객체가 담고 있는 문자를 추가합니다. std::string 객체에는 사용중인 인코딩 단위전략에 해당하는 인코딩으로 문자를 추가하고, std::u16string 객체는 UTF-16 리틀엔디안, std::u32string 객체는 UTF-32 리틀엔디안 인코딩으로 문자를 추가합니다. this가 담고 있는 문자가 무효한 문자인 경우, 대신 kReplacementCharacter 문자를 추가합니다.
- template <typename StrType_, typename = std::enable_if_t<...>>
  explicit inline operator StrType_() const
  Mchar 객체가 담고 있는 멀티바이트 문자 하나를 갖는, 표준 문자열 객체 타입을 반환합니다. std::string으로 변환 시 현재 사용중인 인코딩 단위전략에 해당하는 인코딩을 사용하며, std::u16string 객체는 UTF-16 리틀엔디안, std::u32string 객체는 UTF-32 리틀엔디안 인코딩을 사용합니다. this가 담고 있는 문자가 무효한 문자인 경우, 대신 kReplacementCharacter 문자 하나를 담은 표준 문자열 객체를 반환합니다.
- explicit operator const CharType* () const noexcept
  Mchar 객체가 담고 있는 멀티바이트 문자를 그대로 반환합니다. 반환 타입 const CharType*은 const char*와 같습니다. 이 멀티바이트 문자는 사용중인 인코딩 단위전략으로 인코딩 되어 있습니다. this가 담고 있는 문자가 무효한 문자인 경우, 빈 문자열(문자 배열)을 반환합니다.
- explicit operator char32_t() const
  Mchar 객체가 담고 있는 멀티바이트 문자의 유니코드 값을 반환합니다. this가 담고 있는 문자가 무효한 문자인 경우 모든 비트가 1인 uint32_t 타입의 상수 blc::ustr::encoding::kInvalidCharacter 를 반환합니다.
- static Mchar GetReplacementChar()
  현재 사용중인 인코딩 단위전략의 인코딩으로 해석할 수 없는 문자를 만났을 때 대체할 문자를 담은 Mchar 객체를 구합니다.
관련 전역 함수
- template <typename StrType_, typename EncodingType_>
  StrType_&& operator +=(StrType_&& str, const Mchar<EncodingType_>& mch)
  표준 문자열 객체 str의 뒤에, Mchar가 담는 멀티바이트 문자를 추가합니다(StringAppend 함수와 동일한 작업을 수행합니다).
- template <typename StrType_, typename EncodingType_>
  StrType_ operator +(...)
  표준 문자열 객체와 Mchar 객체를 연결하는 연산자 입니다. 총 세 개의 오버로딩 버전이 제공됩니다.
  //-----------------------------------------------------------------------------
  
  // 1
  
  template <typename StrType_, typename EncodingType_>
  
  inline std::enable_if_t<IsString<std::decay_t<StrType_>>::value, std::remove_reference_t<StrType_>>
  
  operator +(StrType_&& str, const Mchar<EncodingType_>& mch);
  
  // 표준 문자열 객체 str 과, Mchar 객체 mch가 담는
  
  // 멀티바이트 문자를 순서대로 연결한 표준 문자열 객체(임시 객체)를
  
  // 반환합니다.
  
  // std::string 객체에는 사용중인 인코딩 단위전략에 해당하는
  
  // 인코딩으로 문자열과 문자를 연결하고, std::u16string 객체는
  
  // UTF-16 리틀엔디안, std::u32string 객체는 UTF-32 리틀엔디안
  
  // 인코딩으로 문자열과 문자를 연결합니다.
  
  //-----------------------------------------------------------------------------
  
  // 2
  
  template <typename StrType_, typename EncodingType_>
  
  inline std::enable_if_t<IsString<std::decay_t<StrType_>>::value, StrType_>
  
  operator +(const Mchar<EncodingType_>& mch, const StrType_& str);
  
  // 표준 문자열 객체 str과, Mchar 객체 mch 의 순서가 반대인 것만
  
  // 제외하면 첫 번째 오버로딩 버전과 동일합니다.
  
  //-----------------------------------------------------------------------------
  
  // 3
  
  template <typename EncodingType_>
  
  inline std::string operator +(const Mchar<EncodingType_>& lhs, const Mchar<EncodingType_>& rhs);
  
  // Mchar 객체 두개를 연결한 표준 문자열 객체
  
  // (std::string 타입 임시 객체)를 반환합니다.
  
  // 현재 인코딩 단위전략에 해당하는 인코딩이 사용됩니다.
  Mchar 객체가 담고 있는 문자가 무효한 문자인 경우, kReplacementCharacter 문자를 대신 사용하여 연결을 수행합니다.
- template <typename EncodingType_>
  std::ostream& RawPrintMchar(std::ostream& o, const Mchar<EncodingType_>& mch)
  Mchar 객체 mch가 담고 있는 멀티바이트 문자를, 인코딩 변환없이 그대로 표준 출력 스트림 o를 통해 출력합니다. 즉 출력 시 사용되는 인코딩은 현재 사용중인 인코딩 단위전략에 해당하는 인코딩 입니다. Mchar 객체가 담고 있는 문자가 무효한 문자인 경우, 대신 kReplacementCharacter 문자를 출력합니다.
- template <typename EncodingType_>
  std::ostream& operator <<(std::ostream& o, const Mchar<EncodingType_>& mch)
  Mchar 객체 mch가 담고 있는 멀티바이트 문자를, blc::ustr::encoding::DefaultEncoding 인코딩(UTF-8)으로 변환하여 표준 출력 스트림 o를 통해 출력합니다. Mchar 객체가 담고 있는 문자가 무효한 문자인 경우, 대신 kReplacementCharacter 문자를 출력합니다.

blc/ustr/blc_mchar.h - C++ 멀티바이트 문자 라이브러리