μ΄ ν¬μ€ν
μ μΏ ν‘ ννΈλμ€ νλμ μΌνμΌλ‘, μ΄μ λ°λ₯Έ μΌμ μ‘μ μμλ£λ₯Ό μ 곡λ°μ μ μμ΅λλ€.
μ΄λ₯Ό λ€μ μλμ°λ‘ κ°μ Έκ°μ λ.. λ λ€μ κ²ͺκ² λλ λ¬Έμ μ μ λλ€.
μ΄ λ¬Έμ νν λ°©μμ΄λΌλ κ² λ΄μ©λ μλΉν λ§κ³ , νκ³ λ€μ΄κ°λ©΄ λ§μ λ§νΌ ν·κ°λ¦¬κ² λ©λλ€.
μ΄λ κ·Έλ΄ κ²μ΄, λλΌλ§λ€ λ¬Έμ νν λ°©μμ΄ λ€λ₯Έλ° μ€μ£½νκ² μ΅λκΉ?
μ§κΈ μ κ° λ§ν κ²λ λͺ¨λ νκΈ, μμ΄ λΏ.. μ€κ΅μ΄, μΌμ΄, μ λ½μ΄ λ±.. λ§μ μΈμ΄ 체κ³κ° μκ² μ§μ.
μ λ μ΅κ·Ό μ΄λ¬ν λ¬Έμ μ κΆκΈμ¦μ ν΄κ²°ν΄λ³΄κ³ μ λ§μ λ νΌλ°μ€λ₯Ό μ°Έκ³ νμμ΅λλ€.
보면 λ³Ό μλ‘ ν·κ°λ¦¬κ³ ... μ 리λ μ λκ³ ... νμ§λ§ λλ΅ κ°(!?)μ μ‘νμΌλ κ·Έ κ°μ μ΄ κΈ°νμ
νμ΄ λμκΉ ν©λλ€.
κ·ΈλΌ μ¬λ―Έμλ μ»΄ν¨ν° λ¬Έμ νν λ°©μ μ΄μΌκΈ°λ₯Ό μμν΄λ³ΌκΉμ...?
νΈλμ΄κ° λ΄λ°°λ₯Ό νΌλ μμ .. μ°λ¦¬λ ASCII λΌλ λ¬Έμ μ§ν©μ μ¬μ©νμμ΅λλ€.
μ΄ ASCII λ¬Έμ μ§ν©μ κ°ν νλͺ
μ μ΄λΌ ν μ μμμ§μ.
μ¬μ€ ASCII μ μ λ¬Έμ μ§ν©μ μ λ μ λͺ¨λ¦
λλ€.
μ¬ννΌ, ASCII λ¬Έμ μ§ν©μ ν¬λμ 좩격μ΄μμΌλ©°, λμ€μ λ€λ₯Έ κ΅κ°λ€μ μ λ§μ΄κΈ°λ νμμ§μ.
ASCII λ¬Έμλ Byte = Character μ λ±νΈμλ 1Byteλ©΄ μνλ²³, μ«μ, νΉμλ¬Έμ,
μ μ΄κΈ°νΈλ₯Ό ννν μ μμμ΅λλ€. 1Byte = 256 κ°μ λ¬Έμκ° ννκ°λ₯νμ§μ.
μ? 0x00 ~ 0xFF κΉμ§λκΉ λ§μ
λλ€.
νλ°, κ·Έκ²λ λ¬Έμμ΄μ λμ μ¬μ©νλ 0x00 μ μ¬μ©νλ©΄μ μ€μ λ‘λ 255κ°κ° λκ³ λ§λλ€.
μ¬κΈ°μ λμ΄λ? μ΄λ λ°μ λλ μ 128 λ°μ λμ§ μμ§μ. κ·ΈλΌ λλ¨Έμ§ 128κ°λ?
κ·Έλλ§ λ¨Έλ¦¬ μ’μΌμ λΆλ€μ΄ λμ€μ ASCIIλ‘ νν λΆκ°λ₯ν λ¬Έμκ° μκΈ°μ§ μμκΉ μκ°ν΄μ
μμ½μ ν΄λμ ¨μ΅λλ€. μ νν μμ½μ μλκ³ μ μλμ§ μμμ§μ.
κ·Έλ¦¬κ³ , λͺ ν΄κ° μ§λ μ¬μ©νμ§ μμ 128κ°λ₯Ό μ¬μ©νκ³ μΆμ΄νλ μ¬λλ€μ΄
μ겨λκΈ° μμνμ§μ. κ·Έλ΄ μ λ°μ μμ§μ. μ¬λμ΄ μμ΄λ§μΌλ‘ μ΄ μ μμ§ μλμ?
λ°₯ λ§κ³ λ°μ°¬λ λ¨Ήμ΄μΌμ§μ..-_-; κ·Έλμ! κΈ°μ‘΄ ASCII κ° 1Byte = B+00000000 μ΄λΌλ©΄
128(B+10000000) μ΄μλΆν° μ¬μ©νκΈ° μμνκ±°μ£ .
μ¬κΈ°μμ λ°λ‘ μ½λνμ΄μ§(Code page)λΌλ κ² λ±μ₯νκ² λ©λλ€.
μ½λ νμ΄μ§λ λ¬Έμ μΈμ½λ© ν
μ΄λΈ(0~255κΉμ§μ μ μλ₯Ό νννλ λΉνΈλ€μ΄ λ¬Έμμ
λ§΅ν λ λν)μΈλ° μ΅μ΄μ IBM μμ λμ¨ 437 λ§κ³ λ MSμ¬μμ λ§λ 949 λ μμ΅λλ€.
μ΄λ€μ λͺ¨λ CPXXX ννλ‘ μ°μ΄λλ° CP437, CP949 ννλ‘ λ§μ΄μ£ .
μ΄ μ½λ νμ΄μ§λκ² μκΈ°μ μ¬μ¬ λ¬Έμκ° λ°λ¨μ΄ λκΈ° μμν©λλ€.
μλ? μ½λ νμ΄μ§λ₯Ό μμμΌ λ¬Έμλ₯Ό ννν μκ° μμΌλκΉ λ§μ΄μ£ .
μ΄μ―€λλ©΄ μ¬μ¬ μλ¬Έμ΄ λ€κΈ° μμ ν κ²λλ€. 1Byteμμ ASCII λ¬Έμ 128κ° λΉΌκ³ ..
λλ¨Έμ§ 128κ°λ? λλ¨Έμ§ 128κ°λ‘ μμ΄ μΈμ λ¬Έμλ₯Ό νννλΌκ³ ? λ§μ΄λ λ©λκΉ?
λΉμ°ν μ λ©λλ€. κ·Έλμ μ΄λ¬ν νκ³λ₯Ό λννκ³ μ Byteλ₯Ό μμ νλ λ λΆμ¬μ
λ€λ₯Έ λ¬Έμλ₯Ό νννκ² λ©λλ€. μ΄λ₯Ό λκ³ μ μ λ¬Έμ μΌλ‘ DBCS(Double Bytes
Character Set)μ΄λΌ λΆλ¦¬κ² λμ§μ.
μ΄μ―€μμ λλν μ§λ¨μ΄ λ κ³³μ΄ λ€κ³ μΌμ΄λκ² λ©λλ€. λ°λ‘ μ λμ½λλ₯Ό μΈμΉλ
μ λμ½λ μ½μμμκ³Ό ISO μμ΅λλ€. μ΄ λ κ³³μμλ λ§ λ§κ³ ν λ§μ λ¬Έμ νν 체κ³λ₯Ό
ν΅ν©νλ €λ μμ§μμ΄ μμμ΅λλ€. κ·Όλ° μ¬κ³΅μ΄ λ§μΌλ©΄ λ°°κ° μ°μΌλ‘ κ°λ€κ³ ..
μ΄ λ κ³³μμ μλ‘ λ€λ₯Έ ν΅ν© 체κ³λ₯Ό λ§λ€μ΄ λμΌλ κ²°κ΅ ISOλ 10646 νμ€μ΄μκ³ ,
μ λμ½λ μ½μμμμμ μ λμ½λ(Unicode)λ₯Ό λ€κ³ λμλλ¬μ£ .
μ¬μ€ μ΄λ μΈκ³κ° μꡬνλ λ°κ° μλκΈ°μ μ΄ λ κ³³μ μλ‘ νλ ₯νκ³ κ³΅ν΅μ μΈ ν
μ΄λΈμ
λ§λ€κΈ°λ‘ ν©λλ€. κ·Έλ λ€κ³ μ΄ λ κ³³ λͺ¨λ ν΅ν© λ κ²μ μλμκ³ , κ·Έλ€λλ‘ νμ€μ λ΄λ
μ κ²μ΄μ£ .(μ§κΈ΄ μ«λ€λ μκΈ°?) λ°λΌμ μ΄ λμ κ±°μ λͺ¨λ λ¬Έμλ€μ΄ κ°μ μμΉ, λͺ
μΉμ
μ¬μ©νκ² λ©λλ€. μμΉμ λͺ
μΉμ΄ μλΉν μ€μνμ£ .
μμΉμμ λ°λΌμ ν μ΄λΈμ΄ λ°λκ² λλ λ무λ λ€νμΈκ±° μλλκΉ?
μ λ§μ κ²°κ΅ μ¬κΈ°μ μ λμ½λ(Unicode)κ° λμ€κ² λμκ³ , μ¬λλ€μ μ΄μ 2Byteλ©΄
λͺ¨λ λ¬Έμλ₯Ό ννν μ μλ€κ³ λ―Ώκ² λ©λλ€. μΆν λ―Ώμμ κ³§ κΉ¨μ§κ² λλλ° λ§μ΄μ£ ^^?
2Byteλ©΄ 16λΉνΈ μ
λλ€. B+0000000000000000(8bit * 2) λ§νΌ μ μ₯ 곡κ°μ ν λ¬Έμλ₯Ό
ννν μ μκ² λλ κ²°κ΅ 65536κ°κ° μλκ² μ΅λκΉ?
λ¬Όλ‘ μ¬κΈ°μ 0x00(NULL)μ λΉΌμ 65535κ° λκ³ λ§μ§λ§μ.
κ·Όλ° μ λ―Ώμμ κΉ¨μ§κ² λλꡬμ? λ°λ‘ λ©μ§ μν€ν
μ³λ€ λλΆμ΄μ§μ.
μ΄λ€μ΄ μλ‘ λ λ©ν° λ°μ΄νΈλ₯Ό λ€λ£° λ, λλ ν΅μ ν λ, Endian(Byte-Order) λ¬Έμ λ₯Ό
λ°μμν¨ μ₯λ³ΈμΈλ€ μ΄λκΉμ.
κ·ΈλΌ, λ¬Έμμ΄μ Endian λ°©μμ λͺ μν΄μ€μΌ νλλ° μ΄λΌ? κ·ΈλΌ 2Byteλ‘ λͺ¨μλ₯΄μ§ μμκΉμ?
λͺ¨μλ₯΄μ§μ. λΉμ°ν©λλ€. λͺ¨λ κ΅κ°μ μ¬λλ€μ΄ μ λΈλ‘κ·Έμ μμ κΈμ μ κ³ κ°λ€λ©΄ μ κ°
λͺ¨λ μ λλ‘ λ³Ό μ μμκΉμ? κ·Έ λΉμμ μλμλ κ±°μ£ . κ·Έλμ Unicode κ° μ»€μ§ νμκ°
μμμ΅λλ€. μ’λ μλ‘μ΄ κ²μ΄ λμ€λ κ² μλλΌ νμ₯μ΄λΌκ³ λ΄μΌκ² μ§μ.^^
μκΎΈ Unicode μκΈ°λ₯Ό νλλ° μ΄λ μ λμ½λ 컨μμμμμ λ΄λμ νμ€μ΄κ΅¬μ.
μ μμ ISO 10646-1μλ UCS(Universal Character Set) λΌλ μΈμ½λ© λ°©μμ΄ μμμ΅λλ€.
μ κΉ μ΄ UCSμ λν΄μ μκ°ν΄ λ리μλ©΄ μ΄λ‘ μμΌλ‘ 110λ§κ° μ΄μμ μ½λκ° μ‘΄μ¬ν©λλ€. +_+
νμ§λ§ UCS-2 μμλ κΈ°λ³Έ λ€κ΅μ΄ νλ©΄(BMP(Basic, Multilingual Plane)
λλ Plane 0)λ§μ΄ μ¬μ©λ©λλ€.
κΈ°λ³Έ λ€κ΅μ΄ νλ©΄ λ§μΌλ‘λ νκΈ λ° νμ λ± μ λμ½λμμ μ§μνλ λλΆλΆμ
λ¬Έμλ€μ΄ μ§μ κ°λ₯ν©λλ€.
λ¬Έμ λ μ°λ¦¬ κ°μ μΌλ° νλ―Όμ΄ μλλΌ μΈμ΄λ₯Ό μ°κ΅¬νλ κ³Όνμλ€ λλ¬Έμ μ΄λ»κ² 보면 λ¬Έμ κ°
λ°μνμ£ . μ°Έκ³ λ‘ BMPλ 2Byte μ
λλ€. BMP μμ μΈμλ 보쑰 λ€κ΅μ΄ νλ©΄,
μν λ¬Έμ νλ©΄ λ±μ΄ μλλ°μ. μ΄λ€μ λͺ¨λ κ³Όνμλ€μ΄ μ°κ΅¬νλ νΉμν ννλ₯Ό μν΄
λλ κ²μ΄μ£ . λ λ€λ₯Έ κ²μ΄ UCS-4 κ° ν λ¬Έμλ₯Ό νννκΈ° μν΄μ 4Byteλ₯Ό μ¬μ©νλ κ²μΈλ°μ.
UCS-2 μ UCS-4 μ μ°¨μ΄μ μ ν λ¬Έμλ₯Ό 2Byteλ‘ νννλλ 4Byteλ‘ νννλλ μ λλ€.
μμ°Έ.. UCS-2μμ νκΈμ 3Byte λΌλ μ .. μμλμꡬμ.
κ·Όλ° UCSκ° Unicodeμ λνλꡬμ?
그건 μλ λ― μΆμ΅λλ€. μλμ£ . λνλ€κ³ λ΄μΌ νλμ..-_-;;
νμ¬ λͺ¨λ Unicodeλ κ·Έ μμ¬μ UCSκ° μλ€λ 건 μμ μΌ ν λ― μΆμ΅λλ€.^^
UCSκ° μ μλ ISO 10646μ΄ λμ€κ³ μλ μ°λ¦¬λλΌμμλ 1995λ
λμ KS X 1005λ₯Ό
곡ννμΌλκΉ λ§μ΄μ£ .
μ΄ μ λλ©΄ UCSμ λν μκΈ°λ κ·Έλ§ λ¬»μ΄λκ³ μ. λ€μ λ³Έλ‘ μΌλ‘ λ€μ΄κ°κΉμ?
μκ°μ ν΄λ³΄μΈμ. κ°μ₯ μ²μμ 1Byte μλλ° 2Byte, 3, 4Byte λ‘ λ¬Έμλ₯Ό νννλ
μ΄ λ°λ 건 λꡬ? λ―Έκ΅μ΄λ μκ΅ μλκΉμ?
μλ€λ€μ μ²μλΆν° μ무 λΆνΈμμ΄ μ¬μ©νκ³ μμλλ° μκΎΈ λ΄ λλΌλ€μ΄
νκΈμ κ±Έμμμ. μ΅λ 4λ°°μ μ μ₯곡κ°μ΄ μΆκ°μ μΌλ‘ νμνκ² μκ²Όλλ° μ΄ λ°μ λ§λ νμ£ ..
κ·Έλμ λ¬Έμ νλͺ μΈ UTF-8 μ΄ μ겨λκ² λμμ΅λλ€. μ νλͺ μ΄λ..!!!
ASCII λ¬Έμλ₯Ό κ·Έλλ‘ UTF-8 μμλ 1Byteλ‘ μ μ₯ν μ μκ±°λ μ~
κ·Έλ¬λ©΄μλ κ·Έ μ΄μ νμν λ¬Έμμ½λλ 첫 λΉνΈμ 1μ λΆμ΄κ³ ,
μ΄ μ«μ 1μ μ°μμ±μ κ°μκ° μ΄ λ¬Έμκ° λνλ΄λλ° μ¬μ©λμ΄μ§
λ°μ΄νΈ μκ° λμ΄ λͺ¨λ λ¬Έμλ₯Ό ννν μ μμλ κ²μ΄μ§μ.
μμΈν μκΈ°νλ©΄ λ©ν° λ°μ΄νΈ κ²½μ° λ€μ λΉνΈκ° νΌλμ μμ§κ° μκΈ° λλ¬Έμ
λ· λ°μ΄νΈμ 첫 λΉνΈ μμ 1λ‘ νννμμ΅λλ€.
λ μμΈν μ¬νμ λ°μ κ΄λ ¨ λ νΌλ°μ€λ₯Ό 보면 μ λ³΄λ€ ν¨μ¬ μμΈν μ νν μ€λͺ
ν΄λμκΈ° λλ¬Έμ κ±°κΈ°λ‘ λκΈ°λλ‘ νκ² μ΅λλ€. μ΄λ° μΈμ½λ© λ°©μ(UTF-8)μ μ½λμ
ν¬κΈ°λ§ ν€μ°λ©΄ μλ‘μ΄ λ¬Έμλ₯Ό κ³μ λ§λ€μ΄ λΌ μλ μμ§ μμκΉμ?
νμ¬ ν κΈμ μ΅λ μΈμ½λ© ν¬κΈ°λ 6Byte κΉμ§ μλ€κ³ ν©λλ€.
κ·Όλ° UTF-8 λ§κ³ λ UTF-7 λ μκ³ UTF-16λ μμ΅λλ€. UTF-7μ κ±°μ 묻νμ§λ
λΆμκΈ°μ΄κ³ UTF-16μ MSμ¬μ μ μ±
μΌλ‘ μΈν΄ μ¬λλ°κ³ μμ§μ.
UTF-16μ BMP μμμ μνλ λ¬Έμλ€μ κ·Έλλ‘ 2Byteλ₯Ό μ¬μ©νκ³
κ·Έ μ΄μμ 4Byteλ‘ μΈμ½λ© λ©λλ€. μ΄ 4Byteλ λ΄λΆμ μΌλ‘ λ κ°μ 16Bit
λ¬Έμ(High, Low)λ‘ λ³νλμ΄ ν μμ΄ νλμ λ¬Έμλ₯Ό λνλ΄κ² λλ κ²μ΄κ΅¬μ.
MSμ¬μ μν΄ μ¬λλ°λ λ€λ λ§μ νμ¬ Windows λ΄λΆμ λ¬Έμμ΄ μ²λ¦¬λ λͺ¨λ
UTF-16μΌλ‘ μ΄λ£¨μ΄μ Έ μλ€λ κ²μ΄μ£ . μ ~~~ μμ CP949λ κ·ΈλΌ λλꡬμ?
CP949λ Windows 95μμ μ²μ μ¬μ©λμλ κ±Έλ‘ μλλ°( MSμμ μλ CP949λ₯Ό
λ§λ€μ΄ λΈ κ²μ
λλ€.) μΌλ¨ CP949λ
νμ¬ μ κ° μ¬μ©νλ XP κΈ°μ€μΌλ‘λ CMD λ λ©λͺ¨μ₯μμλ
κΈ°λ³Έ μΈμ½λ© λ°©μμΌλ‘ μ§μ λΌ μꡬμ. μ΄λ μμμ λ§ν λ΄λΆμ²λ¦¬μλ λ€λ¦
λλ€. CMDλ
λ©λͺ¨μ₯μ νλμ μ΄ν리μΌμ΄μ
μ΄λκΉ λ§μ΄μ£ (νλ©΄μ νμλλ λ°©μμ CP949, CEλ UCS-2
λ°©μμ΄λΌκ³ νλ€μ).
μ κΈ°ν 건 λμ§ μμλκΉ? 리λ μ€ κ°μ κ²½μ°λ νλμ λ°°ν¬ν CDλ₯Ό κ°μ§κ³ μμΌλ©΄
λ‘μΌμΌ μ€μ λ§ λ°κΎΈλ©΄ μ΄λ λλΌ μΈμ΄λ μ§ μ¬μ©ν μ μμμμ.
κ·Όλ° μλμ°λ ν΄λΉ λ²μ μ Windowsλ₯Ό μλ‘ μ¬μΌλμ§μ. ꡬνλ μ§..-_-;
κ²°κ΅ μΈμ΄ λ³λ‘ CDλ₯Ό λ°λ‘ μμ°ν΄λ΄κ³ μλ€λ κ²λλ€. μ! κ·Έλ΄κΉμ -_-?
κ²°λ‘ μ UTF-8μ΄ μ’λ€λ μκΈ°μΈλ°.. μλνλ©΄ μ΄ UTF-8 κ°μ κ²½μ° ASCII λ¬Έμλ₯Ό κ·Έλλ‘
μμ©νκ³ μκ±°λ μ.
1λ°μ΄νΈλ₯Ό μ΄λ μ΄μ κ° κ·Έκ±°μμμ§μ. μ΄ λλ¬Έμ UTF-8 μ ASCIIλ‘ μΈμ½λ© ν΄λ
μ ν λ¬Έμ λ μμ΅λλ€. λ¨μ§ λ΄λΆμ μΌλ‘ ASCII μ½λ μμ 0x00 μ μ½μ
μν΄μΌλ‘μ¨
UTF-8λ‘ λ³νμ΄ κ°λ₯νμ£ . κ²°κ΅ μ΄λ₯Ό λκ³ νμ νΈνμ±μ κ°μ§λ€κ³ λ§ν©λλ€.
UCS-2λ κ·Έλ¬νκ³ UCS-4λ κ·Έλ¬νκΈ΄ ν©λλ€λ§..γ
κ·Έλ¦¬κ³ μΉ μ(μ μΈκ³ μ¬λλ€μ΄ μ΄λλ νν΄ν μ μλ!! λ°λ‘ κ·Έκ³³!!)μμλ λμ±μ΄
UTF-8λ‘ λλ©΄ λ¬΄μ² μ’κ² μ§μ. κ·Έλμ μμ¦ μΉ νμ΄μ§λ€μ΄ λͺ¨λ UTF-8λ‘ λ³νλκ³ μλ
μΆμΈμ΄κΈ°λ νꡬμ.
μ΄ μ λ μ½μΌμ ¨λ€λ©΄ λͺ κ°μ§ μ 보λ₯Ό μλ €λλ¦¬κ³ λ§μΉλλ‘ νμ§μ.
λ¨Όμ , μμ λ¬Έμ μ§ν©(Character Set)κ³Ό λ¬Έμ μΈμ½λ©(Character Encoding)μ΄λ μ©μ΄λ₯Ό
μ¬μ©νμλλ° μ΄ λμ λͺ
νν νμ§ μμΌλ©΄ μλΉν ν·κ°λ¦¬κ² λ©λλ€.
μ κ° μΆ©μΌμ΄ κΈμ μΈμ½λ© μ
μ΄λΌκ³ λͺ
μν μ΄μ λ μ΄ λμ λͺ¨λ κ°λ¦¬μΌμ νλ λ§μ΄κ³ λ νꡬμ.
λ¨Όμ λ¬Έμ μ§ν©μ λν΄ λ§μλ리μ§μ.
λ¬Έμ μ§ν©μ μ½κ² λ¬Έμμ λ²νΈλ₯Ό λ§€κΈ΄ ν
μ΄λΈμ΄λΌ ν μ μμ΅λλ€.
νλμ 체κ³λ₯Ό λνλ΄λ κ²μ΄μ§μ. λ°λΌμ λ¬Έμ μΈμ½λ©κ³Όλ ꡬλΆμ΄ λꡬμ.
νλμ λ¬Έμμ§ν©μ μ¬λ¬ κ°μ λ¬Έμ μΈμ½λ©μ κ°μ§ μκ° μκ² μ§μ. ASCII, KS X 1001,
Unicode κ° λ¬Έμ μ§ν©μ΄ λλ κ²μ
λλ€.
λ¬Έμ μΈμ½λ©μ λ§μ΄μ§μ. μ΄ λ¬Έμ μ§ν©μ μ»΄ν¨ν°μ μ μ₯νκ±°λ ν΅μ μ μ¬μ©λ λͺ©μ μΌλ‘
λ°μ΄νΈ ννλ‘ λ³νμ μμΌμΌ νλλ° λ§μ΄μ£ . μ΄λ λ¬Έμ μ½λλ₯Ό λ°μ΄νΈ ννλ‘ λνλ΄λ
λ°©μμ μΈμ½λ©μ΄λΌ ν©λλ€. κ·Έλ¬λ, μ΄λ€μ λ¬Έμ μ§ν©κ³Όλ ꡬλΆμ΄ λκ² μ§μ.
μ’
λ₯λ EUC-KR, CP949, UCS, UTF λ±μ΄ μλ κ²μ΄μ§μ.
κ²°κ³Όμ μΌλ‘ UCS, UTF λͺ¨λ Unicode μ΄λλλλ€~.
λ°©κΈ EUC-KR μ΄ λμλλ°μ. μ΄λ 무μν μ μμ΄ μμ£Ό λ³Ό μ μλ λ¬Έμ μΈμ½λ© λ°©λ²μ λλ€.
EUC(Extended Unix Code: νμ₯ μ λμ€ μ½λ) λΌκ³ ν΄μ 10μ μ€μμ kldpμμ cp949μ ν¨κ»
λ
Όμμ΄ λμλ λ°©μμ΄κΈ°λ νμ§μ.
EUC-KRμμλ μμ΄λ KS X 1003(μ μ΄λ¦:KSC 5636,μ¬κΈ°μ ASCII λ¬Έμμ λν νμ€μ΄
κΈ°μ λμ΄ μμ) νκΈμ KS X 1001(μ μ΄λ¦:KSC 5601)μ μ¬μ©νλλ°μ.
μ΄λ¬λ©΄ μμ΄λ 1Byte, νκΈμ 2Byteλ₯Ό μ¬μ©ν΄μ ννλ©λλ€.
κ·Όλ° μμ΄λ¬λνκ² μ¬κΈ°μλ λ¬Έμ κ° λ°μνκ±°λ μ. λ°λ‘ νκΈμ μ΅λμ λ¬Έμ μ
μ‘°ν©νVSμμ±νμ΄λ λ¬Έμ μ΄μ£ .
μ΄ EUC-KR μ΄λ λμ΄ μμ±νμΈλ° μμ±νμ΄λ€ 보λ νκΈμ 2350μ λ°μ ννμ λͺ»νμ΅λλ€.
κ·ΈλΌ μμ¦ μ ννλ ν΅μ λ¬Έμ(μνν,λ·) λ±λ μ§μ λͺ»νκ² λꡬμ.
ν¬μ€μ½ 건μ€μ λμΎ(The #)λ μ§μ λͺ»νκ² λ©λλ€. μμ±νμ μ΅λμ λ¬Έμ μ μ΄μ§μ.
μ΄λ¬ν λ¬Έμ μ μ κ°μ§κ³ μλ KS X 1001 μ΄μμ§λ§
κ²°κ³Όμ μΌλ‘ EUC-KR μΈμ½λ©μ΄ μ΄ λ°©μμ μ¬μ©νκ³ μμ΅μ£ ..
νλ°, μ΄ EUC-KR μ΄λ λμ κ°μ§κ³ , MS μ¬μμ CP949 ννλ‘ νλ°κΏ νλ€λ κ²μ λλ€.
κ·Έλμ Windowsμμ EUC-KR λκ±Έ λ€μ΄ λ³Έμ μ΄ μμ κ²λλ€. λΉμ°ν MSμμ Unixκ°
λ€μ΄κ° κ±Έ μ¬μ©ν 리 λ§λ¬΄νμ§μ. μ΄μ μΆκ°ν΄μ μ΄ CP949 λ λμ΄ μμ±ν νκΈμ΄κΈ΄ νλ°
μκΈ°λ€λ€μ΄ μμλ‘ μ‘°ν©ν κΈμλ₯Ό λͺκ° μ§μ΄λ£μμ£ . κ·Έ μΆκ°νκ².. λλ΅ 8μ²μ¬μμ―€ λ κ²λλ€.
그리곀 μ΄λ¦μ νμ₯ μμ±νμ΄λΌκ³ μΈκΈνμμ£ .
κ·Όλ° λλ΅ KS X 1001κ³Ό νΈνμ±μ κ°μ ΈμΌ λλκΉ κΈ°μ‘΄ μ½λλ κ·Έλλ‘ λλκ³ μΆκ°μ μΈ
μ½λλ₯Ό μκ³Ό λ€μ μΆκ°μμΌ°λ€λ κ²μ΄μ§μ. ν λ§λλ‘, μ½λκ° λ¬Έμμ μ λλ‘ νμμ κ°μΆκ³
λ§€μΉμ΄ μ λλ€λ κ²μ
λλ€.
κ·Έλμ κ·Έ λ¬Έμ ν μ΄λΈμ μ λ ¬ μν€κ² λλ©΄ μμκ° λ€μ£½λ°μ£½ λκ² λΌ λ²λ¦¬κ³ λ§μ§μ.
λ κ·Έλ¬λλ¬μ΅λλ€. μ°ΈμΌλ‘ μμ¬κ° κΉκ³ μνν νμ§ μμ μκ° μμ΅λλ€.
κ΅³μ΄ EUC-KRλ 2350 μ μ΄μΈμ κΈμ μΈ μ μλ€κ³ ν©λλ€. KS X 1001 λΆλ‘3μ
λμμλ€κ³ νλ€μ. νμ§λ§ μ΄λ₯Ό MSκ° μ§μνμ§λ₯Ό μμμΌλ λ§μ§± λλ£¨λ¬΅μ΄ λΌ λ²λ¦° κ²μ΄μ£ .
μ κ° μ¬κΈ°μμ λ§μ λλ¦° 건 λΉμ°μ μ΄κ° λ°μ λμ§ μμ΅λλ€.
λ΄λΆμ μΌλ‘ μΈμ½λ© κΈ°μ λ°©μλ μΈκΈν΄μΌ νκ³ , λ€λ₯Έ μ½λ λ
Όμ μ¬νλ μλΉν λ€μνκ³
λ§μ΅λλ€. μ΄λ€μ κ° μκ° νμν λ 곡λΆνλ κ² μ’μ κ±° κ°κ΅°μ.
μλμ λμμ΄ λ λ§ν λ§ν¬ μ¬μ΄νΈλ₯Ό λ§μ΄ λ¬μλμ΅λλ€.
μ λ μ΄μ°¨νΌ λ νΌλ°μ€λ₯Ό λ³΄κ³ κ³΅λΆνκ±°κ³ (μ κ° μ΄κ±Έ μ€μ€λ‘ μ 리λ μμ§ μμ΅λκΉ?)
λ μμΈν λ΄μ©λ μμ κ²μ
λλ€. λ¬Όλ‘ μ λ΄μ© μ€μ μΌ λΆλΆμ΄ νλ¦° κ²μΌ μλ μκ² μ§μ. ^^;;
μ λμ€/리λ μ€ μ¬μ©μλ₯Ό μν UTF-8 λ° μ λμ½λ κ΄λ ¨
http://unix.co.kr/HOWTO/UTF8-Unicode-KLDP/UTF8-Unicode-KLDP.html#toc15
μν€λ°±κ³Ό, Wikipedia
λ¬Έμμ§ν©, μΈμ½λ© κ·Έλ¦¬κ³ μ λμ½λ
http://sparcs.kaist.ac.kr/seminar/pcpenpal-20080117-1.pdf
λ§μ Gooooooooooooooooooooooooooogle λ¬Έμλ€
EUC-KR, UTF8 μ λν κ°λ²Όμ΄ λ Όμ