ข้ามไปเนื้อหา

UTF-16/UCS-2

จากวิกิพีเดีย สารานุกรมเสรี

16 bit Unicode Transformation Format (UTF-16) เป็นการเข้ารหัสตัวอักษรสำหรับยูนิโคดในคอมพิวเตอร์ ซึ่งสามารถเข้ารหัสตัวอักษรในยูนิโคดได้ทั้งหมด โดยปกติแล้วแล้วหนึ่งตัวอักษรมีขนาด 16 บิตหรือ 2 ไบต์ ขึ้นอยู่กับวิธีการเข้ารหัสของเครื่อง

ตัวอย่าง

[แก้]
รหัส ตัวอักษร ค่ารหัส UTF-16 แบบแสดง*
122 (hex 7A) Z ตัวเล็ก (อักษรลาติน) 007A z
27700 (hex 6C34) น้ำ (ภาษาจีน) 6C34
119070 (hex 1D11E) musical G clef D834 DD1E 𝄞
"水z𝄞" (น้ำ, z, G clef), ในการเข้ารหัสแบบ UTF-16
แบบการเข้ารหัส การเรียงลำดับไบต์ (byte order) ลำดับไบต์ (byte sequence)
UTF-16LE little-endian 34 6C, 7A 00, 34 D8 1E DD
UTF-16BE big-endian 6C 34, 00 7A, D8 34 DD 1E
UTF-16 little-endian, with BOM FF FE, 34 6C, 7A 00, 34 D8 1E DD
UTF-16 big-endian, with BOM FE FF, 6C 34, 00 7A, D8 34 DD 1E

แบบแสดงที่ท่านเห็นอาจไม่ถูกต้อง ขึ้นอยู่กับฟอนต์และซอฟต์แวร์ที่ท่านใช้

อ้างอิง

[แก้]

ดูเพิ่ม

[แก้]

แหล่งข้อมูลอื่น

[แก้]