Он состоит из 8-и байт, но в оригинале, там к коду самого символа (OE2A) и довеска (0E4), этих самых довесков, добавлено совсем не мало. Просто особенность, заложенная в юникод. Этот символ легко вводится в Ворде, по коду, как ввести его с клавиатуры, я не знаю.
При переводе с тайского "а", даёт ответ "мезон". частица, бозон сильного взаимодействия, а "ส" (без крючка), переводчик пишет "пост". Чушь какая-то.
Подобный трюк раскладки и кодовой таблицы использовался ещё в ZX Спектрумах, для кодирования цвета текста и фона. Там можно было накрутить некорректное или невидимое сочетание, приводившее к затыкам при выводе текста программы на экран и трудностям в редактировании, типа защиты программы.



