ZHENGMA (郑码) (ЧжэнМа [код Чжэна])
A Brief Introduction for English Speakers
(краткое введение для англоговорящих)
Learning Chinese Characters by Typing Them on the Computer
(изучение китайских символов печатанием их на компьютере)
By MEGATRON COOKIE (от Мегатрона Куки)
September 2008 (сенябрь 2008)
    —— • ——
  1. INTRODUCTION (введение)
  2. QUICK START (быстрый старт)
  3. LEGO A CHINESE CHARACTER
    (собирай китайский символ)
  4. DISSECT A CHINESE CHARACTER
    (рассекай китайский символ)
  5. FURTHER EXPLORATION
    (дальнейшее исследование)
  6. APPENDIX (приложение)
    —— • ——
  1. INTRODUCTION (введение)

    Nowadays Pinyin (拼音) is the most popular method to enter Chinese characters into the computer (нынче пиньинь является наиболее популярным методом вводить китайские символы в компьютер). This method is based on the pronunciation (Pinyin) of the Chinese character, which can be “spelled out” with 26 English alphabetic letters on a regular keyboard (этот метод основан на произношении /пиньине/ китайских символов, которое может быть составлено с 26 буквами английского алфавита на обычной клавиатуре).

    The obvious caveat is that many Chinese characters share the same pronunciation, though bearing completely different meanings (очевидное предостережение — то, что многие китайские символы разделяют одно и то же произношение, однако неся совершенно разные значения). For example, the Pinyin “zhi bing” matches the pronunciation of both “治病” and “致病” (для примера, пиньинь „zhì bìng“ [чжи бин] подходит произношению обоих „治病“ и „致病“). The former means “curing of the disease” and the latter means “causing the disease” (предыдущее значит „лечение болезни“, а последнее значит „причиняя болезнь“). (Yes, read the label carefully next time you try some herbal medicine.) (да, читайте внимательно в следующий раз, когда вы пробуете какую-нибудь травяную медицину)

    So this phonetic input method requires the user to interactively select the Chinese character among possible candidates after he/she spells out the Pinyin (так что фонетический метод ввода требует от пользователя интерактивно выбирать китайский символ среди возможных кандидатов после того, как он или она составит пиньинь).

    For example, to type the Chinese character 早 (morning or early) using Pinyin, one needs to type “zao” and more than 10 possible candidates pop out on the computer screen (для примера, чтобы напечатать китайский символ 早 [zǎo, цзао] /утро или рано/, используя пиньинь, нужно напечатать „zao“, и более, чем 10 возможных кандидатов, выскакивают на экран компьютера). Fortunately, number 1 matches what we intend to type, so the user would key in “1” or just spacebar to select that character (к счастью, номер 1 подходит тому, что мы планируем напечатать, так что пользователь бы нажал „1“ или просто пробел, чтобы выбрать тот символ).

    Fig. 1. Choose from multiple Chinese characters with Pinyin input method
    (Рис. 1. Выбирать из многочисленных китайских символов с методом ввода пиньинь)

    This extra interaction step slows down the speed at which a professional typist can feed Chinese into the computer, since he/she needs to constantly switch attention between the original paper document and the electronic version on the computer screen (этот дополнительный шаг взаимодействия снижает скорость, на которой профессиональный оператор может вводить по-китайски в компьютер, поскольку ему или ей нужно постоянно переключать внимание между исходным бумажным документом и электронной версией на экране компьютера).

    So in the beginning, people invented a different category of input methods (так что в начале люди изобрели другую категорию методов ввода). They are called XingMa (stroke-encoding) (они названы СинМа /кодирование черт/ [型码, „код формы“]). These methods assign codes (usually 4-letter or less) for each Chinese character based on how the character is written (i.e. stroke, root and structure), which leaves almost no ambiguity (эти методы назначают коды /обычно 4-буквенные или меньше/ для каждого китайского символа, основанные на том, как символ написан /т.е. черта, корень и структура/, которые почти не оставляют неоднозначности).

    ZhengMa (郑码) is one of the best XingMa input methods (ЧжэнМа /код Чжэна/ является одним из лучшим СинМа-методов ввода). Fig. 2. shows an example of typing the same character 早 (morning or early) using ZhengMa (рис. 2. показывает пример печати того же символа 早 /утро или рано/, используя ЧжэнМа). Its code is “ked”, which happens to bring up a second character 旪 (его код — „ked“, который, оказывается, преподносит второй символ 旪 [xié, се; соглашение, взаимопомощь]). You may have noticed that both characters share similar features (вы можете заметить, что оба символа разделяют сходные признаки). That is, they are made of the same parts: 日 and 十 (called roots), but have different structures (i.e. one is top-bottom, the other is left-right) (то есть они сделаны из одних и тех же частей: 日 [rì, жи; солнце, день] и 十 [shí, ши; десять, совершенно, полностью] /названных корнями/, но имеют разные структуры /т.е. один — сверху вниз, другой — слева направо/).

    Fig. 2. Input a Chinese character with ZhengMa
    (Рис. 2. Ввести китайский символ с ЧжэнМа)

    By the way, 旪 is such an ancient and obsolete character, it is safe to say that 95% of the Chinese speaking population don’t know how to pronounce it (кстати, 旪 — такой древний и устарелый, что без опаски можно сказать, что 95% по-китайски говорящего населения не знют, как произносить его). (Try typing that with Pinyin, if you can.) (попробуйте напечатать его c пиньинем, если вы можете)

    There are some six thousand frequently used Chinese characters that, at first look, all have distinctive shapes (существуют примерно шесть тысяч часто используемых китайских символов, которые, на первый взгляд, все имеют отличительные формы). (Just the characters in Fig. 1 can give you an idea.) (как раз символы на рис. 1 могут дать вам представление) To uniquely encode each character isn’t an easy task at all (уникально закодировать каждый символ — вовсе не простая задача). Remember that this isn’t the same as assigning a number (like the 16-bit binary Unicode) to each character (помните, что это не то же самое как назначение числа /подобно 16-битному двоичному уникоду/ каждому символу). A human typist needs to be able to retrieve each code from his/her brain when typing the Chinese character (человеку-оператору нужно быть способным доставать каждый код из своего мозга во время печати китайского символа).

    Since humans are usually equipped with a small size memory, but are good at logic deduction (поскольку люди обычно экипированы малого размера памятью, но хороши в логическом умозаключении). ZhengMa is one of the most “easy” stroke-encoding methods (ЧжэнМа является одним из самых простых методов кодирования черт). Because most of its encodings are highly logical and can be deduced by a few generalized rules (потому что большинство его кодирований чрезвычайно логичны и могут быть вычислены несколькими обобщёнными правилами). (We will describe these in detail later.) (мы опишем их в деталях позже) But still the codes of some basic building blocks (roots) need to be memorized (e.g. k for 日, ed for 十) (но всё же коды некоторых основных строительных блоков /корней/ должны быть запомнены /напр., k для 日, ed для 十/). The memorization of these root codes poses a steep learning curve, which impedes the wide spread of almost all stroke-encoding methods (запоминание кодов этих корней ставит крутой график обучения, который препятствует широкому распространению почти всех методов кодирования черт).

    It’s not surprising that, over the time, the Pinyin method wins the popularity vote, due to its ease of use, as well as another important reason (это не удивительно, что со временем метод пиньинь выигрывает голосование по популярности, из-за его простоты использования, а также другой важной причины). When typing Chinese character by Pinyin, there are far less ambiguities, if one choose to combine the characters into 2-character to 4-character phrases (во время печати китайского символа пиньинем существует гораздо меньше неоднозначностей, если решаете комбинировать символы в 2-символьные — 4-символьные фразы).

    For example, to type the phrase 计算机 (computer) by Pinyin is (для примера, напечать фразу 计算机 [цзи суань цзи] /компьютер/ пиньинем — это) “ji suan ji”. There is only one possible candidate to choose from (существует только один возможный кандидат на выбор). In fact, one may even reduce the keystrokes to “ji s ji” and the computer will respond with the same characters (фактически, можно даже уменьшить нажатия клавиш до „ji s ji“, и компьютер ответит теми же символами).

    So in general, the longer the phrase into which the user groups the Chinese characters, the more probable he/she gets the intended input into the computer (итак в общем, чем длиннее фраза, в которую пользователь группирует китайские символы, тем более вероятно, что он или она получают планируемый ввод в компьютер). With almost no training, a regular Chinese speaking computer user can type in Chinese characters at a reasonable speed by Pinyin (почти без тренировки обычный говорящий по-китайски компьютерный пользователь может напечатать китайские символы с приемлемой скоростью пиньинем).

    Do all these reasons make the stroke-encoding method completely obsolete (делают ли эти причины методы кодирования черт совершенно устарелыми)? Probably not (вероятно, нет).

    Traditionally one argument for the stroke-encoding method is that single character rather than multi-character phrases are the main constituent of the Chinese language, and Pinyin is a degenerative way of representing the language.[ 1 ] (традиционно один аргумент в пользу метода кодирования черт — то, что одиночный символ скорее, чем многосимвольные фразы, является главной составляющей китайского языка, и пиньинь является вырождающимся путём представления языка) More importantly, new multi-character phrases are being conjugated, as well as old ones phasing out, quickly every day (более важно, что новые многосимвольные фразы являются сочленёнными, так же как старые выходят из употребления, быстро каждый день). And the Pinyin input method (a phonetic method) that relies on matching phrases “intelligently” would find itself difficult to keep up with the fast evolving language (и метод ввода пиньинь /фонетический метод/, который полагается на сопоставление фраз интеллектуально, оказался бы трудным, чтобы поддерживать на уровне с быстро эволюционирующим языком).

    In reality, on the contrary, with the techniques of updating phrase database over the Internet and dynamically adjust/predict phrase candidates based on usage, Pinyin turns out to be very effective at keeping pace with the modernizing language (в реальности, наоборот, с техниками обновления фразовой базы данных через интернет и динамически подстраивать/предсказывать фразы-кандидаты, основанные на использовании, пиньинь, оказывается, является очень эффективным при сохранении темпа с модернизирующимся языком). In fact, it becomes so successful that the popular misuses of the phrases that brew out of BBS or Internet chat room often “contaminate” the formal use of the language (фактически, он становится так успешен, что популярные злоупотребления фразами, что варятся из электронных объявлений или интернет-болтовни, часто „загрязняют“ формальное использование языка).

    Just recently (8/14/2008), one article in a Beijing evening newspaper, reporting on a woman Olympic gold medalist, mistakenly used the phrase “故娘” in its title (как раз недавно /14.08.2008/ [во время XXIX Летней Олимпиады в Пекине] одна статья в пекинской вечерней газете, сообщающая о женщине, олимпийской золотой медалистке, ошибочно использовала фразу „故娘“ [gùniáng, гунян] в своём заголовке). It should be 姑娘 meaning “young lady”, and 故娘 which has the same pronunciation, in some context, could mean “deceased lady” (ей бы быть 姑娘 [gūniáng, гунян], означая „молодая леди“, а 故娘, которая имеет то же произношение, в некотором контексте могла бы значить „скончавшая леди“). That is probably a mistake caused by Pinyin input method (это, вероятно, ошибка, вызванная методом ввода пиньинь). (No “spelling check” possible, since both phrases spell exactly the same in Pinyin.) (нет возможной проверки правописания, поскольку обе фразы составляют в точности одно и то же в пиньине)

    Interestingly, on the other hand, since ancient Chinese poems and classical literature do rely heavily on isolated Chinese characters, and these Chinese characters/phrases barely have frequent daily usage in the modern language, they easily fall into the blind spot of Pinyin input method (интересно, с другой стороны, поскольку древние китайские поэмы и классическая литература действительно полагаются сильно на отдельные китайские символы, и эти китайские символы/фразы едва ли имеют частое повседневное применение в современном языке, они легко попадают в слепое пятно метода ввода пиньинь).

    For example, below is the beginning of a long Chinese classical verse (для примера, ниже начало длинного китайского классического стиха). It is at least time consuming, if not error-prone, to type these characters by Pinyin (это как минимум затратно по времени, если не подвержено ошибкам, чтобы напечатать эти символы пиньинем).

    « 浔阳江头夜送客,枫叶荻花秋瑟瑟。 »
    (Бо Цзюй-и [白居易], «Лютня» [琵琶行] :
    xún yáng jiāng tóu yè sòng kè, fēng yè dí huā qiū sèsè;
    сюнь ян цзян тоу е сун кэ, фэн е ди хуа цю сэсэ;
    возле омута солнечный берег реки вечером провожает гостей,
    кленовый лист, мискантуса цветок, осени шелест
    )

    (The above characters were typed by ZhengMa.) (символы выше были напечатаны с ЧжэнМа)

    So why is ZhengMa relevant for English speakers who are interested in learning (or playing with) Chinese characters (так почему является ЧжэнМа значимым для англоговорящих, которые заинтересованы в изучении /или игре с/ китайскими символами)?

    First of all, in addition to listening/speaking Chinese, the ability to read/write Chinese is naturally the next step in learning the language (прежде всего, вдобавок к слушанию/разговору по-китайски, способность читать/писать по-китайски является естественно следующим шагом в изучении языка). After all the beauty of Chinese lies in part in her hieroglyphic characters (в конце концов красота китайского лежит частично в его иероглифических символах). Isn’t it fascinating that 山 (mountain) looks like a mountain, 月 (moon) looks like the moon, and 日 (sun), 月 (moon) together become 明 (bright) (это ли не увлекательно, что 山 [shān, шань] /гора/ выглядит как гора, 月 [yuè, юэ] /луна/ выглядит как луна, и 日 /солнце/, 月 /луна/ вместе становятся 明 [míng, мин] /светлый/).

    By learning the 26+ building blocks (roots) in ZhengMa, one can start building Chinese characters on the computer (изучением 26 с лишним строительных блоков /корней/ в ЧжэнМа можно начать построение китайских символов на компьютере). Call that the ultimate LEGO experience (назовите это крайним случаем конструктора ЛЕГО). It’s going to be a fun way to get to know Chinese characters (это обещает быть забавным способом начать узнавать китайские символы).

    Secondly, what is even better, by knowing its encoding rules, one can use ZhengMa to type a Chinese character even without knowing its pronunciation or meaning at first (во-вторых, что даже лучше, со знанием его правил кодирования можно использовать ЧжэнМа, чтобы напечатать китайский символ даже без знания его произношения или значения сперва). In fact, with 26 root characters and some logically derived sub-roots, one can, in theory, type almost 60,000+ Chinese characters into the computer (фактически, с 26 корневыми символами и некоторыми логично произведёнными подкорнями, можно, в теории, вбить почти 60 тысяч с лишним китайских символов в компьютер). (Remember that “old” saying, if you can type it in the computer, you can google it.) (помните ту „старую“ поговорку: если ты можешь вбить это в компьютер, ты можешь загуглить это)

    The main objective of this article is not to train you (English speakers) to be a professional typist (at 200+ characters/minute input rate, which can be achieved through practicing though) (главная задача этой статьи — не тренировать вас /англоговорящих/ быть профессиональным оператором /при показателе ввода в 200 с лишним символов в минуту, который может быть достигнут через практику тем не менее/). The aim is to reveal the intellectually rewarding fun behind typing Chinese characters with ZhengMa, a really good stroke-encoding method (цель — открыть интеллектуально полезную забаву за печатью китайских символов с ЧжэнМа, действительно хорошим методом кодирования черт). So it becomes unimportant to memorize the codes for root characters, to discuss speed-typing the characters with shortcut codes, etc (так что становится незначительным запоминать коды для корневых символов, обсуждать скоростную печать символов с укороченными кодами и т.п.). Without these hurdles, it turns out that ZhengMa is no longer difficult to learn at all, even for the English speakers.[ 2 ] (без этих препятствий оказывается, что ЧжэнМа больше вовсе не трудно изучать, даже для англоговорящих)


    [ 1 ] Literate Chinese speakers, who are used to word processing on the computer with Pinyin, often find themselves scratching the head when it comes to write the Chinese characters by hand (грамотные говорящие по-китайски, которые привыкшие к обработке текста на компьютере с пиньинем, часто обнаруживают себя скребущими голову, когда приходится писать китайские символы вручную). The symptom is called 提笔忘字 (симптом назван 提笔忘字 [tí bǐ wàng zì, ти би ван цзы; взявшись за кисть, позабыть иероглифы]). ZhengMa can help cure such memory losses (ЧжэнМа может помочь вылечить такие потери памяти). (no meditation needed) (медитация не нужна)
    [ 2 ] Partially inspired by and derived from ZhengMa (郑码), Wubi (五笔) is another popular stroke-encoding input method (частично вдохновлённый и производный от ЧжэнМа, Уби /пять черт/ является другим популярным методом ввода кодированием черт).
    A wonderful tutorial for English speakers can be found at (чудесное пособие для англоговорящих может быть найдено на) www.yale.edu/chinesemac/wubi/xing.html
    Choosing the input method is like picking a programming language (выбор метода ввода подобен подбору языка программирования). Religious war can be fanned by arguing which input method (or similarly programming language) is better (религиозная война может быть раздута спором, какой метод ввода /или подобным образом язык программирования/ является лучшим).
    Suffice to say, Wubi has more users and thus more study/help material can be found on the Internet (достаточно сказать, Уби имеет больше пользователей, и таким образом больше учебного/вспомогательного материала может быть найдено в интернете). On the other hand, ZhengMa is more complete and consistent in its encoding (с другой стороны, ЧжэнМа более полный и последовательный в его кодировании). It is also shipped by default with almost every version of MS-Windows operating system (он также является поставляемым по умолчанию почти с каждой версией операционной системы ЭмЭс-Виндоус). This article is an effort to fill in the lack of introduction material to this wonderful, but less known input method (эта статья — попытка заполнить нехватку вводного материала к этому чудесному, но менее известному методу ввода).

  2. QUICK START (быстрый старт)

    ZhengMa is shipped by default with almost every version of MS-Windows operating system (ЧжэнМа является поставляемым по умолчанию почти с каждой версией операционной системы ЭмЭс-Виндоус). You should have added Chinese language support in Windows International Settings already (вам бы иметь уже добавленной поддержку китайского языка в меджународных настройках Виндоус). Here is a test page to see if your operating system can display Chinese characters properly : en.wikipedia.org/wiki/Chinese_language (вот одна тестовая страница, чтобы увидеть, может ли ваша операционная система отображать китайские символы должным образом : ru.wikipedia.org/wiki/Китайский_язык )

    (google: Microsoft windows read Chinese, if you need help) (погуглите, если вам нужна помощь)

    ZhengMa can be added as one of the Chinese input methods (Fig. 3.), in addition to, for example, Microsoft Pinyin (ЧжэнМа может быть добавлен как один из методов ввода китайского /рис. 3/, вдобавок, например, к Майкрософт Пиньиню).

    Fig. 3. Add ZhengMa as a Chinese input method
    (Рис. 3. Добавить ЧжэнМа как метод ввода китайского)

    (google: Microsoft chinese IME, if you need help) (погуглите, если вам нужна помощь)

    And the ZhengMa input language bar can be evoked, which looks like Fig. 4 on an English version of Windows XP.[ 3 ] (и языковая панель ввода ЧжэнМа может быть вызвана, что выглядит подобно рис. 4 в английской версии Виндоус ЭксПи)

    Fig. 4. Language bar for ZhengMa input method
    (Рис. 4. Языковая панель для метода ввода ЧжэнМа)

    Now you can open a text editor (e.g. Notepad) and start typing Chinese (теперь вы можете открыть текстовый редактор /напр., Блокнот/ и начать печать по-китайски). As a quick start, let’s begin with the first 7 characters of that ancient Chinese verse (в качестве быстрого старта, давайте начинать с первых 7 символов древнекитайского стиха): 浔阳江头夜送客 by typing (печатанием):

    vxds yk vbi tgd snr wug wdrj

    (Press space-bar in between the letters to confirm the Chinese character selection, if necessary (нажимайте пробел между буквами, чтобы подтвердить выбор китайского символа, если необходимо). Extra spacebar may accidentally bring up multi-character phrases.) (дополнительный пробел может случайно преподносить многосимвольные фразы)

    Isn’t that fun, the computer seems to be able to respond to these mysterious letters (это ли не забавно, компьютер, кажется, способен отвечать этим таинственным буквам). It’s only the beginning of fun, wait till you know how to compose the codes yourself.[ 4 ] (это лишь начало забавы, подождите до того, как вы узнаете, как составлять коды самим)


    [ 3 ] There are fan DIY software to attach ZhengMa input method to SCIM (input method framework under Linux) (существует любительское самодельное программное обеспечение, чтобы прикрепить метод ввода ЧжэнМа к SCIM [Smart Common Input Method, умному общему методу ввода] /каркасу методов ввода под Линуксом/). For MAC users, such patching may undergo OpenVanilla or FIT (для пользователей Макинтоша, такая заплатка может идти под OpenVanilla или FIT). QIM supports ZhengMa, but it isn't a free software (QIM поддерживает ЧжэнМа, но это не бесплатное программное обеспечение).
    [ 4 ] A complete root code diagram is attached in the Appendix (полная схема корневых кодов прикреплена в приложении). It may seem intimidating at first look (это может казаться пугающим на первый взгляд). But it's just like the many dials in the cockpit of an airplane (но это просто как множество приборов в кабине самолёта). Once you know how things are organized, it's not that complex after all (как только вы узнаёте, как вещи организованы, это не так сложно в конце концов).

  3. LEGO A CHINESE CHARACTER (собирай китайский символ)

    There are basically five kinds of strokes to write a Chinese character by hand (существует в основном пять видов черт, чтобы написать китайский символ вручную). In ZhengMa, they are coded by five letters (в ЧжэнМа они кодированы пятью буквами): A, I, M, S and Y.

    • A 	: 一 (yī, и)
    • I 	: 丨 (gǔn, гунь)
    • M	: 丿 (piě, пе)
    • S 	: 丶 (zhǔ, чжу)
    • Y 	: 了 (le, лэ)

    If you type “ai”, the computer will respond with a Chinese character 丁, which is composed of these two strokes: 一 and 丨 (если вы печатаете „ai“, компьютер ответит китайским символом 丁 [dīng, дин], который составлен из этих двух черт: 一 и 丨).

    One of my primary school classmates has the first name 丁 (один из моих одноклассников в начальной школе имел имя 丁). Like Bart Simpson, when a kid gets into trouble in the school, as punishment, he is forced to write his name repeatedly on the blackboard (подобно Барту Симпсону, когда ребёнок попадает в неприятность в школе, в качестве наказания его заставляют писать своё имя многократно на классной доске). 丁 was never afraid of doing so because his name only has two simple strokes (丁 ни разу не был напуган таким делом, потому что его имя имеет лишь две простые черты). (Talk about parents foreseeing a kid’s future) (говорит о родителях, предвидящих будущее ребёнка) By the way, the series of comic strips “The Adventures of Tintin”, its hero Tintin has his name in Chinese (кстати, о серии комиксов „Приключения Тинтина“, её герой Тинтин имеет своё имя в китайском): 丁丁.

    Another example, “ya” yields 子, meaning son (другой пример, „ya“ приносит 子 [zǐ, цзы], означающий „сын“).

    The real tricky part is how do you know the order of the strokes, whether it is “ay” or “ya” (настоящая мудрёная часть — это как вы узнаёте порядок черт, является ли это „ay“ или „ya“). The general rule is to write from left to right, and from top to bottom (основное правило — писать слева направо и сверху вниз). For characters with few strokes or convoluted structures, the rule isn’t that inclusive (для символов с немногими чертами или запутанной структурой правило не является включающим). However you don’t need to take a 3-credit-hour Chinese course or have a Chinese tutor to know the stroke nuances (однако вам не нужно брать 3 часа в неделю обязательных занятий курса китайского или иметь китайского репетитора, чтобы знать нюансы черт). ZhengMa on your computer is your best tutor, just trial and error, see whether the computer agrees with your stroke order (ЧжэнМа на вашем компьютере — ваш лучший репетитор, просто проба и ошибка, смотрите, соглашается ли компьютер с вашим порядком черт).

    However these five strokes are too simple to be useful (однако эти пять черт — слишком просто, чтобы быть пригодным). Because a 20+ strokes Chinese character may require 20+ keystrokes to input, stroke by stroke like this (потому что китайский символ из 20 с лишним черт может потребовать 20 с лишним нажатий клавиш, чтобы ввести вот так черту за чертой). That’s definitely too cumbersome (это определённо слишком громоздко). So ZhengMa’s inventor came up with larger “LEGO” bricks, called roots (coded by single letters from A-Z) and sub-roots (coded by 2 alphabetic letters) (так что изобретатель ЧжэнМа предложил бóльшие кирпичики „ЛЕГО“, названные корнями /кодированные одиночными буквами из A-Z/ и подкорнями /кодированные 2 буквами алфавита/). Both the roots and sub-roots are frequently used building blocks of Chinese characters (и корни, и подкорни — часто используемые строительные блоки китайских символов). With the help of these sub-structures, ZhengMa can code each Chinese character with no more than 4 letters (с помощью этих подструктур ЧжэнМа может кодировать каждый китайский символ не более, чем 4 буквами).

    But still these five strokes (A, I, M, S, Y) are the most important elements of any stroke-based encoding system (но всё же эти пять черт /A, I, M, S, Y/ — наиболее важные элементы любой основанной на чертах системы кодирования). If you are into computer programming languages, these five strokes are just like “primitives” (or keywords) of a programming language (если вы в компьтерных языках программирования, то эти пять черт — просто как „примитивы“ /или ключевые слова/ языка программирования). The various roots are like built-in function libraries (or API calls) (различные корни подобны встроенным библиотекам функций /или вызовам API [Application Programming Interface, интерфейса прикладного программирования]/).

    Of course, the third most important part of a programming language is “the rules of combination”, i.e. how to write your own function/code (конечно, третья наиболее важная часть языка программирования — „правила сочетания“, т.е. как писать вашу собственную функцию/код). In the context of ZhengMa, how to compose a Chinese character with these roots (and sub-roots) (в контексте ЧжэнМа, как составить китайский символ с этими корнями /и подкорнями/)? Here are the complete rules (вот полные правила):

      —— • ——
    1. ZhengMa uses no more than 4 alphabetic letters to encode each Chinese character (ЧжэнМа использует не более, чем 4 буквы алфавита, чтобы кодировать каждый китайский символ).
    2. Each Chinese character is composed of roots and/or sub-roots (каждый китайский символ составлен корнями и/или подкорнями). The roots are encoded with single letters; sub-roots are encoded with 2 letters (корни закодированы одиночными буквами; подкорни закодированы 2 буквами). Example: root 土 (b) and sub-root 工 (bi) (пример: корень 土 /b/ [tǔ, ту] и подкорень 工 /bi/ [gōng, гун]).
    3. Character made of 1 or 2 roots/sub-roots, its code won’t exceed 4 letters (символ, сделанный из 1 или 2 корней/подкорней: его код не будет превышать 4 букв). Just type in the corresponding letters for its roots/sub-roots, following the order of “left-to-right”, “top-to-bottom” (просто вбейте соответствующие буквы для его корней/подкорней, следуя порядку „слева направо“, „сверху вниз“). Example (пример): 木 (f) + 子 (ya) = 李 (fya), 日 (k) + 十 (ed) = 早 (ked), 日 (k) + 月 (q) = 明 (kq)
    4. Character made of 3 roots/sub-roots, its first root/sub-root needs to be spelled out completely (i.e. 1 or 2 letters), the middle one allows for only 1 letter, the last root/sub-root allows for 1 or 2 letters to fill the 4-letter slot (символ, сделанный из 3 корней/подкорней: его первому корню/подкорню нужно быть составленным полностью /т.е. 1 или 2 буквы/, средний допускает только одну букву, последний корень/подкорень допускает 1 или 2 буквы, чтобы заполнить 4-буквенный слот). So the formula is (так что формула —) 1+1+2, 1+1+1 or 2+1+1. Example (пример): 箱 (mfl; 1+1+1), 肝 (qaed; 1+1+2), 教 (bmym; 2+1+1). Notice 教 (teach) has parts: 耂 (bm), 子 (ya), and 攵 (mo), but to accommodate the 4-letter slot, only the first letters of the sub-roots (子, 攵) are included (заметьте, 教 [jiào, цзяо] /учить/ имеет части: 耂 /bm/, 子 /ya/ и 攵 /mo/ [pū, пу], но чтобы приспособить 4-буквенный слот, только первые буквы подкорней /子, 攵/ включены).
    5. Character made of 4+ roots/sub-roots, as always its first root/sub-root needs to be spelled out completely (i.e. 1 or 2 letters), the second, the second-to-last and the last root/sub-root each allows for 1 letter respectively (символ, сделанный из 4 и более корней/подкорней: как всегда его первому корню/подкорню нужно быть составленным полностью /т.е. 1 или 2 буквы/, второй, предпоследний и последний корень/подкорень, каждый допускает 1 букву соответственно). The formula becomes (формула становится) 1+1+1+1 or 2+0+1+1. Example (пример): 鳞 (rurm; 1+1+1+1), 赢 (shlq; 2+0+0+1+1).

    With the complete root/sub-root table in hand (see Appendix), and these 5 rules, you can start building/typing Chinese characters right away (с полной таблицей корней/подкорней в руках /смотри приложение/ и этими 5 правилами вы можете начать построение/печать китайских символов сразу). Not every character you build corresponds to an existing Chinese character, but it’s easy to fish out a big one that contains the pieces you like (не каждый символ, который вы строите, соответствует одному существующему китайскому символу, но легко выудить один большой, который содержит куски, которые вам нравятся).

    For example, you may like the character 人 (human) because it looks exactly like someone walking (для примера, вам может нравиться символ 人 [rén, жэнь] /человек/, потому что он выглядит как кто-то шагающий). It is listed as a sub-root od (2-letter) in the table (он внесён в список как подкорень od /2-буквенный/ в таблицу). To add “more people”, try 从 (odod), not happy, and want more people (чтобы добавить „больше народу“, попробуйте 从 /odod/ [cóng, цун; идти следом], не довольны и хотите больше народу)? How about ododod (как насчёт ododod)? Not really (не реально).

    Remember rule 1 (помните правило 1)? The code can‘t be longer than 4 letters (код не может быть длиннее, чем 4 буквы). Also remember rule 4, for a 3 sub-roots character the code should be (od+o+o): 众 (lots of people) (также помните правило 4, для символа из 3 подкорней коду следует быть /od+o+o/: 众 [zhòng, чжун] /куча народу/).

    There is certainly no Chinese character with more people in it, because if there is, the code (odoo) will certainly bring it out (несомненно нет китайского символа с бóльшим народом в нём, потому что если есть, код /odoo/ несомненно преподнесёт его). (Remember rule 5?) (помните правило 5?) Exercise: try to type 品, 森, 淼, 垚 (упражнение: попробуйте напечатать 品 [pǐn, пинь; вещь, изделие, сорт, качество, проба], 森 [sēn, сэнь; чаща, буйная растительность], 淼 [miǎo, мяо; водная ширь], 垚 [yáo, яо; насыпь]). (Yes, these are all Chinese characters, but your Chinese professor probably won’t be able to pronounce all of them without the help of a dictionary.) (да, они все китайские символы, но ваш китайский профессор, вероятно, не будет способен произнести все из них без помощи словаря) One way to be familiar yourself with the roots/sub-roots in the table is to game with them by putting them on your “scrabble” tiles (один путь быть знакомым самому с корнями/подкорнями в таблице — это играть ими с выкладыванием их фишками вашего „скрэббла). You can play “scrabble” with friends, to see who can make the “longest” Chinese character (вы можете играть в „скрэббл“ с друзьями, чтобы увидеть, кто может создать „длиннейший“ китайский символ). And ZhengMa on your computer is the ideal “scrabble” dictionary to check the validity of the character (и ЧжэнМа на вашем компьтере — идеальный словарь „скрэббла“, чтобы проверить правильность символа).

  4. DISSECT A CHINESE CHARACTER (рассекай китайский символ)

    If you would like to impress your friend by telling him/her the meaning of his/her Chinese character tattoo, you can type that character in the computer and use google translate or other online dictionary to find its meaning (если вы хотели бы впечатлить вашего друга рассказом ему или ей о значении его или её татуировки с китайским символом, вы можете вбить тот символ в компьютер и использовать переводчик гугла или другой словарь в интернете, чтобы найти его значение).

    This leads to most difficult section in this article: given a Chinese character, dissect it into parts that match ZhengMa’s roots and sub-roots (это ведёт к наиболее трудному разделу в этой статье: дан китайский символ, рассеките его на части, которые подходят корням и подкорням ЧжэнМа).

    It is essential to recognize the roots and sub-roots and to realize that these are the basic units that shall not be further taken apart (это существенно — распознать корни и подкорни и осознать, что они основные единицы, которые не будут далее взяты по частям). For example, the character 郭 (sjyy; 1+1+1+1) should be dissected into 亠 (s), 口 (j), 子 (ya) and 阝(y) (для примера, символу 郭 /sjyy; 1+1+1+1/ следует быть рассечённым на 亠 /s/, 口 /j/, 子 /ya/ и 阝/y/). According to rule 5, we shall pick s (for the first root 亠) + jyy (the first letters of the rest of the roots/sub-roots) (согласно правилу 5, мы выберем s /для первого корня 亠/ + jyy /первые буквы остальных из корней/подкорней/). In this case 子 is a sub-root (coded ya), which should not be further decomposed into 了 (y) and 一 (a) (в этом случае 子 — подкорень /кодированный ya/, которому не следует быть далее разложенным в 了 /y/ и 一 /a/). Because otherwise, if you thought 郭 were made of five components: 亠, 口, 了, 一, 阝, its code would have become sjay, according to rule 5 (потому что в противном случае, если вы думали, 郭 был сделан из пяти компонентов: 亠, 口, 了, 一, 阝, его код бы стал sjay, согласно правилу 5).

    Just like taking apart your iPod, in order to be able to pry it open, you need to know where to insert the plastic wedge (просто как взятие по частям вашего айпода: для того, чтобы быть способным подсмотреть в него открытый, вам нужно знать, куда вставить пластиковый клин). For many Chinese characters, its structure gives hint where the break point shall be (для многих китайских символов их структура даёт подсказку, где точке разрыва следует быть).

    For example (для примера): 栖 (ffj) = 木 (f) + 西 (fj) LEFT-RIGHT structure (структура слева направо). 西 is already a sub-root, so don’t break it further (西 уже является подкорнем, так что не разрывайте его далее).

    The structure that is most difficult to identify is called SANDWICH structure (струтура, которая является наиболее трудной, чтобы определить, названа структурой сэндвича). For example (для примера) 巫 (bioo) = 工 (bi) + 人 (od) + 人 (od) and 亘 (bdk) = 二 (bd) + 曰 (k).

    There are also nuances like 失 and 矢 are two different characters, but with the same parts (существуют также нюансы подобно 失 [shī, терять] и 矢 [shǐ, стрела] — два разных символа, но с одними и теми же частями). To distinguish between them, 矢 (ma) is made into a sub-root (чтобы провести различие между ними, 矢 /ma/ сделан подкорнем). 失 is allowed to be broken into mb + od (失 разрешено быть разорванным mb + od). This is also the case for 牛 (mb) and 午 (maed) (это также случай для 牛 /mb/ [niū, бык] и 午 /maed/ [wǔ, полдень]).

    The general guideline is to break the character into sub-structures until roots/sub-roots are matched (основное направление — разрывать символ на подструктуры до тех пор, когда корни/подкорни есть подходящие). Exceptions can happen when the character is too “slim” (исключения могут произойти, когда символ слишком „худой“).

  5. FURTHER EXPLORATION (дальнейшее исследование)

    Much can be said about ZhengMa’s roots/sub-roots table (многое может быть сказано о таблице корней/подкорней ЧжэнМа). Decades of research effort went into perfecting it (десятилетия исследовательских усилий пошли в её совершенствование).

    Sub-roots and roots are grouped into five categories based on their first stroke, which is among 一, 丨, 丿, 丶, 了 as discussed in section 3 (подкорни и корни сгруппированы в пять категорий, основанные на их первой черте, которая находится среди 一, 丨, 丿, 丶, 了, как обсуждено в разделе 3).

      —— • ——
    1. A to H encode roots/sub-roots with the first stroke 一 (A — H кодируют корни/подкорни с первой чертой 一).
    2. I to L encode roots/sub-roots with the first stroke 丨 (I — L кодируют корни/подкорни с первой чертой 丨).
    3. M to R encode roots/sub-roots with the first stroke 丿 (M — R кодируют корни/подкорни с первой чертой 丿).
    4. S to W encode roots/sub-roots with the first stroke 丶 (S — W кодируют корни/подкорни с первой чертой 丶).
    5. X to Z encode roots/sub-roots with the first stroke 乛, 了, 乚 respectively (X — Z кодируют корни/подкорни с первой чертой 乛, 了, 乚 cоответственно).

    Once you recognize the first stroke of a character (or its sub-structure) you can start looking for the corresponding root/sub-root in the table (see Appendix) (как только вы распознаёте первую черту символа /или его подструктуру/, вы можете начинать высматривание соответствующего корня/подкорня в таблице /смотри приложение/). If there is no proper match, it means that you need to take the character further apart (если нет должного соответствия, это значит, что вам нужно брать символ далее по частям).

    Even though sub-roots are coded with 2 letters, it is obvious, according to the encoding rule, that the second letter is left out most of the time (даже хоть подкорни кодированы 2 буквами, это очевидно, согласно правилу кодирования, что вторая буква оставлена вне большинства случаев).

    Also the way in which sub-roots are encoded isn’t arbitrary at all (также путь, которым подкорни закодированы, вовсе не произвольный). For example, 子 (ya) is a sub-root under root 了 (y) (для примера, 子 /ya/ — подкорень под корнем 了 /y/). Its code comes from (его код происходит из) 了 (y) + 一 (a). Similarly 田 (ki) comes from (подобным образом 田 /ki/ происходит из) 曰 (k) + 丨 (i).

    In fact, most of the sub-roots can be deduced as add-on of the root character (фактически, большинство подкорней может быть вычислено как дополнение корневого символа). It certainly helps you look up and remember the 2-letter codes, once you are familiar with the 26 root characters (это несомненно помогает вам сверяться и помнить 2-буквенные коды, как только вы знакомы с 26 корневыми символами).

    So why do we need 2-letter sub-root (так почему нам нужны 2-буквенные подкорни)? Why not just use 1-letter roots to code the characters (почему просто не использовать 1-буквенные корни, чтобы кодировать символы)?

    Well, for one thing, the code can become longer than 4 letters in some cases (ну, для одной вещи, код может становиться длиннее, чем 4 буквы, в некоторых случаях).

    In order to stick with 4-letter codes, one then has to deal with ambiguities caused by packing 1-letter with multiple roots (для того, чтобы придерживаться 4-буквенных кодов, тогда надо управляться с неоднозначностями, вызванными упаковкой в одну букву многочисленных корней). By the way, Wubi input method is a 1-letter root encoding system (кстати, метод ввода Уби — 1-буквенная система кодирования корней). It relies on a complicated isolation-key method to fight the ambiguities (он полагается на сложный метод изоляции ключей, чтобы побороть неоднозначности). Still its limited number of roots makes its character space quite small comparing to ZhengMa (всё же ограниченное число корней делает его символьное пространство довольно малым, сравнивая с ЧжэнМа).

    As we mentioned in section 1, the Pinyin method encourages users to type multicharacter phrase in order to resolve the ambiguities (как мы упоминали в разделе 1, метод пиньинь стимулирует пользователей печатать многосимвольные фразы для того, чтобы решать неоднозначности).

    The same multi-character strategy can apply to ZhengMa (такая же многосимвольная стратегия может применяться к ЧжэнМа). For example (для примера), 计算机 (smlf) = 讠 (s) + 算 (ml) + 木 (f), it is composed of 1 letter from the first root/sub-root of the first character 计, first two letters from the first two roots/sub-roots of the middle character 算, and 1 letter from the first root/sub-root of the last character 机 (он составлен 1 буквой из первого корня/подкорня первого символа 计, первыми двумя буквами из корней/подкорней среднего символа 算 и 1 буквой из первого корня/подкорня последнего символа 机). It is as if we are coding each character with total of only 1 or 2 letters in a multi-character phrase (это как если мы кодируем каждый символ целиком лишь 1 или 2 буквами в многосимвольной фразе).

    To go the other direction, why don’t we define more 2 or 3 letters sub-roots (чтобы пойти в другом направлении, почему мы не определяем ещё 2 или 3-буквенные подкорни)? Obviously, with 2-letter codes, 26 × 26 = 676, there are not that many sub-roots in ZhengMa’s code table (see Appendix) (очевидно, с 2-буквенными кодами, 26 × 26 = 676, существует не так много подкорней в таблице кодов ЧжэнМа).

    It would make typing single character faster at the price of more memorization (это бы делало печать одиночного символа быстрее при цене большего запоминания). (The good old “speed” vs. “memory space” trade-off) (старый добрый компромисс „скорость“ против „объёма памяти“)

    In fact, ZhengMa does have 2-letter and 3-letter “short-cut” codes that aim for speed-typing by professional typists (фактически, ЧжэнМа действительно имеет 2-буквенные и 3-буквенные „укороченные“ коды, которые нацеливаются на скоростную печать профессиональными операторами).

  6. APPENDIX (приложение)

    (ZhengMa Roots/sub-roots Table) (таблица корней/подкорней ЧжэнМа)