В русском языке 33 буквы, а в английском еще меньше – 26. Полноразмерная же клавиатура насчитывает более сотни клавиш, чего вполне хватает для размещения всего нашего алфавита и беспроблемного ввода текста. А вот китайцам не так повезло – их язык строится на других принципах. И иероглифов там насчитывается свыше 50 тысяч! Конечно же, на клавиатуре разместить такое число, даже присваивая каждой кнопке 2-3 значения, не получится.
Увеличивать число кнопок тоже неразумно – клавиатура станет такой большой, что ею просто неудобно будет пользоваться. Китайцам пришлось придумать способ набора текста, избегая крайностей. Для этого были проведены некоторые оригинальные эксперименты. И как же в итоге китайцы набирают текст на компьютере с учетом кажущейся неразрешимой задачи?
Как мы уже говорили, в китайском языке около 50 тысяч иероглифов, правда, в обычной жизни среднестатистический носитель языка использует куда меньше вариантов. Ученые решили использовать такое допущение при создании печатной машинки. Итак, первая печатная машинка на китайском языке вмещала в себя 2500 иероглифов, но в комплекте шло еще 5700 сменных литер, которые располагались в нижнем ящике. Лоток был разделён на три зоны: центральную для самых распространённых, и две боковые зоны для редких иероглифов. Набор превращался в непростую задачу – для поиска нужного иероглифа приходилось пользоваться увеличительным стеклом.
Это требовало немало времени, в результате в минуту удавалось вводить всего лишь около 10 знаков.
Линь Юйтань и его печатная машинка
Знаменитый китайский ученый и философ попытался решить эту проблему, создав компактную электромеханическую машинку. У нее было всего 64 клавиши, каждая из которых обозначала не иероглиф, а некую его составную часть. Оператору предлагалось сперва составить комбинацию, сформировав нужный символ. Он отображался на маленьком экране. Оставалось лишь подтвердить верность ввода специальной клавишей.
Оригинальная идея казалась неплохим способом решить проблему ввода. Однако массовым изобретение так и не стало. Американских инвесторов машинка так и не заинтересовала. Отпугнула стоимость одного экземпляра – 120 тысяч долларов, да и на презентации опытный образец так и не смог заработать. Но сама идея Линь Юйтаня разделять иероглифы на составные части, графемы, оказалась полезной и в будущем пригодилась.
Структурный способ ввода
На современных компьютерах при вводе китайских иероглифов используется именно такой вариант. Иероглифы, как и предлагал Юйтань, делятся на графемы. Есть несколько способов их группировки, самый популярный называется уби цзысин, что переводится, как «по пяти чертам». На обычной клавиатуре разместилось 5 основных черт, 25 самых используемых иероглифов, а также 208 графем. Используется принцип зонирования. На каждой клавише сразу несколько графем, они скомпонованы по определенным признакам, в том числе по внешней схожести. Чтобы ввести составной иероглиф приходится делать максимум 4 нажатия. Такой метод позволяет профессионалу набирать по 150 символов в минуту в режиме быстрого слепого ввода.
Фонетический принцип ввода
Эта методика использует обычные латинские буквы, которые формируют транскрипцию иероглифа. Вот только одному звуку может соответствовать несколько вариантов символов, так что из них придется выбирать оператору. Зато предиктивный метод помогает угадывать, какой иероглиф будет введен. Работа системы чем-то напоминает популярный и знакомый нам Т9.
Чуть ли не самый популярный фонетический метод ввода – пиньинь. Система на основе этой методики, как раз и установлена на компьютерах с Windows. Также она используется в клавиатуре Google Pynyin. И хотя иероглифы в конечном счете подбираются вполне удачно, скорость набора с использованием фонетического метода ниже, чем у уби цзысин. 50 знаков в минуту – это явно недостаточно для активной работы с текстом.
Это далеко не единственные системы ввода текста, но даже в Китае альтернативы практически не используются. С появлением в нашей жизни планшетов и смартфонов популярность набирает новый метод. Стилус и сенсорный экран позволяют написать иероглиф прямо на дисплее, система быстро распознает символы. Есть еще и комбинированный способ, который вбирает в себя возможности структурного и фонетического. Но этот вариант и сложнее, так как требует от оператора как понимания фонетики, так и знания графем. Компьютеры к тому же пока еще не способны полноценно распознавать голосовой или рукописный ввод. Все же даже искусственный интеллект вынужден адаптироваться под особенность речи конкретного человека. В конечном счете профессионал, работающий с китайским текстом, чаще всего предпочитает структурный метод.