Математическая модель оптимальной раскладки символов на клавиатуре и её приложения
В определенном смысле подобная ситуация повторилась и в границах бывшего Советского Союза. Здесь развитие информационных технологий происходило, прежде всего, на русском языке, поэтому вполне естественно, что на клавиатурах вычислительных машин первым появился алфавит русского языка, а его раскладка по клавишам клавиатуры стала базовой для многих других языков, алфавиты которых основывались… Читать ещё >
Математическая модель оптимальной раскладки символов на клавиатуре и её приложения (реферат, курсовая, диплом, контрольная)
Содержание
- Г л, а в, а 1. Математические основы оптимальной модельной раскладки символов на клавиатуре
- 1. Постановка задачи о раскладке символов по клавишам клавиатуры
- 2. Выбор критерия принятия решения
- 3. Определение оптимальной раскладки
- 4. О практической реализации оптимальной раскладки
- Г л, а в, а 2. Ранжирование клавишей
- ¡-."Слепой «десятипальцевый метод печатания
- 2. Ранжирование клавишей на основе экспертных оценок
- 3. Второй способ ранжирования
- 4. Ранжирование по Двораку
- 5. Ранжирование по П. Клауслеру
- 6. Проблема ранжирования
- Г л, а в, а 3. Ранжирование букв
- 1. Выборки из генеральной совокупности таджикских текстов
- 2. Частота встречаемости букв в таджикском языке
- 3. Частота встречаемости букв в русском и английском языках
- 4. Объем репрезентативной выборки
- 5. Ранжирование таджикских буквенных блоков
- 6. Ранжирование русских и английских буквенных блоков
- 7. Статистические основы блочного ранжирования букв
- 8. Распределение частот встречаемости пар букв (биграмм) в русских, английских и таджикских текстах
- Г л, а в, а 4. Оптимальная раскладка букв и буквенных блоков
- 1. Оптимальные таджикская, русская и английская клавиатуры для набора больших текстов
- 2. Блочная раскладка букв на компьютерной клавиатуре для набора текстов относительно малых объемов
- 3. Неоднозначность раскладки букв по клавишам клавиатуры. Учет дополнительных требований на характер раскладки таджикских букв
- 4. Эргономичные раскладки русских и английских букв для набора текстов относительно малых объемов
- 5. Раскладка таджикских букв, аналогичная русской раскладке
- 6. Об эргономичной персональной раскладке букв на клавиатуре
Проблема раскладки символов на клавиатуре возникла, по-существу, в 1867 г., когда Ch. Sholes и S. Soule представили свое изобретение — первую в мире печатающую машинку, [1]. Раскладка, примененная ими, оказалась достаточно простой: на клавишах, сконструированных в два ряда, латинские буквы размещались в алфавитном порядке. Дефекты такого решения проявлялись в случаях скоростного печатания. При последовательном нажатии соседних клавишей соответствующие им исполнительные механизмы — молоточки с закрепленными на них литерами нередко t зацеплялись друг за друга, застопоривая дальнейшую работу пишущей машинки. В последующем Ch. Sholes, пытаясь устранить этот недостаток, предложил другую раскладку. В ней буквы, наиболее часто встречающиеся в английских текстах парами, разместились в разных местах клавиатуры. Такая раскладка, используемая и поныне, получила название QWERTY по шести первым буквам верхнего ряда клавиатуры, см. рис. 1. @ |# 1 2 |з $ * h & * И 4 5 16 7 8 19 0 s I* Beckapaw.
Q WERTYUI О P { [ > ] 1 caps Lock A S D F G H J KL- - |е"ш ¦ «I*-1.
SMit ZXCVBNM'*?">in О * * i О.
CM Win K*r M Win Key Manu Clrl.
Рис. 1 Раскладка QWERTY.
Таким образом, необходимость решения проблемы раскладки впервые была инициирована конструктивными особенностями печатного механизма. Однако у этой проблемы выявилась и другая, не менее важная сторона. Дело в том, что от характера раскладки букв на клавиатуре зависят и удобство взаимодействия с печатным механизмом, и, несомненно, скорость набора текстовой информации. Поэтому вполне естественно было ожидать появление исследований именно в этом направлении, что и было предпринято A. Dvorak’ом в 1930;х годах, [1,2]. Им предложена новая раскладка, в которой, с учетом частот встречаемости латинских букв в английских текстах, наиболее частые из них разместились в среднем ряду, менее частые — в верхнем и редкие — в нижнем рядах. Кроме того, все гласные буквы расположились в левой части клавиатуры. Результаты соответствующих экспериментов подтвердили определенные преимущества такой раскладки в сравнении с QWERTY, но, несмотря на это, она так и не появилась на клавиатуре пишущих машинок. ;
С изобретением вычислительных машин, а затем и персональных компьютеров, проблема раскладки вновь привлекла к себе внимание специалистов. Лидерство США в области информационных технологий, утвердившее приоритетность английского языка в мире компьютеров, как-то незаметно отстранило европейские страны с письменностью на латинском алфавите от необходимости решения проблемы наилучшей раскладки букв своих собственных алфавитов на компьютерной клавиатуре. В настоящее время для многих языков, прежде всего с графикой на основе латиницы, реализованы версии раскладки Дворака, причем с сохранением позиций английских букв на прежних клавишах. Вследствие этого специфические буквы собственных алфавитов европейских стран разместились на периферии их национальных компьютерных клавиатур в качестве приложений к раскладкам QWERTY и Дворака.
Несмотря нато, что изучением этой проблемы на примерах естественных языков занимались многие специалисты во многих странах, удовлетворительного решения она не получила до сих пор. Причина в том, что предлагаемые решения во всех случаях опирались на качественные критерии, которые при переводе на язык количественных отношений допускали многообразные интерпретации, оставлявшие возможность последующих доработок.
В определенном смысле подобная ситуация повторилась и в границах бывшего Советского Союза. Здесь развитие информационных технологий происходило, прежде всего, на русском языке, поэтому вполне естественно, что на клавиатурах вычислительных машин первым появился алфавит русского языка, а его раскладка по клавишам клавиатуры стала базовой для многих других языков, алфавиты которых основывались на русской кириллице. Также как и в случае с английским языком, при формировании национальных компьютерных клавиатур народов СССР специфические буквы национальных алфавитов разместились на периферии компьютерной клавиатуры, сохранив неизменными позиции букв русского алфавита. Разумеется, такой подход не учитывал специфику национальных языков и, наверняка, не обеспечивал «наилучшей» раскладки их букв на клавишах клавиатуры несмотря на то, что характер раскладки букв русского алфавита на компьютерной клавиатуре (ГОСТ 14 289−88, стандарт для среды MS DOS и стандарт для среды MS Windows) представлялся достаточно обоснованным, см. 3].
Причина, способствовавшая появлению «неоптимальных», не эргономичных раскладок букв, обуславливалась, по-видимому, тем, что проектировщики уступили сиюминутным желаниям пользователей находить английские и русские буквы на привычных местах, нежели тратить какое-то время, даже не столь значительное, на. освоение их нового расположения на клавишах компьютерных клавиатур. Конечно, можно считать, что раскладка букв не имеет принципиального значения для выполнения заданий, поставленных человеком перед 'компьютером. Тем не менее, если отправляться от интересов пользователей, в особенности таких, чья работа связана с набором текстовой информации больших объемов, выбор наиболее удобной раскладки букв на клавишах компьютерных клавиатур с учетом соображений эргономики выглядит далеко не бесполезным делом. Добавим к этому, что выбор во всех отношениях «наилучших» раскладок букв актуален для тех естественных языков, для которых еще не утверждены национальные стандарты компьютерной клавиатуры. В подтверждение сказанного достаточно отметить повышенный интерес современной цивилизации к решению различных вопросов информатизации и, в частности, к проектированию компьютерной клавиатуры для, так называемых, менее привилегированных языков (for less privileged languages). Проблема определения наилучшей раскладки символов на компьютерной клавиатуре не теряет своей актуальности и для английского языка. Это подтверждается непрекращающимися попытками совершенствования английской клавиатуры, что видно, к примеру, из работы P. Klausler’a из фирмы Cray, США, 2003 г. ,.
Настоящая диссертация, выполнявшаяся в рамках Государственной программы РТ «Применение и развитие информационных технологий в таджикском языке», а также научно-исследовательских планов Института математики АН РТ и Худжандского Филиала Технологического университета Таджикистана, посвящена дальнейшему изучению рассматриваемой проблемы.
Цель диссертации — создать математическую модель оптимальной раскладки символов на клавиатуре произвольной конфигурации и затем на её основе предложить новые варианты эргономических раскладок таджикских, русских и английских букв на компьютерной клавиатуре.
Методы исследования. Для изучения закономерностей частоты встречаемости букв в текстах естественного языка использованы методы математической статистики, программирования, СУБД и вычислительного эксперимента. Для упорядочения клавишей компьютерной клавиатуры на основе трудозатрат на их активизацию применен метод экспертных оценок. Решения модельной, а также практических задач об эргономичных раскладках символов на клавиатуре основаны на развитии и применении методов линейного программирования.
Научная новизна и результаты. Основными результатами работы являются:
— разработка модельной оптимальной раскладки символов естественного языка на клавиатуре произвольной конфигурациил.
— обнаружение того факта, что случайные выборки английских, русских и таджикских текстов объемом не менее 10 страниц (приблизительно 24 000 знаков) являются репрезентативными (Я — текстами) в том смысле, что они характеризуются статистически неразличимыми распределениями частот встречаемости букв;
— статистическое доказательство инвариантности ранжирования буквенных блоков по отношению к Я — текстам;
— получение предварительных вариантов эргономичных раскладок русских, английских и таджикских букв на компьютерной клавиатуре.
Теоретическая ценность диссертации заключается в том, что в ней предложена математическая модель для изучения проблемы раскладки символов на клавиатуре на основе минимизации трудозатрат при наборе «коротких» и достаточно длинных текстов.
Практическая ценность диссертации состоит в том, что разработанная в ней общая методика проектирования эргономичных раскладок может найти практическое применение, преэюде всего, для менее привилегированных естественных языков, которые до сих пор еще не имеют собственного национального стандарта компьютерной клавиатуры.
Апробация работы. Результаты диссертации докладывались на научно-исследовательских семинарах Института математики АН РТ.
Публикации. Основные результаты диссертации опубликованы в 4-х статьях [41−44], из которых 3 статьи выполнены в соавторстве с научным руководителем З. Д. Усмановым, которому принадлежат постановки задач и обсуждение результатов. Решения задач выполнены автором диссертации.
Структура работы. Диссертация изложена на 72 страницах компьютерного набора, состоит из введения, 4-х глав, 24 таблиц, 14 рисунков, списка литературы, включающего 44 наименования и 11 приложений.
1. Усманов 3. Д. Об оптимальной раскладке символов на клавиатуре Программные продукты и системы. -2004. № 2, -с. 32−39. 6. 7. http://traditio.ru/index.php/Kлaвиaтypa_Двopaкa Курош А. Г. Курс высшей алгебры. -М.: Наука, Гл. редакцияфиз.-мат. лит., 1971,-432 с.
2. Юдин Д. Б., Гольштейн Е. Г. Линейноепрограммирование.-М.: Наука, Гл. редакция физ.-мат.лит., 1969, -429 с.
3. ЧернаяР. И. Самоучитель машинописина компьютере или пишущей машинке. Ускоренный метод обучения. -М.: Приор, 1999, -80 с. Ю. Айни Ёдоштхр, к, исми 1,2 (Воспоминания, часть 1,2). Душанбе: Адиб, 1990,-352 с. 11- Айни Ятим (Сирота).-Душанбе: Нашриётидавлатии Точ, икистон, 1940, 140 с.
4. Айни Кахрамонихалкд точик-Темурмалик (Герой таджикского народа-Темурмалик). -Душанбе: Маориф, 1978, 168 с.
5. Гафуров Б. Г. Точдшш (Таджики). -Душанбе: Ирфон, 1998, -416 с.
6. Улугзаде Пирихакимони машрик, замин (Вождь мыслителей Востока) -Душанбе: Маориф, 1980, -200 с.
7. Турсунов Н. О. Таърихи точикон (Историятаджикского народа). -Худжанд: Солитон, 2001, -788 с.
8. Мухаммадиев Ф. Куллиёт (Полноесобрание сочинений). Душанбе: Адиб, 1990,-384 с.
9. Икрами Дж. Асархри мунтахаб (Избранныепроизведения). Душанбе: Адиб, 1987, -352 с.
10. Бахори А. Бозгашт (Возвращение). -Душанбе: Ирфон, 1973, 120 с.
11. Бахори А. Сохили мурод (Берег надежды). -Душанбе: Адиб, 2000, -368 с.
12. Джалил Р. Одамони ч, овид (Вечные люди). Душанбе: Нашриёти давлатии Точикистон, 1954, -478 сг.
13. Соколов Н. Теоретические основы Государственной единой системы стенографии (Частотность букв в русской письменной речи). -М.: Учпедгиз 1949, 114 с. 22. http://en.wikipedia.org/wiki/Letter_frequencies.
14. Гмурман В. Б. Теория вероятности иматематическая статистика. -М.: Высшая школа, 2005, -480 с.
15. Азимов А. Я робот. -М.: Центрполиграф, 2003, -319 с.
16. Азимов А. Сами боги. -М.: Эксмо-Пресс, 2008, -384 с.
17. Азимов А. Новые миры. -М.: Полярис, 1997, -351 с.
18. Достоевский Ф. М. Полное собрание сочинений.-Ленинград: Наука, 1976, -623 с.
19. Толстой Л. Н. Анна Каренина. -М.: Дрофа, 2006, -416 с.
20. Толстой Л. Н. Воскресенье.-М.: Мир книги, 2007, -480 с.
21. Толстой Л. Н. Утро помещика. -М.: Правда, 2007, -527 с.
22. Андреев Л. Н. Повести иРассказы.-М.: Эксмо, 2004, -832 с.
23. Лермонтов В. Ю. Азбука жизни. -М.: Невский проспект, 2004, -256 с.
24. Гоголь Н. В. Миргород. -М.: Мир книги, 2007, -240 с.
25. КэтлинР.Дж. Гарри Поттер и Орден Феникса. -М.:Росмэн, 2004,-828 с.
26. Фадеев А. А. Молодая гвардия. -М.: Современник, 1980, -669 с.
27. Яблоков М. Пришельцы. -М.: АиФ-Принт, 2001, 320с.
28. Raphael F. The glittering prizes. -London: JR Books Ltd, 2007, -295 p.
29. Schmitz J. Telzey. -London: Baen, 2000,-448 p.,.
30. Hjortsberg W. Falling Angel. -N. Y.: New Ed edition, 1996, -256 p.
31. Fitzgerald S. The great Gatsby. -M Ikar, 2004, -220 p.
32. Усманов 3. Д., Солиев О. М. Закономерности статистического распределения частот встречаемости букв в таджикском языке//ДАН РТ, 2003. Т.46, 3−4, с. 59−62.
33. Усманов 3. Д., Солиев О. М. О «наилучшей» раскладке таджикских букв на компьютерной клавиатуре //ДАН РТ. 2004. Т. 47, 3, с. 56−61.
34. Усманов 3. Д., Солиев О. М. К вопросу о «наилучших» раскладках английских ирусских символов накомпьютерной клавиатуре Программные продукты и системы. -2004. 4, -с. 38−41.
35. Солиев О. М. О раскладке таджикских букв на компьютерной клавиатуре посхеме русской раскладки //ИзвестияАН РТ, 2007. № 2(127), -с.26−30.