Особенности компьютерной лингвистики на примере предприятия ТОО «Bimash»
Джон сказал: «Я не виновен». По условию задачи два человека являются невиновными: лжец и шутник. Джон не может быть лжецом, так как лжец, в данном случае, сказал бы, что он виновет. Джон не может быть и правдолюбцем, так правдолюбец виновен, и он не сможет сказать неправду. Остается, что Джон шутник, при этом он говорит правду, так как он, действительно невиновен. Джек подтверждает невиновность… Читать ещё >
Особенности компьютерной лингвистики на примере предприятия ТОО «Bimash» (реферат, курсовая, диплом, контрольная)
- Пояснительная записка
- Создание и сопровождение информационных систем
- Электронный казахско-русско-английский словарь «С?зК?мек»
- Дистанционный комплекс обучения государственному языку специалистов технического профиля
- Язык Prolog
- Список использованной литературы
Пояснительная записка
Я, Ахатаева Айгерим Оразхановна, студентка 3 курса группы «Автоматизация и Управление «факультета Информационных Технологий, Евразийского Национального университета имени Л. Н. Гумилева, проходила производственную практику на ТОО «Bimash» в период с 9 июня 2014 года по 12 июля 2014 года.
В период практики я изучала такие навыки, как:
1. Изучение базовых основ программы Prolog — языка и системы логического программирования;
2. Декларативный язык программирования;
3. Визуализация Ханой;
4. Логические задачи, работа с текстами, буквами и предложениями.
За время прохождения практики:
1) Изучила организационную структуру предприятия ТОО Bimash;
2) Ознакомилась с нормативными документами;
3) Получила опыт реального программирования на Prolog.
Весь комплекс работ, получаемый в качестве заданий по практике, был выполнен в полном обьеме, качественно и в установленные сроки.
В период с 9 июня по 12 июля 2014 года я проходила свою производственную практику в компании ТОО «Bimash». На сегодня — это лидирующая казахстанская компания в области разработки программного обеспечения, интеграции информационных компьютерных систем, серверного оборудования, систем хранения и обработки больших массивов данных. Работа компании направлена на создание комплексных решений для повышения эффективности деятельности Клиентов при помощи современных информационных технологий.
Особое место в деятельности этой компании занимает научно-инновационная деятельность в области компьютерной лингвистики, систем обработки контента и Internet-сервисов. Более сорока наших научных и инновационных проектов находятся в разработке или проходят экспертизу в инновационных и венчурных фондах.
Компания Bimash работает на рынке Казахстана с августа 1998 года и на сегодняшний день является одной из немногих отечественных компаний, оказывающих широкий спектр IT-услуг.
Реализация проектов любого уровня сложности: от бизнес-процессной аналитики и разработки программных решений до поставки серверного и компьютерного оборудования, программного обеспечения и сопровождения сложных вычислительных комплексов.
Компания Bimash, имеет международный сертификат менеджмента качества ISO 9001 2009. Он является официальным Отечественным Поставщиком информационных и консалтинговых услуг в области информационных технологий в Республике Казахстан.
В офисах компании, в городах Астана, Алматы и Актобе, работает более 100 высококвалифицированных сотрудников, имеющих свыше 200 действующих сертификатов по различным направлениям программных и аппаратных технологий XXI века.
На сегодняшний день эта компания является официальным партнёром ведущих мировых поставщиков программного обеспечения и информационных технологий: IBM, Fujitsu, Hitachi, Oracle, Microsoft, Apple, DocsVision, Лаборатория Касперского, Symantec и многие другие.
Оcновные нарпавления деятельности ТОО Bimash
Комплексный технологический консалтинг
· Профессиональный анализ и моделирование бизнес-процессов
· Разработка технических заданий и технико-экономических обоснований
Создание и сопровождение информационных систем
· Создание, развитие, модернизация, внедрение, сопровождение, интеграция информационных и аналитических систем, сайтов, порталов, баз данных и других программных продуктов
· Модернизация, внедрение и сопровождение систем электронного документооборота
Интеграция разнородных систем
· Интеграция информационных систем на любом уровне: представления, функциональности, данных, а также комплексная интеграция
Поставка
· Поставка и техническая поддержка лицензионного программного обеспечения
· Поставка и техническая поддержка серверного, телекоммуникационного и компьютерного оборудования, оргтехники
· Поставка и сопровождение аппаратно-программных комплексов управления информационными и техническими ресурсами предприятий
· Поставка и сопровождение систем печати
· Техническая поддержка и сервисное обслуживание
Прикладная лингвистика
· Научно-исследовательская деятельность в области искусственного интеллекта, проектирование и разработка экспертных систем и систем интеллектуальной обработки данных
· Разработка электронных словарей казахского языка и программ поддержки казахского языка
Направления
· Разработка системы стратегических показателей и управление проектами
· Внутренний аудит системы менеджмента качества
· Администрирование и определение проблем серверов приложений
· Администрирование баз данных, в том числе IBM, Oracle, Microsoft и многие другие
· Разработка и администрирование интеграционных решений
· Установка, администрирование, настройка и внедрение систем управления электронными документами и бизнес-процессами
· Разработка бизнес-планов
· Системное администрирование портальных решений
· Администрирование различного серверного оборудования и операционных систем
· Программирование на различных программных платформах
· и многое другое
С?зК?мек 4.0 — это казахско-русско-английский словарь для бизнесменов, госслужащих, студентов, учащихся, путешественников, переводчиков — всех, кто сталкивается с иностранными языками.
Главное предназначение словаря — преодоление языковых барьеров в деловом и неформальном общении жителей Казахстана с представителями других наций.
Словарь С? зК?мек 4.0 — это более 400 тысяч словарных статей на казахском, русском и английском языках.
Впервые в электронном словаре широко представлено богатое содержание старинного и современного казахского языка, обеспеченное профессиональными переводами в казахско-русском и русско-казахском направлениях.
Особенности С?зК?мек 4.0
· Возможность поиска и перевода нескольких слов одновременно
· Форматированные статьи
· Плавающие гиперссылки
· Механизм ссылок на принятые в статьях сокращения
· «Виртуальная клавиатура» для ввода специфических казахских букв
· Транслитерация слов на латиницу
· Просмотр истории запросов
С?зК?мек 4.0 содержит словарь общей лексики, словари по делопроизводству, законодательству, истории, культуре, спорту, литературе, информатике, телекоммуникациям и другим направлениям.
SozKomek 4.0 для iPhone является мобильной версией электронного казахско-русского, русско-казахского словаря С? зК?мек 4.0. Данное приложение содержит словарную базу свыше 200 тысяч словарных слов и выражений. Приложение совместимо с iOS 3.2 и с более поздними версиями iPhone. C 17 декабря 2010 года SozKomek 4.0 доступен для приобретения в iTunes Store.
С 1998 года компания Bimash занимается разработками в области прикладной лингвистики, предназначенных для эффективного изучения и развития казахского, русского и английского языков.
Электронный казахско-русско-английский словарь «С?зК?мек»
Электронный словарь казахского, русского и английского языков «С?зК?мек» — это первый отечественный коробочный программный продукт, который выпускается с 1998 года.
В 2010 году компания Bimash выпустила четвертую версию электронного казахско-русско-английского словаря.
Словарь содержит более 400 тысяч словарных статей на казахском, русском и английском языках. Продукт предназначен для поддержки и облегчения неформального и делового общения между людьми, проживающими на территории Казахстана.
Обучающая программа " С?зАна"
компьютерная лингвистика язык программирование В 2005 году была разработана система обучения казахскому языку «С?зАна», в которую вошли более 120 000 словарных статей.
Обучающая система «С?зАна» предназначена для самостоятельного изучения казахского языка по методике Шлимана — на основе параллельных текстов. Обучающая программа состоит из системы параллельных текстов на казахском и русском языках, а также электронных словарей.
Преимущества обучающей системы " С?зАна"
· Предустановленные параллельные тексты с контекстными словарями и грамматическими пояснениями
· Статистика по работе с текстами
· Подстрочный перевод текущего текста
· Грамматические справочники
· Гибкая навигация и управление установленными текстами
· Звуковое сопровождение текстов
Большой казахско-русско-английский словарь
В 2007 году разработан Большой казахско-русско-английский онлайновый словарь по заказу Комитета по языкам Министерства культуры и информации Республики Казахстан в рамках создания и развития Портала Государственного языка Республики Казахстан.
Большой казахско-русско-английский словарь предназначен для предоставления пользователям перевода слов в любом выбранном направлении:
· Казахско-русский словарь
· Русско-казахский словарь
· Англо-русский словарь
· Русско-английский словарь
· Англо-казахский словарь
· Казахско-английский словарь
· Казахско-русско-английский словарь
· Русско-казахско-английский словарь
· Англо-казахско-русский словарь База Большого казахско-русско-английского онлайнового словаря составляет более 300 000 словарных статей.
Также пользователи могут прослушать дикторское озвучивание слов на русском, казахском, английском языках (имеется порядка 10 000 озвученных слов).
Интерактивные диктанты
Подсистема «Интерактивные диктанты» разработана в 2009 году по заказу Комитета по языкам Министерства культуры и информации Республики Казахстан в рамках создания и развития Портала Государственного языка Республики Казахстан.
Подсистема «Интерактивные диктанты» предназначена для предоставления возможности написания и проверки диктантов на казахском языке в интерактивном режиме.
Возможности подсистемы " Интерактивные диктанты"
· Выбор уровня сложности диктанта
· Выбор озвученного файла диктанта
· Возможность ввода текста под озвученный файл
· Возможность проверки текста диктанта
· Выдача результатов диктанта
Дистанционный комплекс обучения государственному языку специалистов технического профиля
Дистанционный комплекс ускоренного обучения государственному языку специалистов технического профиля доработан в 2009 году по заказу Комитета по языкам Министерства культуры и информации Республики Казахстан в рамках создания и развития Портала Государственного языка Республики Казахстан.
Дистанционный мультимедийный комплекс обучения государственному языку для специалистов технического профиля предназначен для автоматизации процесса обучения казахскому языку и информационного взаимодействия преподавателей, слушателей и заинтересованных лиц в освоении технической терминологии на основе применения современных информационных технологий, системотехнических и организационно-управленческих методов, а также средств вычислительной и коммуникационной техники, используемых для выполнения операций ввода, обработки, анализа, хранения, передачи методических материалов и представления их пользователям комплекса.
· Создание электронных учебно-методических материалов, новых форм обучения и организации учебного процесса по основным вопросам изучения государственного языка с использованием технической терминологии
· Создание широкомасштабного, единого по своим принципам комплекса передачи знаний, умений и навыков, необходимых для достижения главной цели — освоения государственного языка
· Оказание образовательных услуг населению в повышении уровня знаний государственного языка в технической терминологии посредством дистанционного обучения
· Обеспечение конкретных курсов по техническим направлениям, представляющих собой дистанционные обучающие программы, целью которых является комплексное обучение языку и развитие основных речевых навыков, необходимых общаться на государственном языке в типичных техническому профилю коммуникативных ситуациях
· Предоставление заинтересованным пользователям — единых механизмов информационного взаимодействия со специалистами технического профиля и преподавателями языкознания в части предоставления им информационных услуг и сервисов, обеспечивающих участие граждан в формировании, коллективном обсуждении и реализации Государственной программы формирования и развития государственного языка
Стадии прохождения Дистанционного комплекса обучения
· Регистрация слушателя курса
· Определение уровня знания государственного языка слушателя курса путем проведения диагностического тестирования
· Обеспечение слушателя курса материалами, необходимыми для изучения выбранного уровня
· Проверка знаний слушателя курса по окончанию уровня
· Присвоение сертификата об окончании курса
· Организация обсуждений «болевых точек» в переводе технических терминов и получения бесплатной консультации при взаимной помощи
Пользователями объекта информатизации являются заинтересованные лица населения Республики Казахстан, являющиеся слушателями, специалистами технического профиля, свободно владеющие государственным языком и преподаватели — языковеды.
Состав Дистанционного комплекса обучения
Дистанционный мультимедийный комплекс обучения государственному языку для специалистов технического профиля структурирован в виде тематических модулей с использованием средств мультимедиа, гиперссылок и включает в себя следующие компоненты:
· Система заданий для самостоятельной работы виртуальных слушателей
· Система контроля знаний слушателей
· Технический словарь (русско-казахский, казахско-русский)
· Обеспечение многоуровневой технической направленной подготовки изучения языков
· Обеспечение элементов делопроизводства на казахском языке на предприятиях и организация промышленности (протоколы совещания, типовые договора, производственные инструкции и т. д.)
· Библиотека (список литературы, ссылки на сайты), необходимая для освоения технического курса
· Комплект тестовых вопросов по видам речевой деятельности
· Система управления учебным курсом: учебная программа, список обучающихся, регистрацию и пр.
· Система управления содержимым
Осуществлена разработка следующих тематических направлений дистанционного комплекса:
· Радиотехника и электроника
· Экология
· Горное дело
· Делопроизводство (модернизация направления)
Компания Bimash осуществляет услуги по автоматизации бизнес-процессов в организациях при помощи создания информационных систем и портальных решений, выполняемых по требованиям наших заказчиков.
Портал Администрации Президента Республики Казахстан
Внутренний Web-портал Администрации Президента Республики Казахстан был разработан и внедрен в 2005;2007 годах. Портальное решение для Администрации Президента Республики Казахстан предназначено для предоставления централизованного доступа к приложениям и единого формата отображения информации для пользователя.
Преимущества и возможности Внутреннего Web-портала Администрации Президента Республики Казахстан
· Организованное рабочее пространство
· Управление документами
· Рассылка документов пользователям системы
· Авторизация доступа к документам
· Обмен мгновенными сообщениями
· Поиск сотрудников и навигация в каталоге организаций
· Обмен сообщениями через электронную почту
· Поддержка общего календаря
· Интеграция с различными информационными системами, предоставляющими новостные сведения для публикации
· Интеграция с единой системой электронного документооборота государственных органов
· Интерактивная карта Республики Казахстан
· Специализированные информационные сервисы структурных подразделений: электронная библиотека и картотека, казахско-русский словарь с Web-интерфейсом
· Возможность внутреннего и внешнего масштабирования
Язык Prolog
Пролог
Класс языка: Логическое программированиеПоявился в: 1972
Автор (ы): Ален КолмероэОсновные реализации: B-Prolog, Ciao, ECLiPSe, GNU Prolog, Jekejeke Prolog, Logic Programming Associates, Poplog Prolog, P#, Quintus, SICStus, Strawberry, SWI-Prolog, tuProlog, XSB, YAP-PrologДиалекты: ISO Prolog, Edinburgh Prolog, Turbo Prolog, Visual PrologПовлиял на: Visual Prolog, Mercury, Oz, Erlang, Strand, KL0, KL1, Datalog Пролог (англ. Prolog) — язык и система логического программирования, основанные на языке предикатовматематической логики дизъюнктов Хорна, представляющей собой подмножество логики предикатов первого порядка.
Язык сосредоточен вокруг небольшого набора основных механизмов, включая сопоставление с образцом, древовидного представления структур данных и автоматического перебора с возвратами. Хорошо подходит для решения задач, где рассматриваются объекты (в частности структурированные объекты) и отношения между ними. Пролог, благодаря своим особенностям, используется в области искусственного интеллекта, компьютерной лингвистики и нечислового программирования в целом. В некоторых случаях реализация символьных вычислений на других стандартных языках вызывает необходимость создавать большое количество кода, сложного в понимании, в то время как реализация тех же алгоритмов на языке Пролог дает простую программу, легко помещающуюся на одной странице.
Prolog является декларативным языком программирования: логика программы выражается в терминах отношений, представленных в виде фактов и правил. Для того, чтобы инициировать вычисления, выполняется специальный запрос к базе знаний, на которые система логического программирования генерирует ответы «истина» и «ложь». Для обобщённых запросов с переменными в качестве аргументов созданная система Пролог выводит конкретные данные в подтверждение истинности обобщённых сведений и правил вывода.
Язык Пролог в 1980;х годах был включен в ряд советских вузовских и школьных учебников информатики для изучения элементов математической логики, принципов логического программирования и проектирования баз знаний и моделей экспертных систем. С этой целью на IBM PC и ряде советских школьных компьютеров были реализованы учебные русскоязычные интерпретаторы Пролога.
В языке Пролог факты описываются в форме логических предикатов с конкретными значениями. Правила вывода описываются логическими предикатами с определением правил логического вывода в виде списка предикатов над базами знаний и процедурами обработки информации.
В настоящее время Пролог, несмотря на неоднократные пессимистические прогнозы, продолжает развиваться в разных странах и вбирает в себя новые технологии и концепции, а также парадигмы императивного программирования. В частности, одно из направлений развития языка (в том числе и в России) реализует концепциюинтеллектуальных агентов.
Пролог реализован практически для всех известных операционных систем и платформ (в том числе для Java и.net). В число операционных систем входят OS длямейнфреймов, всё семейство Unix, Windows, ОС для мобильных платформ.
Основными понятиями в языке Пролог являются факты, правила логического вывода и запросы, позволяющие описывать базы знаний, процедуры логического вывода и принятия решений
Например:
Hello World
? — write ('Hello world! '), nl.
Hello world!
true.
Индивидуальные задачи
Задача | Ответ | |
В некотором городе живут три типа людей: такие, которые всегда говорят правду (правдолюбцы), всегда говорят неправду (лжецы), и шутники, в зависимости от настроения, говорят либо правду, либо неправду. В этом городе кто-то угнал машину у градоначальника. Полиция задержала троих человек: Джона, Джека и Джо. Полиции было известно, что один из них — лжец, один — всегда говорит правду, а про третьего точно неизвестно, говорит ли он правду или ложь. Полиция также знала, что один из них угнал машину, и что этот человек всегда говорит правду. Три человека сказали следующее: Джон: Я не виновен. Джек: Он говорит истинную правду. Джо: Я угнал машину. Кто угнал машину и кто лжец? | Джон сказал: «Я не виновен». По условию задачи два человека являются невиновными: лжец и шутник. Джон не может быть лжецом, так как лжец, в данном случае, сказал бы, что он виновет. Джон не может быть и правдолюбцем, так правдолюбец виновен, и он не сможет сказать неправду. Остается, что Джон шутник, при этом он говорит правду, так как он, действительно невиновен. Джек подтверждает невиновность шутника Джона, т. е. Джек говорит правду, поэтому он не лжец, а правдолюбец, Джек и угнал машину. Джо — лжец и как положено лжецу, он всех обманывает, говоря, что он угнал машину. | |
Такие разные профессии. Джон, Дик и Роджер — цирковые клоуны. Во время отпуска они зарабатывают, как могут — каждый из них владеет двумя профессиями из шести: писатель, трубач, водитель грузовика, игрок в гольф, парикмахер, инженер. Сможете ли вы определить, кто какими профессиями владеет, если: Водитель грузовика ухаживает за сестрой игрока в гольф. Трубач и инженер посещают школу верховой езды вместе с Джоном. Водитель грузовика насмехается над длинными ногами трубача. Дик получил от инженера в подарок коробку шоколадных конфет. Игрок в гольф купил подержанную машину у писателя. Роджер съедает пиццу быстрее, чем Дик и игрок в гольф. | Джон — парикмахер и игрок в гольф; Дик — трубач и писатель; Роджер — водитель и инженер | |
Было у отца три сына — Коля, Сережа и Витек. Старшего назвали Николаем в честь деда, а младший пошел по его стопам и стал композитором. Другой стал математиком и еще один — писателем. Выросли они и разъехались в разные города — Москву, Киев и Смоленск. Известно, что: Вчера отец получил письма: от писателя, Виктора и из Москвы. Математик приглашал Сергея и того, что в Смоленске, на юбилей. Коля собирался как-нибудь съездить в Москву. В Киеве живет не композитор. Кто, где и чем занимается? | Старший — Николай, писатель из Смоленска. Средний — Виктор, математик из Киева. Младший — Сергей, композитор из Москвы. | |
Три гангстера: Известно, что один из трёх знаменитых в Чикаго гангстеров, клички которых Арчи, Босс и Весли, украл портфель с крупной суммой денег. На допросе каждый из них сделал три заявления. Арчи: 1. Я не брал портфель.2. В день кражи я уезжал из Чикаго.3. Портфель украл Весли. Босс: 1. Портфель украл Весли.2. Если б я и взял его, то не сознался бы.3. У меня и так много денег. Весли: 1. Я не брал портфель.2. Я давно ищу хороший портфель.3. Арчи прав, он уезжал из Чикаго. В ходе следствия выяснилось, что у каждого из трёх заявлений два верных, а одно нет. Кто украл портфель? | Ясно, что портфель не мог украсть Арчи, так как в противном случае все три его заявления были бы ложными. Портфель также не мог украсть Весли, так как в противном случае первое его заявление было бы ложным, а остальные два — верными. Но в этом случае все три заявления Арчи оказались бы верными. Значит, портфель украл Босс. Легко убедиться, что это не противоречит условиям задачи: если портфель украл Босс, то у Арчи первые два заявления верные, а третье ложное, у Босса первое заявление ложное, а остальные два верные, а у Весли первое и третье заявления верные, а второе ложное. | |
Практика на предприятии ТОО Bimash помогло мне ознакомиться и изучить Язык Prolog. А также решать логические задания на наиболее высшем уровне, что собственно способствует дальнейшему логическому развитию. В период практики я много узнала о предприятии, о его важных научных направлениях, таких как
• Машинное обучение (Machine Learning)
• Машинный перевод (Machine Translation)
• Обработка и понимание естественного языка (Natural Language processing)
• Представление знаний (Knowledge Representation)
• Получение знаний (Knowledge Acquisition)
• Логическое программирование Такие направления как:
• математическая логика, теория моделей
• формальные грамматики
• теория вероятности и математическая статистика
• теория нечетких множеств
• знание языка ПРОЛОГ
1. Клоксин У., Меллиш К., Программирование на языке
2. Адаменко А., Кучуков А., Логическое программирование и Visual Prolog
3. Братко И., Алгоритмы искусственного интеллекта на языке Prolog=Programming For Artificial Intelligence.
4. История языка Prolog
5. Пашев И., Наибольший общий делитель на Прологе.