Помощь в написании студенческих работ
Антистрессовый сервис

Теоретическая часть и основные понятия

РефератПомощь в написанииУзнать стоимостьмоей работы

Что же касается традиционного высшего образования, данные технологии практически не применяются. Единственным подобным сервисом можно считать онлайн-проект, получивший название «Маяк», анонсированный 30 сентября 2014 года компанией «ВТБ» в рамках программы поддержки инициатив в сфере образования, однако по сей день данный продукт не запущен и записи о нем удалены с официального сайта компании… Читать ещё >

Теоретическая часть и основные понятия (реферат, курсовая, диплом, контрольная)

Образование Образовательный процесс Исходя из определения, представленного в Советской Энциклопедии, «Учебный процесс — система организации учебно-воспитательной деятельности … направлен на достижение целей обучения и воспитания. Определяется учебными планами, учебными программами». (Большая советская энциклопедия, 1969;1978).

Таким образом, можно заключить, что учебный процесс это регламентированный специальными документами комплекс действий, направленный на передачу знаний. Однако, данный регламент не всегда оказывается столь жестким: в последнее время все больше учебных заведений приходят к системе индивидуальных учебных планов, где студент должен сам выбирать некоторые дисциплины из предложенных альтернатив. Таким образом образование перестает становится более индивидуальным, что открывает новые возможности перед студентами: кроме «базовой» части учебного плана студенты могут выбрать те дисциплины, которые позволят им обрести те компетенции, в которых они нуждаются, но данное преимущество имеет место только при условии верного выбора предметов, понимания их сути еще до начала изучения.

Цель студента в процессе образования — стать специалистом, то есть приобрести определенные знания и навыки, компетенции и по итогам проделанной работы занять определенную должность. Для этого необходимо соответствовать определенным требованиям работодателя. Казалось бы, достаточно просто сопоставить требования конкретной вакансии и умения, которыми располагает конкретный человек, но это представляется возможным только «по факту». Студент, выбирая ту или иную дисциплину, не имеет полного представления о том, что она ему даст, какие навыки и знания он приобретет в процессе изучения данного материала. При выборе той или иной дисциплины студенты вынуждены руководствоваться названием курса и учебным планом, который часто не слишком подробный и не описывает состав курса в достаточной мере.

Высшее образование Образование, по мнению Сергея Ивановича Ожегова, это «получение систематизированных знаний и навыков, обучение, просвещение» (Ожегов, 2015).

Как и упоминалось ваше, при получении высшего образования студент рассчитывает овладеть определенными знаниями и умениями, однако образовательные программы в последнее время становятся все более и более гибкими, что с одной стороны позволяет получить более прикладные и нужные по мнению студента компетенции, с другой — вынуждает студента делать выбор, от которого многое зависит, возлагая на него дополнительную ответственность.

Ситуацию в высшем образовании я решил разобрать на примере НИУ ВШЭ, одного из ведущих университетов страны, который использует самые передовые по меркам страны методики обучения.

На каждой образовательной программе в НИУ ВШЭ помимо базового курса, включающего дисциплины, которые посещают все студенты, в программу входят дисциплины по выбору, когда студенту предоставляется блок предметов одной области, состоящий из 2 и более альтернатив, и предлагается выбрать интересующую.

Почему такой выбор настолько важен?

Во-первых, каждая дисциплина отвечает за развитие конкретных компетенций, то есть каждый выбор влияет на итоговый набор компетенций, с которым студент покинет стены высшего учебного заведения и пойдет устраиваться на работу.

Во-вторых, то, насколько тот или иной курс нравится студенту, напрямую влияет на мотивацию студента, а значит и преподавателя, так, если дисциплина не оправдает ожиданий студента, то его мотивация снизится, он будет меньше сил и времени тратить на изучение материалов, может страдать посещаемость, и оценка преподавания, которую студенты обязаны проходить по окончании курса, хоть вины преподавателя в этом и нет. Следовательно, мотивация преподавателя снижается, так как общая заинтересованность в его предмете падает, ввиду того, что нужные студенты не выбрали этот курс, а те, кто выбрал, сделали это «ошибочно».

Однако, что влияет на правильность выбора дисциплины у студента? Как и любое лицо, принимающее решение (ЛПР), студент должен обладать как можно полной информацией о том, что из себя представляет каждая из опций, чтобы оценить полезность и конкурентные преимущества каждой. Информацию о дисциплине студент может найти в программе дисциплины, которая представляет из себя достаточно объемный документ, понимание которого бывает затруднительно. Данный документ не всегда достаточно детально описывает то, что будет изучено в процессе обучения, но главное, для студента оказывается загадкой прикладное значение того или иного предмета, где он может пригодиться, пригодится ли знание этой дисциплины на конкретной должности в конкретной компании.

Таким образом, при выборе курса следует учитывать, как интересы студента, чтобы мотивировать его к обучению, так и практическую пользу, которую данный студент получит, сделав этот выбор (Wang, 2008). Для решения таких задач отлично подходит технология индексации информации, чтобы стало возможным ранжировать выдачу для пользователя, осуществлять фильтрацию, сравнивать результаты и составлять рекомендации. Подробнее это будет рассмотрено во второй главе.

Массовые открытые онлайн-курсы Массовый открытый онлайн-курс (МООК) — обучающий курс с массовым интерактивным участием c применением технологий электронного обучения и открытым доступом через Интернет, одна из форм дистанционного образования.

Образовательный процесс на таких платформах проходит с использованием видеоматериалов (запись лекций), презентаций, аудиоматериалов и интерактивных заданий для закрепления пройденного материала.

Отличительной особенностью МООК является доступ к интерактивным форумам, где можно общаться с другими студентами, обмениваться опытом, задавать вопросы экспертам, преподавателям, проверка заданий выполняется системой и, порой, другими студентами, если задание предполагает открытый развернутый ответ (McAuley, 2010).

История массовых открытых онлайн-курсов берет свое начало в конце 1990;х годов, когда на специальных порталах стали записи лекций разных учебных. Однако данное явление предполагало только потребление контента, отсутствовала система контроля знаний, сертификация, были популярны форумы, где велось обсуждение различных тем и можно было проконсультироваться со знающими людьми, однако они были не систематизированы и нельзя было быть уверенным, что данный человек является специалистом. Все эти проблемы были решены с приходом и развитием МООК.

Массовые открытые онлайн-курсы получили распространение и завоевали популярность только середине 2010;х годов, так как дали возможность удобного общения студентов и преподавателей, а также дистанционной сдачи экзаменов и получения сертификата о прохождении курса. Подобные сайты подойдут всем: от начинающих, желающих ознакомиться с предметом и понять, насколько это им интересно, до специалистов, стремящихся расширить свои познания, освежить знания, применить на практике, получить сертификат. Немаловажно, что большинство курсов на подобных платформах доступны совершенно бесплатно или за несравнимо с традиционными курсами низкую цену.

Основной проблемой МООК считается то, что они не пользуются большим доверием, так как из-за того, что отсутствует очная форма обучения и сдача экзаменов, есть вероятность фальсификации, например, за студента может сдать экзамен его преподаватель, ему могут подсказывать, от может пользоваться литературой или материалами. В связи с этим можно сделать вывод, что данный вид образования рассчитан на самообразование, когда студент в первую очередь заинтересован в получении знаний и умений, а не документа или оценки.

В итоге, массовые открытые онлайн-курсы являются прекрасным способом получения дополнительного образования в дополнение к основному образованию или во время его получения, так как МООК являются дешевой, но очень качественной альтернативой традиционным (очным) курсам, где студент должен лично являться в определенное место в определенное время. В то же время они не могут в полной мере заменить образование, так как сертификаты МООК не пользуются высоким доверием в профессиональной среде.

Наем сотрудников Процесс Цель найма персонала — нахождение соответствия между профессиональными и личными характеристиками кандидата и критериями к вакантной должности.

Обычно наем персонала проходит в 9 этапов (Наем персонала: методы и технологии, 2017):

  • 1. Определение потребности компании в работниках в конкретный промежуток времени;
  • 2. Оформление заявки на поиск кадров, формирование перечня требований к кандидату, основываясь на текущей ситуации на рынке труда;
  • 3. Создание объявления о вакансии;
  • 4. Составление списка инструментов для поиска кадров (каналы распространения, поиск в конкретных организациях, сообществах и т. д.);
  • 5. Публикация вакансии;
  • 6. Анализ заявок и первичный отбор кандидатов;
  • 7. Поиск максимально подходящего кандидата, проведение специализированных мероприятий (собеседования, испытания, тестирование);
  • 8. Решение о найме кандидата, предложение условий;
  • 9. Адаптация сотрудника в коллективе и на производстве.

Важно заметить, что компания имеет влияние на данный процесс на всем его протяжении, хоть и в разной мере, однако она не может повлиять на уровень подготовки соискателей, ей приходится работать «с тем, что есть».

Такое положение дел связано с тем, что соискатели получают доступ к информации о требованиях только на шестом этапе, то есть после публикации вакансии, в которой описано, какие компетенции необходимы, чтобы занять конкретную должность.

Наем неподготовленных кадров невыгоден для компании, так как, чтобы получить работника нужной квалификации, компания должна потратить средства, время и ресурсы на переобучение сотрудника. Нужно понимать, что практически любая нетривиальная должность требует обучение кадров, однако речь тут идет о нюансах, а не о масштабном переобучении. Однако, порой компании вынуждены обучать сотрудников практически с нуля тому, что они могли освоить в процессе получения образования, но сделали неверный выбор или не уделили должного внимания.

В то же время сотрудник во время обучения получает только часть заработной платы, которая соответствует позиции, или же не получает ее вообще, работая на условиях неоплачиваемой стажировки. Более того, соискатель тратит больше времени на поиск работы из-за неполного соответствия требованиям работодателя, а, найдя работу, тратит на обучение время, которое мог бы работать или тратить по собственному усмотрению.

В результате всего вышесказанного в данном разделе делаем вывод, что ситуация, когда кандидат максимально удовлетворяет требованиям работодателя выгодна для обеих сторон, все экономят время, ресурсы и средства. Однако такая ситуация возможна только если студент будет располагать информациях о требованиях к кандидату на должность как можно раньше, чтобы подготовиться как можно лучше и потратить минимум ресурсов на подготовку и обучение после трудоустройства. И на сегодняшний день не существует сервиса, который бы помог решить данную проблему.

Сайты по поиску работы и проблемы сбора информации На сегодняшний день самым популярным инструментом для поиска кадров являются рекрутинговые порталы, такие как «hh.ru» и «superjob.ru». широкое распространение они получили из-за того, что для пользователей они совершенно бесплатны, что обеспечивает большую аудиторию, позволяющую найти нужных сотрудников в кратчайшие сроки. Ко всему прочему сервис очень удобен и понятен, как соискателям, так и работодателям.

История поиска кадров через интернет в России началась в конце 1990;х годов, однако в то время резюме находились в свободном доступе, что затрудняло поиск высококвалифицированных кадров, редких специалистов. Ситуация резко изменилась после запуска проекта «National Job Club», который в 2003 году был переименован в «HeadHunter», данный сервис зарабатывает не на рекламе, а на том, что дает работодателям доступ к базам резюме за деньги. На данный момент на сайте размещено более 5 млн резюме и более 132 тыс. вакансий.

Таким образом, если нам нужна какая-либо статистика или информация об имеющихся на рынке вакансиях, то подобные порталы могут быть отличным источником информации, однако не все так просто: из-за большой популярности таких порталов модерация является сложной задачей, что, в свою очередь, приводит к снижению качества и достоверности информации. В базе имеют место повторы вакансий, которые работодатель делает, чтобы привлечь больше внимания к вакансии, а сбор данных осложнён тем, что процент метаданных в вакансии невелик.

Главная проблема сбора информации с сайтов поиска работы состоит в том, что информация там не формализована, поля заполняются в свободной форме, а, значит, не могут служить метаданными без первичной обработки. Для того, чтобы выяснить слабые места, я попробовал собрать данные с одного из сайтов резюме.

Осуществить поиск по области деятельности, уровню заработной платы или опыту работы достаточно просто, это позволяет сделать функционал сайта, так как данные поля заполняются значениями из фиксированного списка, таким образом исчезает вероятность ошибки или неверного распознания. Однако, при попытке поиска вакансий по ключевым словам возникают сложности: при поиске по запросу «C#» в выдачу попадают как резюме, где знание данного языка программирования является обязательным условием, так и те, где «знание C# не требуется». Более того, система не распознает такие не все синонимичные понятия и сокращения, например, «MS Office» и «Microsoft office» и «офисный пакет Microsoft».

Если перейти в профиль какой-либо компании, то можно заметить, что большинство из них дублирует вакансии, чтобы привлечь к себе больше внимания и чаще появляться в выдаче. При добавлении такой информации в рекомендательную систему, быстродействие и точность будет снижаться, а значит эффективность самой программы значительно пострадает. Вдобавок ко всему сказанному, нужно отметить, что студента, как правило, интересует не конкретная позиция в конкретной компании, а сфера деятельности, так как вакансии обновляются слишком часто, чтобы в течение всего обучения готовиться на определенное место конкретной компании, так как вакансии быстро закрываются, а требования и условия изменяются.

Из всего вышесказанного в данном разделе можно сделать вывод, о том, что рекрутинговые порталы являются отличным инструментом, однако только для личного пользования или под управлением пользователя, данные на порталах не формализованы: нет единой структуры и правил, в соответствии с которыми информацию можно было бы обрабатывать в автоматическом режиме, как вывод — данные базы не могут служить источниками информации для информационных и рекомендательных систем без предварительной обработки.

Методы монетизации интернет-проектов Создание и поддержание работы интернет-проектов связано с крупными тратами, так как для функционирования сервиса ему нужны модераторы, специалисты, занимающиеся безопасностью, администраторы, поддержка или аренда серверов, продвижение. Тем не менее большинство интернет проектов не являются убыточными, а наоборот приносят прибыль. Для этого сервис нужно монетизировать, то есть адаптировать для получения доходов от его функционирования. Существует ряд основных методов монетизации интернет-проектов:

1. Подписка. Оплата услуг в данном случае производится раз в определенный период времени.

a. Преимущества:

i. Позволяет разбить большой платеж на малые, больше пользователей могут себе позволить пользование сервисом;

ii. Постоянный источник дохода, так как платят не только новые пользователи, но и старые, упрощает процесс финансового планирования проекта.

b. Недостатки:

i. Возможность отписки пользователя;

ii. Если отсутствует бесплатный период, то не все готовы платить сразу.

2. Расширенная подписка (Freemium). Данная модель подразумевает свободный доступ к сервису с ограниченным функционалом, однако полный функционал доступен только за определенную плату.

a. Преимущества:

i. Любой пользователь может позволить себе использование сервиса.

b. Недостатки:

i. Малое количество пользователей переходят на платную подписку;

ii. Необходимость сегментировать услуги таким образом, чтобы бесплатное использование было привлекательным, но переход на платную подписку приносил ощутимую пользу клиенту.

3. Разовая покупка. Модель, применяемая в торговле, когда пользователь оплачивает конкретный товар или разовую услугу.

a. Преимущества:

i. Пользователю просто оценить траты на сервис, так как оплата единоразовая;

ii. После того, как пользователь оплатил сервис, он не может отказаться от покупки, то есть сервису не нужно слишком беспокоиться о лояльности пользователей.

b. Недостатки:

i. Большой размер разового платежа, невозможность разбить его на малые, что приводит к тому, что меньший процент пользователей может себе позволить использование сервиса;

ii. Низкая мотивация развивать сервис.

4. Продажа виртуальных товаров. Этот метод широко используется в онлайн-играх и социальных сетях, например, оружие в играх или подарки в социальных сетях.

a. Преимущества:

i. Отсутствие трат на производство самого «товара», только на первый экземпляр.

b. Недостатки:

i. Данную модель сложно адаптировать для сферы бизнеса, целью которой является реальная прибыль.

5. Получение комиссии с продаж. Широко применятся сайтами-посредниками, которые получают комиссию за «лиды» (переходы по ссылке) или за продажи перешедшим клиентам.

a. Преимущества:

i. Нет нужды в производстве товара или оказании услуги;

ii. Получение прибыли на существующем крупном рынке.

b. Недостатки:

i. Высокая конкуренция;

ii. Низкая комиссия.

6. Контекстная реклама. Добавление рекламных баннеров является самым популярным способом монетизации интернет-проектов, сайт получает деньги за показы рекламы и клики по ней.

a. Преимущества:

i. Позволяет сделать сервис бесплатным, так как платят компании, размещающие рекламу;

b. Недостатки:

i. Сложность продаж рекламных мест, высокая конкуренция;

ii. Сервисы и сайты не всех тематик интересны для рекламодателей;

iii. Большая часть полезного пространства страницы должна быть выделена под рекламу.

7. Партнерские программы. Модель, при которой средства идут от заключения партнерских договоров с другими проектами и площадками, а оплата осуществляется за переходы и подписание.

a. Преимущества:

i. Конкуренция ниже, чем на рынке контекстной рекламы;

ii. Получение прибыли за подписание в независимости от продаж и переходов.

b. Недостатки:

i. Доход напрямую зависит от аудитории, которая не склонна доверять контекстной рекламе;

ii. Часть пользователей может перейти к партнеру.

8. Офферы (плата за сбор информации). Многие сервисы опросов и изучения общественного мнения готовы платить за заполнение анкет и прохождение опросов.

a. Преимущества:

i. Пользователи остаются на сервисе;

b. Недостатки:

i. Необходимость мотивировать пользователей на прохождение данных опросов и заполнение анкет;

9. Product placement. При использовании данной модели рекламодатели платят за упоминание бренда в контенте сайта.

a. Преимущества:

i. Цена размещения намного выше, чем в контекстной рекламе.

b. Недостатки:

i. Высокая конкуренция;

ii. Внимание пользователя рассеивается и фокус смещается с самого сервиса.

10. Оплата за продвижение. Модель предполагает покупку пользователями высоких позиций в выдаче, реклама пользователей.

a. Преимущества:

i. Дает пользователям возможность добиться нужных результатов за дополнительную плату;

b. Недостатки:

i. Изменение правил сортировки;

ii. «Несправедливость» выдачи снижает мотивацию остальных пользователей.

11. Продажа виртуальной валюты. Взимается плата за получение специальных «баллов», которые впоследствии могут быть потрачены внутри сервиса.

a. Преимущества:

i. Пользователи после покупки валюты не могут вернуть деньги, что означает, что вся сумма будет потрачена на сервисе;

ii. Сервис получает средства пользователя до приобретения товара или услуги.

b. Недостатки:

i. У пользователя накапливается остаток неиспользованной валюты, который нельзя потратить в силу его малого размера;

12. Добровольные пожертвования. Модель монетизации, при которой ставка делается на пожертвования, которые делают желающие из числа пользователей и гостей сайта (сервиса).

a. Преимущества:

i. Простой процесс установки на сайт.

b. Недостатки:

i. Нерегулярность пожертвований, что усложняет процесс финансового планирования;

ii. Малое количество пожертвований, для достаточного их количества нужна обширная база пользователей.

В реальности же интернет-проекты, как правило, комбинируют модели монетизации, чтобы достичь максимального размера прибыли и охватить как можно более широкую группу пользователей, заказчиков, партнёров и рекламодателей. Очень важно задействовать правильное количество источников дохода, так как при их недостатке проект может быть убыточным и нецелесообразным, а при их переизбытке фокус может быть смещен с оказания качественных услуг на привлечение прибыли, что негативно скажется на лояльности пользователей.

Рекомендательные системы Понятие рекомендательной системы Рекомендательная система — программа, созданная для прогнозирования предпочтений пользователя, на основе имеющейся информации о прошлых действиях и особенностях, как данного, так и других пользователей (Ting-Peng Liang, 2006/2007).

Активный пользователь — человек, делающий запрос в рекомендательной системе, лицо, прогнозированием действий которого занимается система.

Подобные системы помогают пользователю в принятии решений, предлагая варианты, которые бы его заинтересовали. Основным отличием от поисковых систем является то, что выдача осуществляется не только на основе поиска по содержанию, но и учитывает поведение пользователей в прошлом. Таким образом, предложения системы более близки пользователю, так как основываются на привычной ему логике, что отменяет необходимость отбирать результаты, как после обычного поиска.

Широкое применение данная технология нашла в потоковых сервисах и Интернет-торговле: практически в каждом музыкальном сервисе (Яндекс.Музыка, Spotify, Last. fm), онлайн-кинотеатре (Netflix, Ivi, Кинопоиск), социальной сети (Вконтакте, Facebook) используются рекомендательные технологии, которые советуют пользователю контент, который ему интересен, что приводит к тому, что она остается на сайте или в приложении. Все крупные интернет-магазины рекомендуют покупателю товары, которые бы могли его заинтересовать, основываясь на том, что он покупал ранее и какие товары просматривал.

Обе стороны получают выгоду от внедрения подобных алгоритмов, так как компания (сайт, сервис) удерживает покупателя (пользователя), толкает его на новые покупки или продление подписки, в то время как пользователю становится проще и удобнее выбирать из многообразия опций.

Очень важным условием корректной работы рекомендательной системы является наличие обратной связи от пользователей. То есть после потребления какого-либо контента или товара пользователь должен оставить свою оценку, чтобы система понимала, стоит ли рекомендовать ему подобные варианты в будущем.

Говоря о потоковых сервисах и онлайн-кинотеатрах, это легко представить, там можно предложить пользователю оценить контент после потребления, учесть количество, частоту и продолжительность прослушивания или просмотра и, основываясь на этих данных, сделать вывод о том, насколько ему интересен данный тип контента. Если же мы рассматриваем интернет-магазин, то ситуация тут намного сложнее, только малая часть пользователей оставляет отзывы о товарах после их использования. Более того, мы не так часто совершаем покупки, как смотрим фильмы или слушаем музыку. Мы, как правило, не покупаем повседневные товары через рекомендательные системы, а совершаем разовые покупки, приобретая товары для длительного использования. Таким образом, очень важно замотивировать пользователя оставлять оценки и отзывы, чтобы лучше понимать образ его мышления, давать более точные рекомендации.

Рекомендательные системы можно отнести к классу самообучающихся систем, так как по мере пополнения базы действий пользователя, алгоритм начинает работать точнее, так как учитывает поведение большего количества людей. С этим же связана одна из самых серьезных проблем при создании и запуске рекомендательной системы — проблема «холодного старта».

Проблемой холодного старта называют начальный этап работы системы, когда она еще не содержит достаточного количества информации, чтобы строить точные прогнозы действий и предпочтений пользователя. Подробнее данный алгоритм будет описан ниже.

Помимо рекомендательных систем в виде надстроек на сайтах существуют рекомендательные сервисы, которые отличаются очень широким профилем. Ярким примером таких сервисов был «imhonet.ru». Он представлял из себя подобие социальной сети, где пользователи могли подобрать себе практически что угодно: музыку, фильмы, телешоу, книги, игры и многое другое. Оставляя свою оценку под тем или иным объектом, пользователи выражали свое мнение о нем, и система предлагала пользователям варианты, которые понравились людям со схожими предпочтениями, то есть данный портал специализировался на данной работе, однако 28 апреля 2017 года проект был закрыт из-за поглощения другой компанией, которая стала владельцем его алгоритмов и технологий.

Можно сказать, что большинство рекомендательных систем основаны на схожих принципах, то есть они сравнивают пользователей или опции между собой, однако в основе дачи рекомендаций лежат разные принципы.

По мнению специалистов (Huang, 2012) признаками качественного рекомендательного сервиса являются:

  • · Стабильность работы;
  • · Приятный, удобный интерфейс;
  • · Эффективность рекомендаций;
  • · Удовлетворение полученными данными.

История История практического использования рекомендательных систем начинается в начале 1990;х годов, когда было впервые введено понятие «коллаборативная фильтрация», метод фильтрации, который и по сей день является самым популярным. В 1992 году Дэвидом описал его в статье «Using collaborative filtering to weave an information tapestry». «Эффективность процесса фильтрации информации повышается, если в него вовлечены люди» — главный тезис, на котором основана данная система. Его разработка, программа «Tapestry», осуществляла фильтрацию входящей почты, что стало своего рода прародителем рекомендательных систем.

После изучения и развития данной технологии ее стали применять в коммерческих целях: интернет-магазины, реклама, социальные сети, на сегодняшний день технологии формирования рекомендаций в той или иной степени используются практически на всех крупных сайтах, порталах, в социальных сетях, онлайн-кинотеатрах, хостингах и т. д.

В образовательной сфере рекомендательные системы используются на сайтах массовых открытых онлайн-курсов, чтобы предлагать студентам курсы на подобие тех, что им понравились, составлять почтовые рассылки.

Что же касается традиционного высшего образования, данные технологии практически не применяются. Единственным подобным сервисом можно считать онлайн-проект, получивший название «Маяк», анонсированный 30 сентября 2014 года компанией «ВТБ» в рамках программы поддержки инициатив в сфере образования, однако по сей день данный продукт не запущен и записи о нем удалены с официального сайта компании. В то же время, данный сервис не является полноценным аналогом системы, которая используется на сайтах открытых университетов (Courseera и Интуит): «Маяк» можно назвать сервисом для профориентации, то есть предназначен он для выпускников, помогая выбрать будущую сферу деятельности, учитывая то, что студент уже умеет делать, он не дает рекомендаций по развитию, а просто соотносит компетенции соискателя и требования работодателя. Принцип работы рекомендательных систем в сфере образования только отдаленно напоминает принцип работы этих систем в других сферах. Применение существующих методов составления рекомендаций, используемых, например, в интернет-магазинах, не видится возможным в образовательной среде ввиду ее специфики. К примеру, выбор курса обязателен и должен быть сделан в строго определенный период времени, такую строгость сложно представить, например, в интернет-магазине.

Классификация и принцип действия методов фильтрации Рекомендательные системы преимущественно используют два основных принципа формирования рекомендаций: фильтрация на основе содержания и коллаборативная фильтрация. Ниже приведена схема, иллюстрирующая данное разделение:

Рисунок 1. Классификация рекомендательных систем Рассмотрим все эти типы более детально, чтобы понять преимущества и недостатки каждого из них.

Первый способ — фильтрация на основе содержания. Например, при подборе книги для пользователя можно проанализировать текст аннотации и составить список ключевых слов. То есть, данный тип заключается в анализе сути и состава каждой из опций, к примеру, в некоторых музыкальных рекомендательных сервисах анализируются слова песен, скорость музыки, даже цвет обложки. На основе данной проверки каждая дорожка, сборник или исполнитель получает определенные метаданные, которые помогают отбирать при помощи фильтров только самые релевантные варианты из всего их многообразия. Книги могут фильтроваться по жанру, автору или издательству.

Второй способ фильтрации — коллаборативная фильтрация. Данный метод заключается в анализе поведения пользователей в прошлом, то есть сделанные в прошлом выборы и их оценка. Содержание вариантов уходит на второй план, система занимается поиском схожих пользователей или опций, чтобы отследить закономерности и предугадать поведение активного пользователя. Подтипы коллаборативной фильтрации отличаются логикой, на основе которой позициям присуждается «рейтинг привлекательности», на основе которого осуществляется ранжирование при выдаче.

Коллаборативная фильтрация на основе моделей представляет из себя комплекс математических формул, описывающих поведение пользователя и способных предсказать вероятность выполнения того или иного действия активным пользователем. Данный метод является достаточно точным, однако требует вычисления различных коэффициентов (вероятности, корреляция и так далее), которые на начальном этапе, когда информации не слишком много достаточно сложно рассчитать. Таким образом данный тип является достаточно точным, но требовательным к вычислительным мощностям и объему и качеству данных.

Тип коллаборативной фильтрации «на основе соседства» опирается на тезис что пользователи, одинаково оценивавшие что-либо в прошлом, склонны схожим образом мыслить и в будущем. Данный тип является, по моему мнению, самым понятным для рядовых пользователей, потому что все знают, что такое «вкус» и предпочтения и что они не так часто меняются.

Алгоритм работы данного метода фильтрации:

  • 1. Присвоение каждому пользователю значения исходя из похожести с активным пользователем;
  • 2. Отобрать определенное количество самых похожих пользователей;
  • 3. Рассчитать вероятность совершения выбора каждой позиции активным пользователем.

Преимуществом данного типа фильтрации является то, что для начала работы необходим минимум информации, однако точность рекомендаций достаточно высока. К недостаткам данного типа можно отнести «проблему переобучения», ситуацию, когда база данных действий пользователей настолько велика, что на обработку запроса уходит слишком много времени, но эта проблема легко решается ограничением количества строк в базе, например, по сроку давности, чтобы обрабатывались только свежие данные, учитывающие последние изменения во внешней среде. В то же время данный тип фильтрации является поверхностным, уступает по точности коллаборативной фильтрации на основе модели, так как не способен обнаружить латентные факторы, влияющие на выбор пользователя.

Традиционные типы фильтрации существуют в большинстве своем только на бумаге в виде теории, на практике в основном используются гибридные типы различного рода, сочетающие в себе преимущества традиционных, чтобы устранить их недостатки. Например, как было описано выше, фильтрация по содержанию отлично подходит для первичной оценки пользователя, когда в системе еще нет информации о его предпочтениях, в то время как коллаборативная фильтрация эффективнее на поздних этапах, так как намного точнее предсказывает предпочтения пользователя.

Получается, что у коллаборативной фильтрации, как целого «семейства» подтипов, есть одна особенность, которая с одной стороны делает его очень эффективным, а с другой создает некоторые сложности для пользователя и разработчика. Данный тип фильтрации невозможно реализовать без обратной связи от пользователей, так как их оценки — основа расчетов рейтинга для выдачи пользователю. При достаточном количестве оценок данный тип фильтрации очень эффективен и точен, однако при недостатке или переизбытке оценок могут возникать проблемы. Следовательно, использование данного метода подразумевает мотивацию пользователя оставлять обратную связь, например, интернет-магазины часто предлагают скидку на следующую покупку, а массовые открытые онлайн-курсы делают почтовую рассылку с просьбой оценить курс, результаты этих оценок в том числе используются и для совершенствования работы рекомендательного сервиса.

Лучшие практики На сегодняшний день рекомендательные системы широко применяются в Интернет-торговле, покупателям предлагаются товары, которые могли бы быть ему интересны или которые бы дополнили совершенную покупку. Именно поэтому лидерами в разработке алгоритмов являются именно компании, занимающиеся розничной торговлей, так как для них это прямой источник прибыли.

Самыми успешными алгоритмами считается запатентованный алгоритм компании Amazon. Данный метод называется «Item-to-item». Он оценивает, насколько товары похожи, вычисляя косинус между векторами покупок в матрице покупателей и товаров. Он рассчитывается как разность произведений двух векторов и их норм. Получившийся результат тем выше, чем ближе эти предметы для покупателя. Данный метод является собственностью компании и защищен от копирования. Особенностью данного метода является то, что в вычислениях учитывается только сам факт покупки или выбора, но не учитывается обратная связь, впечатление пользователя от покупки, то есть система порекомендует тот же вариант следующему пользователю, даже если предыдущему он не пришелся по вкусу. Этот принцип используется компанией в расчете на то, что пользователи очень редко оставляют отзывы, к тому же их можно перевести в рейтинг и показывать его рядом с товаром.

Другим эффективным и, как следствие, популярным алгоритмом является коллаборативная оценка Slope one для предметов с оценками. Суть метода в следующем: на основе матрицы покупателей и товаров для каждой пары «товар-товар» вычисляется на основе оценок всех пользователей средняя разница оценок, например, «товар 1 в среднем оценивается на 2 балла выше, чем товар 2», после этого значения умножаются на коэффициенты, равные количеству проголосовавших и их сумма делится на сумму коэффициентов. Таким образом, данная система учитывает «похожесть» пользователей, сравнивая то, как они оценивали одни и те же товары в прошлом и на основе уже данных товару оценок предсказывает, придется ли по вкусу данная опция активному пользователю. Данный подход тоже не лишен изъянов: во-первых, небинарное оценивание сложно для пользователя, ему проще поставить «мне нравится» или «мне не нравится», во-вторых, подобные вычисления пагубно сказываются на быстродействии системы, так как перед выдачей результатов она «прогоняет» все имеющиеся результаты через формулу и сравнивает результаты.

Из вышесказанного можно сделать вывод, что даже лучшие из существующих практик не лишены изъянов, что для каждого конкретного случая подходит определенный алгоритм, который не должен быть традиционным, а должен быть разработан специально под нужды конкретного проекта, учитывая его особенности и цели внедрения рекомендательной системы.

Показать весь текст
Заполнить форму текущей работой